tÖbbszÖrÖs regressziÓs szÁmÍtÁsok ii

54
TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ

Upload: armand-gutierrez

Post on 03-Jan-2016

22 views

Category:

Documents


2 download

DESCRIPTION

TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II. TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ. A többszörös elemzés a klinikai orvostudományban, egy példa. Volpato, S et al: Cardiovascular Disease, Interleukin-6 and Risk of Mortality in Older Women. The Women’s Health and Aging Study. Circulation, 103, 947, 2001 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ

Page 2: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A többszörös elemzés a klinikai

orvostudományban, egy példa Volpato, S et al: Cardiovascular Disease,

Interleukin-6 and Risk of Mortality in Older Women. The Women’s Health and Aging Study. Circulation, 103, 947, 2001

620 >65 éves nő, anamnézis, orvosi vizsgálat, vérvétel, különböző gyulladásos markerek meghatározása: IL-6, CRP, albumin

3 éves követés (PROSPEKTÍV VIZSGÁLAT), a halálozás és ennek okának regisztrálása

Page 3: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Az alap szérum IL-6 szint és a 3 éves mortalitás

IL-6 szint,pg/ml

<1.78 1.79-3.10 >3.10

Meghalt(%)

17 (8) 24 (12) 54 (27)

Túlé lt 197 180 148

Össze-sen

214 204 202

Page 4: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A különböző IL-6 szérumszintű betegek demográfiai és egészségügyi jellemzői

IL-6 s zint,pg/ml

<1.78 1.79-3.10 >3.10 p (trend)

>20000 USDévi jöv., %

25.2 17.6 18.3 <0.05

dohányzik, % 12.3 29.7 33.8 <0.001

BMI kg/m2 27.6 0.4 29.1 + 0.5 29.8 + 0.5 <0.001

CHD, % 23.4 38.7 39.6 <0.001

Diabetes , % 10.3 17.7 23.8 <0.001

atheros c l.index

1.04 + 0.02 0.99 + 0.01 0.94 + 0.02 <0.001

Page 5: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Kérdés

• Mennyivel nagyobb kockázatuk (relatív rizikó) a magas IL-6 szintű egyéneknek a közepes és az alacsony IL-6 szintű egyénekhez viszonyítva arra, hogy 3 éven belül meghaljanak?

• Prospektív vizsgálat, RR számolható.

Page 6: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

• A feladat az, hogy matematikai módszerekkel kiküszöböljük az egyéb tényezőket, amelyek a három IL-6 szintű csoportban különböznek és így adjunk választ a fenti kérdésre

• Ebből a célból különböző modelleket építünk fel, és a logisztikus regresszió módszerével végezzük el a számítást.

Page 7: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A 3 éves mortalitás nyers és adjusztált relatív rizikója (95% CI) az IL-6 szérumszint szerint

1. modelcs ak IL-6

2. model IL-IL-6, kor,dohányzás ,BMI

3.modelIL-6, kor,dohányzás ,BMI, CHD,diabetes ,carotisvas tags ág

Alacs onyIL-6 s zint

1 1 1

KözepesIL-6 s zint

1,51(0.81-2.81)

1.32 (0.70-2.47)

1.08 (0.57-3.04)

MagasIL-6 s zint

3.83 (2.22-6.62)

3.54 (2.03-6.17)

2.63 (1.48-4.96)

Page 8: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Kiechl, S. et al.: Chronic Infections and the Risk of Carotid Atherosclerosis. Circulation, 103,

1064, 2001

• Bruneck tanulmány: 1990, 826 40-79 éves egyén, carotis duplex scan: carotis atherosclerosis foka, plakkok száma).

• A vizsgált egyéneknél rögzítették, hogy szenvednek-e valamilyen krónikus légúti, húgyúti, fogászati vagy egyéb infekcióban.

• A vizsgált egyének vérében megmértek egyes a krónikus infekcióra jellemző laboratóriumi markereket)

Page 9: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

KÉRDÉSEK

• 1) VAN-E ÖSSZEFÜGGÉS A KRÓNIKUS FERTŐZÉSEK KLINIKAI ÉS LABORATÓRIUMI JELEI ÉS A CAROTIS ATHEROSCLEROSIS MÉRTÉKE KÖZÖTT A VIZSGÁLAT IDŐPONTJÁBAN (keresztmetszeti vizsgálat)2) VAN-E ÖSSZEFÜGGÉS A KRÓNIKUS FERTŐZÉSEK KLINIKAI ÉS LABORATÓRIUMI JELEI ÉS AZ ÚJ CAROTIS PLAKKOK KIFEJLŐDÉSE KÖZÖTT (prospektív vizsgálat)

• Számítás módja: többszörös lépcsőzetes logisztikus regressziós analízis

Page 10: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

500 egyénben a kezdeti vizsgálatkor nem találtak carotis plakkot, közülük 125-ben fejlődött ki carotis plakk az 5 éves megfigyelési idő alatt. Mi jelezte ezt előre? OR: kategorikus:

igen/nem, folyamatos: 1 SD növekedés

Változó Sorrend(s tepwis eregres s ion)

OR (95% CI) p érték

Krónikusinfekció

1. 4.10 (2.37-7.10)

<0.0001

Ferritin 2. 1.45 (1.13-1.87)

0.005

Magasvérnyomás

3. 2.01 (1.19-3.42)

0.011

LDLkoles zterin

4. 1.51 (1.18-1.93)

<0.001

Életkor 5. 1.39 (1.08-1.78)

0.010

Alkohol (1-50 g /nap vsabs ztinens )

6. 0.55 (0.32-0.99

0.042

Hypo-thyreos is

7. 2.31 (1.00-5.45

0.050

Micro-albuminuria

8. 1.25 (0.99-1.60)

0.075

HDLkoles zterin

9. 0.81 (0.64-1.02)

0.081

Page 11: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Tsobuno Y et al. Green Tea and the Risk of Gastric Cancer in Japan. NEJM 344, 632, 2001.

• 1984, 26311 > 40 éves Miyagi tartomány, kérdőív: zöldtea fogyasztás mértéke

• Követési idő: 1999 748 személy-év 1982 dec.-ig. 419 gyomorrák, diagnózis időpontja

• Kérdés: befolyásolja-e a zöldtea fogyasztás a gyomorrák kifejlődésének az esélyét?

• Számítás: Cox regressiós analízis, reletív rizikó (prospektív vizsgálat): alap: <1 csésze/nap. A gyomorrák kimenetelét esetleg még befolyásoló változók (confounding variables): életkor, nem, ulcus az anamnézisban, dohányzás, alkohol, rizs, hús/zöldség fogyasztás

Page 12: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A zöldtea fogyasztás és a gyomorrák kifejlődésének relatív rizikója

Változó Zöldtea fogyas ztás , c s és ze /nap P fortrend

<1 1 vagy 2 3 vagy 4 >5

Gyomor-rák

41 49 55 151

Köv. idős zemély-év

36572 34129 43748 85299

Életkoradj. RR

1.0 1.1 (0.8-1.6))

1.0 (0.7-1.4)

1.3 (1.0-1.7)

0.05

Többvál-tozósRR1(mindenes et)

1.0 1.1 (0.8-1.6))

1.0 (0.7-1.4)

1.2 (0.8-1.6)

0.13

Többvál-tozósRR2(e ls ő 3 évki-hagyva)

1.0 1.2 (0.8-1.8))

1.0 (0.7-1.4)

1.4 (1.0-1.9)

0.07

Page 13: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Kimenetel (függő változó)

Példa a kimenetelre

A használandó többszörös analitikai módszer

Folyamatos Vérnyomás, testsúly, hőmérséklet

Többszörös lineáris regresszió

Dichotóm (igen-nem)

Halál, rák, felvétel intenzív osztályra

Többszörös logisztikus regresszió

Az igen eseményig eltelt idő

A halálig, a rák dg-ig eltelt idó

Cox regresszió (proportinal hazard analízis)

Page 14: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A többszörös modellek feltételezései

(assumptions) TÖBBSZÖRÖS LINEÁRIS

TÖBBSZÖRÖS LOGISZTIKUS

PROPRCIONÁLIS HAZARD ANALÍZIS

MIT MODELLEZÜNK? A függő változó átlaga A függő változó egyik értéke bekövetkezése esélyének (odds) temészetes logaritmusa (logit)

A relativ kockázat (hazard)

logaritmusa

A FOLYAMATOS FÜGGETLEN VÁLTOZÓK VISZONYA A FÜGGŐHÖZ (KIMENETELHEZ)

A függő változó átlaga lineárisan változhat több független változóval is

A függő változó logitja lineárisan változhat több független áltozóval is

A relatív hazard logaritmusa lineárisan változhat több független áltozóval is

A SKALARIS FÜGGETLEN VÁLTOZÓK VISZONYA A FÜGGŐHÖZ (KIMENETELHEZ)

A függő változó átlaga lineárisan változhat több független változó egységnyi változásával is

A függő változó logitja lineárisan változhat több független változó egységnyi változásával is

A relatív hazard logaritmusa lineárisan változhat több független változó egységnyi változásával is

A FÜGGŐ VÁLTOZÓ ELOSZLÁSA

Normális Binomiális Nincs meghatározva

Page 15: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Többszörös logisztikus regresszió

• Számszerűen (odds ratio formájában) fejezi ki az összefüggést egy független változó és egy dichotóm (beteg/nem beteg, férfi/nő, magas/nem magas, stb) függő változó között úgy, hogy ezt az összefüggést a többi független változóhoz illeszti (adjusted) tehát matamatikai módszerekkel a többi független változó hatását kiküszöböli. A cél általában a predikció.

Page 16: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Relatív rizikó (relative risk) , esély-arány (odds ratio)

• Példa: Az AIDS definiciójának megfelelő opportunista infekciók vagy tumorok előfordulása (továbbiakban röviden és helytelenül AIDS) előrehaladott HIV betegségben szenvedő betegekben. A betegeket folyamatosan két reverz transzkriptáz gátló szerrel kezelték, és két csoportra randomizálták. Az egyik csoport egy proteáz inhibitort (Ritonavir) is kapott, a másik csak placebot az alapkezelés mellett. 16 hétig regisztrálták az AIDS definiciójának megfelelő opportunista infekciók vagy tumorok előfordulását. (Cameron et al. Lancet 351, 543, 1998)

Page 17: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

AIDS igen AIDS nem Ös s zes en

Ritonavir 119 (A) 424 (B) 543 (A+B)

Placebo 205 (C 342 (D) 547 (C+D)

Ös s zes en 324 (A+C) 766 (B+D) 1090(A+B+C+D)

Page 18: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Relatív rizikó

• Relatív rizikó: A/A+B osztva C/C+D-vel: a példában 119/543 osztva 205/547-el: 0.22/0.37=0.59 (95% CI: 0,48-0.71), tehát az AIDS kiejlõdésének a relatív kockázata a Ritonavírral kezelt csoportban csaknem a fele a szokásos kezelést kapott betegek kockázatának

Page 19: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Esély-arány (OR)• Először mindkét csoportban kiszámítjuk az esélyét

annak, hogy egy esemény, példánkban az AIDS kifejlődése, bekövetkezzen. Ez A/B, ill C/D, tehát példánkban 119/424=0.28, ill. 205/342=0.60. A két esély arány tehát A/B osztva C/D-vel, 0.28/0.60=0.47 (95% CI 0.33-0.67). Tehát a ritonavírrel is kezelt betegeknek az esélye arra, hogy bennük AIDS fejlõdjön ki. kevesebb, mint fele annak, amely a ritonavirrel nem kezelt betegek esetében áll fenn.

• EZ AZ ÖSSZEFÜGGÉS AZONBAN CSAK AKKOR IGAZ, HA A KÉT CSOPORT MÁS SZEMPONTBÓL NEM KÜLÖNBÖZIK EGYMÁSTÓL. HA IGEN: TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ VAGY MÁS HASONLÓ ELJÁRÁS ELVÉGZÉSE SZÜKSÉGES

Page 20: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A TÖBBSZÖRÖS LOGISZTIKUS REGRESSZIÓ

• Matematikai-statisztikai eljárás, amelyet akkor alkalmazunk, ha egy dichotóm változó bekövetkezésének valószínűsége és az egyes független változók közötti kapcsolatot szeretnénk kiszámítani. Ha a független változó nominális, akkor ezt 0-val, ill 1-el jelőljük, ha folyamatos, akkor egy bizonyos egységnyi növekedésre pl. 1 SD növekedésre vonatkozik a kapcsolat, az OR.

Page 21: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A logisztikus regresszió során alkalmazott számítási mód

• A lineáris regresszióval ellentétben, amelynél a számítás az ún. legkisebb négyzetek módszerén alapszik, a logisztikus regresszió számítási módja az un. maximum likehood ratio kiszámítása. Ez, mint minden valószínűség-arány számítás, exponenciális, tehát a természetes logaritmus alapra vonatkozik. Ezt átalakítjuk úgy, hogy az egyenlet mindkét oldalán ln-t számítunk.

Page 22: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A logisztikus regresszió egyenlete

• odds (bekövetkezik/nem következik be, A/B= P/1-P. Ha a ln-át vesszük, ln (odds) = ln (P/1-P) = ßo + ßII

• Ha ezt az egyes független változók szerint részeire bontjuk, akkorln (odds) = ßo + X1ß1 + X2ß2....

• A ßo azt jelenti, hogy a ln(odds) mennyivel egyenlő, ha minden független változó = 0. A ß1 érték egyenlő az X változóra vonatkozó OR ln-ával, stb.

Page 23: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A logisztikus regresszió egyenlete (folyt.)

• A 0 hiptézisünk az, hogy a vizsgált változók által meghatározott esély-arány (OR) nem különbözik 1-től, tehát ezek a változók nem növelik az adott esemény bekövetkeztének valószínűségét. Ennek az OR-nek vesszük a ln-át, majd az egyenletet úgy alakítjuk át, hogy ezt az OR-t felbontjuk az egyes változók által meg-határozott OR-ekre, pontosabban ezek ln-áraln (OR) = X1(lnOR1) + X2(lnOR2)....

• Az egyes komputer programok vagy a ß vagy az OR értékeket adják meg, átszámíthatók: ß = ln(OR)

Page 24: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Modell felépítés a logisztikus regresszióban

• Hasonló a lineáris regresszióhozmanuálisautomatikus: forward selection backward elimination stepwise selection

• A számítógépes programok mérőszámot adnak (vö R2 a lineáris regressziónál), amely az egyes modellek „jóságát” (goodness of fit) fejezik ki.

Page 25: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A többszörös logisztikus regresszióval kapcsolatos legfontosabb kérdések

• Elegendő a megfigyelések száma? (5-10-szer több eset, mint változó)

• A modell megfelelő-e? Ha van interakció az egyes változók között, ezt a modell felépítésnél figyelembe kell és lehet is venni.

• Van-e az eredményeknek biológiai értelme? (automatikus modellfelépítés!)

• Ha váratlan összefüggés jön ki, lehet véletlen, de lehet értelme is: hipotézis felállítás, de ellenőrzés új vizsgálatban!!!

Page 26: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II
Page 27: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Példa a többszörös logisztikus regresszióra (Burián et al, Circulation, 2001)

Súlyos ISZB(n=248)

Kontroll be-tegek (n=53)

p

HDL chol,mmol/l

1.22 (0.67-2.05)

1.29 (1.14-1.37)

0.006

trig licerid,mmol/l

2.5 (0.3-16.6)

1.96 (0.9-6.3)

0.016

anti-hs p60,AU/ml

102 (0-2410) 57 (0-722) 0.0001

Chl.pneumpoz., %

79.4 64.2 0.021

Page 28: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Kérdés

• A négy paraméter előre képes-e jelezni, hogy egy adott egyén az ISZB-s beteg vagy kontroll-csoportba tartozik?

• Számítás többszörös logisztikus regressziófüggetlen változók: HDL-koleszterin, a triglicerid és az anti-hsp60 szintek (folyamatos változók, 1 SD változás) és a Chl, pneumoniae (nominális 0 (szeroneg), 1 (szeropoz)Függő változó: csoport 0: kontroll, 1: ISZB

Page 29: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Model: Logistic regression (logit) N of 0's:48 1's:241Dep. var: CSOPORT Loss: Max likelihood (MS-err. scaled to 1)Final loss: 115,14789192 Chi˛(4)=29,591 p=,00001

Const.B0 LOGHSP60 HDL_CHOL TRIGLICE CHL_PNEU

Estimate -,74 ,9383 -,186086 ,51 ,71548SE ,68 ,2997 ,284498 ,18 ,36015t(284) -1,08 3,1305 -,654084 2,81 -1,98662p-level ,28 ,0019 ,513587 ,01 ,04792-95%CL -2,08 ,3483 -,746078 ,15 -1,42439+95%CL ,61 1,5282 ,373907 ,86 -,00658Wald's khi2 1,16 9,8000 ,427826 7,88 3,94668p-level ,28 ,0017 ,513062 ,00 ,04697OR (unit ch) ,48 2,5556 ,830202 1,66 ,48896-95%CL ,12 1,4167 ,474223 1,16 ,24066+95%CL 1,84 4,6101 1,453402 2,37 ,99344

STATISTICA OUTPUT

Page 30: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

SPSS output

Variables in the Equation

,000 ,000 6,244 1 ,012 1,000 1,000 1,000

-,758 ,426 3,174 1 ,075 ,468 ,203 1,079

-,004 ,005 ,677 1 ,410 ,996 ,986 1,006

,010 ,015 ,512 1 ,474 1,010 ,982 1,040

,883 ,783 1,270 1 ,260 2,417

LOGHSP60

CHLPNEU

HDLCHOL

TRIG

Constant

Step1

a

B S.E. Wald df Sig. Exp(B) Lower Upper

95,0% C.I.for EXP(B)

Variable(s) entered on step 1: LOGHSP60, CHLPNEU, HDLCHOL, TRIG.a.

Page 31: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Milyen jó a modell? (Goodness of fit) SPSS

Hosmer and Lemeshow Test

7,977 8 ,436Step1

Chi-square df Sig.

A measure of how well the model fits the data. It is based on the squared differences between the observed and predicted probabilities. A small observed significance level for the goodness-of-fit statistic indicates that the model does not fit well.

Page 32: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II
Page 33: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II
Page 34: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

MIHEZ SZÁMÍTSUK AZ ODDS RATIOT?

• Ha a független változó kategorikus, főleg, ha bináris, akkor OK (beteg/nem beteg, dohányzik/nem dohányzik, férfi/nő, stb.).

• Ha viszont a független változó folyamatos, akkor koncepcionálisan nehéz felfogni, hogy egy egység pl. 1 SD változás mit jelent. Megoldások:értelmes kategóriákat állítok fel: pl. életkorban 10 év,binárissá teszem a független változót ( alacsony/nem alacsony, magas/nem magas labor. lelet, IQ, stb.)

Page 35: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

HOL HÚZZUK MEG A HATÁRT?

A binárissá átalakítandó független változó minden adatát (a függő változó eredményétől függetlenül!!!) sorba rendezzük és megállapítjuk, hol van a 90. percentilis, a legfelsőbb (legalsóbb) kvartilis, tercilis, esetleg a medián határa. (legtöbb program megcsinálja)

Ezután megvizsgáljuk, hogy a függő változóhoz tartozó két csoportban a magas/nem magas stb. kategóriába tartozó független változó hány esetben fordul elő

Végül a logisztikus regressziós egyenletbe bevisszük mint bináris változót (nem magas: 0, magas: 1) ezt a független változót, és kiszámítatjuk az OR-t

Page 36: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Anti-hsp60 legfelső kvartilis vs. többi

• Példánkban az anti-hsp60 legfelső kvartilisának határa: 183,24 AU/ml.

• Ezután átkódoljuk a változót, úgy, hogy 0: <193.24, 1: >183.24.

• Megszámoltatjuk a géppel, hogy a beteg, ill kontroll csoportban hány 0 és 1 anti-hsp60 antitest szintű egyén van.

• HSP60KV HSP60KV Row alacsony magas Totals

KO 51 3 54 PS 175 73 248All Grps 226 76 302Végül elvégezzük a logisztikus analízist a folyamatos változót a

binárissal helyettesítve

Page 37: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

STATISTICA OUTPUT

Const.B0 HDL_CHOL TRIGLICE HSP60_M_ CHL_PNEU

Estimate 2,06560 -,79768 ,1339 2,00283 -,92184

SE ,54187 ,34038 ,1409 ,62255 ,36728

t(287) 3,81201 -2,34351 ,9505 3,21714 -2,50987

p-level ,00017 ,01979 ,3426 ,00144 ,01263

-95%CL ,99906 -1,46764 -,1434 ,77749 -1,64475

+95%CL 3,13214 -,12773 ,4112 3,22817 -,19892

Wald's khi214,531405,49206 ,9035 10,35002 6,29946

p-level ,00014 ,01911 ,3419 ,00130 ,01208

OR(u.ch) 7,89002 ,45037 1,1433 7,40998 2.34

-95%CL 2,71574 ,23047 ,8664 2,17600 1.18

+95%CL 22,92288 ,88009 1,5086 25,23339 4.66

Page 38: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

SPSS output

Variables in the Equation

-,004 ,005 ,644 1 ,422 ,996 ,986 1,006

,004 ,014 ,067 1 ,795 1,004 ,977 1,031

-,931 ,417 4,984 1 ,026 ,394 ,174 ,893

2,248 ,754 8,887 1 ,003 9,470 2,160 41,523

1,720 ,717 5,760 1 ,016 5,585

HDLCHOL

TRIG

CHLPNEU

HSPHILOW

Constant

Step1

a

B S.E. Wald df Sig. Exp(B) Lower Upper

95,0% C.I.for EXP(B)

Variable(s) entered on step 1: HDLCHOL, TRIG, CHLPNEU, HSPHILOW.a.

Page 39: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A logisztikus regressziós számítással megoldható problémák

• Az egyes vizsgált változók hatásának számszerűsítése esély-arány (95% CI) formájában

• Ha két változó egymástól független és nem befolyásolják egymás hatását, akkor vizsgálni lehet, hogy van-e együttes hatásuk (joint effect)

• A két független változó egymástól független, de befolyásolják egymás hatását a függő változóra, számszerűsíteni lehet ezt a kölcsönhatást (interakciót) is

Page 40: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A multicollinearitásból adódó problémák megoldása

• Multicollinearitás: egymással korreláló független változók• Pneumonia – ápolási idő - láz (Celsius – Fahrenheit). Vagy

születési súly – fogantatástól eltelt idő• Hogyan tudom megállapítani? Mi a határ? R>0.9: ne,

R=0.8-0.9: bizonytalan, R<0.8: mehet• És, ha több a független változó? Tolerance és reciproka a

variance inflation factor. Tolerance: <0.25 kétes, <0.10 tilos, variance inflation factor 4, ill 10

• Mit csináljunk az egymástól függő változókkal? Hagyjuk ki, de melyiket?; és/vagy (pneumonia izzadás-hidegrázás); skálát készítünk a korreláló változókból

Page 41: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A szükséges mintaszám

• Többszörös regressziónál, nem lehet kevesebb, mint ami az egyszeri regressziónál kijön

• 10 x független változók száma

• De, ha az outcome vagy a dichotóm független változó előfordulási gyakorisága kicsi, akkor nagyon sok beteg kellhet

Page 42: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II
Page 43: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Hogyan lehet a független változók számát csökkenteni?

• Néhány változót kihagyunk– Elméleti megfontolásból– A mérési körülményeket figyelembe véve

• Két változó erősen korrelál. Melyiket hagyjuk ki?– Amelyikben több a hiányzó adat– Ahol nagyobb a mérési hiba valószínűsége– Amelyik orvosilag kevésbé jelentős

– Empirikus megfigyelések alapján• A változó nem függ össze az outcome-al az egyszeri vagy a többszörös

analízisban• A változó minimális mértékben befolyásolja csa a modell eredményét

• A változók egy részét kombináljuk egy változóvá vagy skálává– És/vagy– Szummációs skálák– Faktor analízis

Page 44: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Hogyan kódoljunk?

• 0 és 1 jobb, mint 1 és 2 stb• Nő – ffi, a kérdéstől függ• Mi legyen a referencia kategória? Pl életkor, rassz.

Kérdésfeltevéstől függ, más eredmények más interpretáció

• Életkor: ha lineáris a változás: legöregebb vagy legfiatalabb kategória

• De ha U-alakú az összefüggés (alkohol-fogyasztás – szívbetegségek) a középső kategória is lehet referencia

Page 45: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Független egymást nem befolyásoló változók

• Mind a magas anti-hsp60 szint, mind a Chl. pneum. fertőzöttség összefüggésben van az ISZB-vel (OR: 7.47 (2.18-25.2), ill. 2.17 (1.18-4.66).

• A két változó között nincs korreláció: Spearman r: - 0.007 (p=0.91)

• Számítsuk ki a magas anti-hsp60 szint OR-át, a Chl.pneum. szeronegatívoknál (2.06 (1.12-3.78)) és a Chl. pneum. szeropozitívoknál (3.85 (2.63-5.62). Tehát az ISZB és a magas anti-hsp közötti összefüggés fennáll a Chl. pneumoniae fertőzéstől függetlenül, a két változó nem (gyengén?) befolyásolja egymást

Page 46: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

CP- aHSP lo CP - aHSP hig CP+ aHSP low CP+ aHSP high0

100

200casescontrols

Page 47: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Két változó együttes hatása

age and genderadjusted OR

(95% CI)

p value

CP neg - aHSP60low

1 -

CP negaHSP60 high

6.80 (2.02-22.83) 0.0019

CP pos aHSP60low

2.16 (1.26-3.70) 0.0052

CP neg aHSP60high

82.0 (10.6-625.0) <0.0001

Page 48: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Az alap szérum IL-6 szint és a 3 éves mortalitás

IL-6 szint,pg/ml

<1.78 1.79-3.10 >3.10

Meghalt(%)

17 (8) 24 (12) 54 (27)

Túlé lt 197 180 148

Össze-sen

214 204 202

Page 49: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A korábbi cerebrovascularis betegség (CVB) hatása az IL-6 és a mortalitás közötti

összefüggésre (interakciót találtak, p=0.09)

IL-6,pg/ml

Nincs CVB azanamnézisben

CVB az anamnézisben

szám exitszám

ORmodel3 (95%

CI)

szám exitszám

ORmodel3 (95%

CI)<1.78 131 10 1 83 7 1

1.79-3.10

104 7 0.33(0.11-1.05)

100 17 1.76(0.73 -4.38

>3.10 76 14 1.13(0.44-2.86

126 40 4.15(1.80-9.55)

P fortrend

0.441 <0.001

Page 50: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Haplotípus Egészséges kontrollok

Egyének száma (%)

Colorectalis carcinomások

Egyének száma (%)

P érték

LTA 252G+TNF -308A +HSP70 1267G + RAGE -429C

non carrier heterozygote

108 (92.3) 9 (7.7)

148 (80.9) 35 (19.1)

0.006

A 6.1 kiterjesztett haplotípus és a colorectalis carcinoma

Page 51: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Interakció

• 8.1 haplotípus*nem p=0.0489

• 8.1 haplotípus*életkor p=0.009

Page 52: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

A

controls patients0

25

50

75

100

p=0.008

%B

controls patients0

25

50

75

100no AH8.1 carrierAH8.1 carrier

p=0.287

%

C

controls patients0

25

50

75

100p=0.018

%

D

controls patients0

25

50

75

100p=0.146

%

<67 éves (A) and >=67 éves (B); nők (C) and férfiak (D)

Page 53: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Table 4 Gender-adjusted risk of carriers vs non carriers of the LTA 252A+TNF -308A+HSP70 1267G + RAGE -429T haplotype belonging to different age groups at diagnosis to have colorectal cancer

Group Odds ratio (95% confidence interval)

P values

< 67 years old 5.878 (1.300-26.571) 0.021

> 67 years old 1.858 (0.655-5.266) 0.244

All patients 2.870 (1.316-6.263) 0.008

Page 54: TÖBBSZÖRÖS REGRESSZIÓS SZÁMÍTÁSOK II

Group Odds ratio (95% confidence interval)

P values

Females 4.208 (1.338-13.232) 0.024

Males 1.828 (0.564-5.929) 0.315

All patients 2.870 (1.316-6.263) 0.008

Table 5 Age-adjusted risk of females and male carriers vs non carriers of the LTA 252A+TNF -308A+HSP70 1267G + RAGE -429T haplotype to have colorectal cancer