Hlavná Iné Analýza údajov o čase od udalosti

Analýza údajov o čase od udalosti

Prehľad

Softvér

Popis

Webové stránky

Čítania

Kurzy

Prehľad

Táto stránka stručne popisuje sériu otázok, ktoré by ste mali vziať do úvahy pri analýze údajov čas-do-udalosti, a poskytuje anotovaný zoznam zdrojov, kde nájdete ďalšie informácie.

Popis

Čo je jedinečné na údajoch o čase do udalosti (TTE)?

Údaje o čase do udalosti (TTE) sú jedinečné, pretože výsledkom záujmu nie je len to, či k udalosti došlo alebo nie, ale aj to, kedy k udalosti došlo. Tradičné metódy logistickej a lineárnej regresie nie sú vhodné na to, aby bolo možné do modelu zahrnúť ako udalosť aj časové aspekty. Tradičné regresné metódy tiež nie sú vybavené na zvládnutie cenzúry, čo je špeciálny typ chýbajúcich údajov, ktorý sa vyskytuje v analýzach času na udalosť, keď subjekty počas sledovania nezažijú udalosť záujmu. Za prítomnosti cenzúry sa skutočný čas do udalosti podceňuje. Na využitie čiastkových informácií o každom subjekte s cenzurovanými údajmi a na poskytnutie objektívnych odhadov prežitia boli vyvinuté špeciálne techniky pre údaje TTE, o ktorých bude pojednané nižšie. Tieto techniky zahŕňajú údaje z viacerých časových bodov medzi subjektmi a je možné ich použiť na priamy výpočet rýchlostí, časových pomerov a pomerov rizík.

Aké sú dôležité metodologické úvahy týkajúce sa údajov o čase do udalosti?

Pri analýze času do udalosti alebo prežitia existujú 4 hlavné metodologické úvahy. Je dôležité mať jasnú definíciu cieľovej udalosti, časový vznik, časovú škálu a opísať, ako účastníci ukončia štúdiu. Len čo budú dobre definované, analýza sa stane priamočiarejšou. Spravidla existuje jedna cieľová udalosť, ale existujú rozšírenia analýz prežitia, ktoré umožňujú viac udalostí alebo opakovaných udalostí.

Aký je časový vznik?

Počiatok času je bod, od ktorého začína čas sledovania. Dáta TTE môžu využívať rôzne časové počiatky, ktoré sú do značnej miery určené dizajnom štúdie, z ktorých každý má súvisiace výhody a nevýhody. Príklady zahŕňajú základný čas alebo základný vek. Počiatky času môžu byť určené aj určujúcimi charakteristikami, ako je nástup expozície alebo diagnóza. Toto je často prirodzená voľba, ak výsledok súvisí s touto charakteristikou. Medzi ďalšie príklady patrí dátum narodenia a kalendárny rok. V prípade kohortných štúdií je časová škála najčastejšie dobou štúdia.

Existuje iná možnosť pre iný časový rozvrh ako čas na štúdium?

Vek je ďalšia bežne používaná časová škála, kde východiskovým vekom je čas a jednotlivci odchádzajú z udalosti alebo cenzurujú vek. Modely s vekom ako časovou mierkou je možné upraviť pre kalendárne efekty. Niektorí autori odporúčajú, aby sa ako časová škála použil vek a nie čas na štúdium, pretože môže poskytnúť menej skreslené odhady.

Čo je to cenzúra?

Jednou z výziev špecifických pre analýzu prežitia je, že iba niektorí jedinci zažili túto udalosť na konci štúdie, a preto pre podskupinu študovanej skupiny nebudú časy prežitia známe. Tento jav sa nazýva cenzúra a môže sa vyskytnúť nasledujúcimi spôsobmi: účastník štúdie do konca štúdie ešte nezažil relevantný výsledok, napríklad relaps alebo smrť; účastník štúdie je stratený z dôvodu následného sledovania počas obdobia štúdia; alebo účastník štúdie zažije inú udalosť, ktorá znemožňuje ďalšie sledovanie. Takéto cenzurované intervalové časy podceňujú skutočný, ale neznámy čas do udalosti. Pre väčšinu analytických prístupov sa predpokladá, že cenzúra je náhodná alebo neinformatívna.

Existujú tri hlavné typy cenzúry, pravý, ľavý a intervalový. Ak sa udalosti vyskytnú po skončení štúdie, údaje sú správne cenzurované. Údaje pozorované vľavo sa vyskytujú pri pozorovaní udalosti, ale presný čas udalosti nie je známy. Intervalovo cenzurované údaje sa vyskytujú pri pozorovaní udalosti, ale účastníci prichádzajú a odchádzajú z pozorovania, takže presný čas udalosti nie je známy. Väčšina analytických metód prežitia je navrhnutá pre pozorovania s pravou cenzúrou, ale dostupné sú metódy pre intervalové a ľavostranné údaje.

Aká je otázka záujmu?

Výber analytického nástroja by sa mal riadiť záujmovou výskumnou otázkou. S údajmi TTE môže mať výskumná otázka niekoľko podôb, ktoré ovplyvňujú, ktorá funkcia prežitia je pre výskumnú otázku najrelevantnejšia. Tri rôzne typy výskumných otázok, ktoré by mohli byť zaujímavé pre údaje TTE, zahŕňajú:

  1. Aký podiel jednotlivcov zostane po určitom čase bez udalosti?

  2. Aký podiel jednotlivcov bude mať udalosť po určitom čase?

  3. Aké je riziko udalosti v konkrétnom okamihu, medzi tými, ktorí prežili do tohto bodu?

Každá z týchto otázok zodpovedá inému typu funkcie použitej pri analýze prežitia:

  1. Funkcia prežitia, S (t): pravdepodobnosť, že jedinec prežije po čase t [Pr (T> t)]

  2. Funkcia hustoty pravdepodobnosti, F (t) alebo funkcia kumulatívnej incidencie, R (t): pravdepodobnosť, že jednotlivec bude mať čas prežitia menší alebo rovný t [Pr (T≤t)]

  3. Funkcia nebezpečenstva, h (t): okamžitý potenciál prežitia udalosti v čase t, podmienený prežitím do tohto času

  4. Kumulatívna nebezpečná funkcia, H (t): integrál nebezpečnej funkcie od času 0 do času t, ktorá sa rovná ploche pod krivkou h (t) medzi časom 0 a časom t

Ak je známa jedna z týchto funkcií, je možné ostatné funkcie vypočítať pomocou nasledujúcich vzorcov:

S (t) = 1 - F (t) Súčet funkcie prežitia a funkcie hustoty pravdepodobnosti je 1

h (t) = f (t) / S (t) Okamžité nebezpečenstvo sa rovná bezpodmienečnej pravdepodobnosti

prežívajúci udalosť v čase t, zmenšený zlomkom živého v čase t

H (t) = -log [S (t)] Kumulatívna funkcia nebezpečenstva sa rovná zápornému logaritmu prežitia

funkcie

S (t) = e –H (t) Funkcia prežitia sa rovná exponenciálnemu negatívnemu kumulatívnemu riziku

funkcie

Tieto konverzie sa často používajú v metódach analýzy prežitia, ako bude uvedené nižšie. Všeobecne platí, že zvýšenie okamžitého nebezpečenstva h (t) povedie k zvýšeniu kumulatívneho nebezpečenstva H (t), čo sa prejaví znížením funkcie prežitia S (t).

Aké predpoklady je potrebné urobiť, aby sa pre údaje o čase vyskytli štandardné techniky?

Hlavným predpokladom pri analýze údajov TTE je neinformatívna cenzúra: jedinci, ktorí sú cenzurovaní, majú rovnakú pravdepodobnosť výskytu následnej udalosti ako jedinci, ktorí v štúdii zostanú. Informatívna cenzúra je obdobou neprehliadnuteľných chýbajúcich údajov, ktoré ovplyvnia analýzu. Neexistuje definitívny spôsob, ako otestovať, či je cenzúra neinformatívna, hoci skúmanie vzorov cenzúry môže naznačovať, či je predpoklad neinformatívnej cenzúry opodstatnený. Ak existuje podozrenie na informatívnu cenzúru, je možné použiť analýzy citlivosti, ako sú scenáre najlepšieho a najhoršieho prípadu, na kvantifikáciu účinku, ktorý má informatívna cenzúra na analýzu.

Ďalším predpokladom pri analýze údajov TTE je, že existuje dostatočný čas na sledovanie a počet udalostí na primeranú štatistickú silu. Toto je potrebné vziať do úvahy vo fáze návrhu štúdie, pretože väčšina analýz prežitia je založená na kohortných štúdiách.

Za zmienku stoja ďalšie zjednodušujúce predpoklady, ktoré sa často vytvárajú v prehľadoch analýzy prežitia. Aj keď tieto predpoklady zjednodušujú modely prežitia, nie je potrebné ich analyzovať pomocou údajov TTE. Pokročilé techniky možno použiť, ak sú porušené tieto predpoklady:

  • Žiadny kohortový efekt na prežitie: v prípade kohorty s dlhým obdobím náboru predpokladajme, že jednotlivci, ktorí sa pripoja skôr, majú rovnakú pravdepodobnosť prežitia ako tí, ktorí sa pripoja neskoro

  • Správna cenzúra iba v dátach

  • Udalosti sú navzájom nezávislé

Aké typy prístupov je možné použiť na analýzu prežitia?

Existujú tri hlavné prístupy k analýze údajov TTE: neparametrické, semiparametrické a parametrické prístupy. Výber spôsobu prístupu by mal byť riadený výskumnou otázkou, ktorá nás zaujíma. V jednej analýze je často možné vhodne použiť viac ako jeden prístup.

Čo sú neparametrické prístupy k analýze prežitia a kedy sú vhodné?

Neparametrické prístupy sa nespoliehajú na predpoklady o tvare alebo forme parametrov v základnej populácii. V analýze prežitia sa na opis údajov používajú neparametrické prístupy odhadom funkcie prežitia S (t) spolu s mediánom a kvartilmi času prežitia. Tieto popisné štatistiky nemožno vypočítať priamo z údajov v dôsledku cenzúry, ktorá podceňuje skutočnú dobu prežitia u cenzúrovaných subjektov, čo vedie k skresleným odhadom priemeru, mediánu a ďalších popisov. Neparametrické prístupy sa často používajú ako prvý krok v analýze na generovanie nestrannej popisnej štatistiky a často sa používajú v spojení s semi-parametrickými alebo parametrickými prístupmi.

Kaplan-Meierov odhad

Najbežnejším neparametrickým prístupom v literatúre je Kaplan-Meierov odhad (alebo limit produktu). Kaplan-Meierov odhad pracuje tak, že rozloží odhad S (t) na sériu krokov / intervalov na základe pozorovaných časov udalostí. Pozorovania prispievajú k odhadu S (t), kým nenastane udalosť alebo kým nebudú cenzurované. Pre každý interval sa počíta pravdepodobnosť prežitia až do konca intervalu, vzhľadom na to, že subjekty sú na začiatku intervalu ohrozené (zvyčajne sa to označuje ako pj = (nj - dj) / nj). Odhadovaná S (t) pre každú hodnotu t sa rovná súčinu prežitia každého intervalu až do času t vrátane. Hlavnými predpokladmi tejto metódy, okrem neinformatívnej cenzúry, je, že k cenzúre dôjde po zlyhaní a že neexistuje žiadny kohortný vplyv na prežitie, takže subjekty majú rovnakú pravdepodobnosť prežitia bez ohľadu na to, kedy sa dostali do štúdie.

Odhadovaný S (t) z Kaplan-Meierovej metódy je možné vyniesť ako krokovú funkciu s časom na osi X. Tento graf predstavuje pekný spôsob vizualizácie prežitia kohorty a môže sa tiež použiť na odhad mediánu (keď S (t) ≤0,5) alebo kvartilov času prežitia. Tieto popisné štatistiky možno tiež vypočítať priamo pomocou Kaplan-Meierovho odhadcu. 95% intervaly spoľahlivosti (CI) pre S (t) sa spoliehajú na transformácie S (t), aby sa zabezpečilo, že 95% CI je v rozmedzí 0 a 1. Najbežnejšou metódou v literatúre je odhad Greenwooda.

Odhad životnej tabuľky

Odhad tabuľky prežitia podľa tabuľky životnosti je jedným z prvých príkladov použitých štatistických metód, ktoré sa na popis úmrtnosti u veľkých populácií používajú už viac ako 100 rokov. Odhad tabuľky životnosti je podobný Kaplan-Meierovej metóde, až na to, že intervaly sú založené na kalendárnom čase namiesto pozorovaných udalostí. Pretože metódy tabuľky životnosti sú založené na týchto kalendárnych intervaloch a nie na základe jednotlivých udalostí / časov cenzúry, používajú tieto metódy na odhad S (t) priemernú veľkosť množiny rizík na interval a musia predpokladať, že k cenzúre došlo rovnomerne počas celého kalendárneho časového intervalu. Z tohto dôvodu nie je odhad tabuľky životnosti taký presný ako Kaplan-Meierov odhad, ale výsledky budú vo veľmi veľkých vzorkách podobné.

Nelson-Aalen Estimator

Ďalšou alternatívou k Kaplan-Meierovi je Nelson-Aalenov odhad, ktorý je založený na použití prístupu počítania k odhadu funkcie kumulatívneho nebezpečenstva, H (t). Odhad H (t) sa potom môže použiť na odhad S (t). Odhady S (t) odvodené pomocou tejto metódy budú vždy väčšie ako odhad K-M, ale rozdiel bude medzi malými metódami vo veľkých vzorkách malý.

Môžu sa na parametrické alebo viacnásobné analýzy použiť neparametrické prístupy?

Neparametrické prístupy, ako je Kaplan-Meierov odhad, môžu byť použité na vykonanie nemenných analýz pre kategorické zaujímavé faktory. Faktory musia byť kategorické (buď vo svojej podstate, alebo ako spojitá premenná rozdelená do kategórií), pretože funkcia prežitia, S (t), sa odhaduje pre každú úroveň kategorickej premennej a potom sa porovnáva medzi týmito skupinami. Odhadované S (t) pre každú skupinu je možné vyniesť do grafu a vizuálne porovnať.

Na štatistické testovanie rozdielu medzi krivkami prežitia je možné použiť aj testy založené na hodnoteniach. Tieto testy porovnávajú pozorovaný a očakávaný počet udalostí v každom časovom bode naprieč skupinami, s nulovou hypotézou, že funkcie prežitia sú naprieč skupinami rovnaké. Existuje niekoľko verzií týchto testov založených na hodnotení, ktoré sa líšia hmotnosťou každého časového bodu pri výpočte štatistík testu. Dva z najbežnejších poradí založených na testoch, ktoré sa v literatúre vyskytujú, sú log rank test, ktorý dáva každému časovému bodu rovnakú váhu, a Wilcoxonov test, ktorý váži každý časový bod počtom rizikových osôb. Na základe tejto hmotnosti je Wilcoxonov test citlivejší na rozdiely medzi krivkami na začiatku sledovania, keď je ohrozených viac subjektov. Ostatné testy, napríklad Peto-Prenticeov test, používajú váhy medzi váhami logaritmu a Wilcoxonovými testami. Na testy založené na hodnostiach sa vzťahuje ďalší predpoklad, že cenzúra je nezávislá od skupiny, a všetky sú obmedzené malou silou na detekciu rozdielov medzi skupinami, keď sa krivky prežitia skrížia. Aj keď tieto testy poskytujú p-hodnotu rozdielu medzi krivkami, nemožno ich použiť na odhad veľkostí efektov (p-hodnota testu log rank test je však ekvivalentná s p-hodnotou pre kategorický zaujímavý faktor u nemenného Coxa Model).

Neparametrické modely sú obmedzené v tom, že neposkytujú odhady efektov a nemožno ich všeobecne použiť na hodnotenie účinku viacerých zaujímavých faktorov (modely s viacerými premennými). Z tohto dôvodu sa neparametrické prístupy často používajú v spojitosti s polo- alebo plne parametrickými modelmi v epidemiológii, kde sa na kontrolu rušivých vplyvov zvyčajne používajú viac premenné modely.

Dajú sa upraviť Kaplan-Meierove krivky?

Je častým mýtom, že Kaplan-Meierove krivky nie je možné upraviť, a to sa často uvádza ako dôvod na použitie parametrického modelu, ktorý dokáže generovať kovariančne upravené krivky prežitia. Bola však vyvinutá metóda na vytvorenie upravených kriviek prežitia pomocou váh s inverznou pravdepodobnosťou (IPW). V prípade iba jednej premennej možno IPW neparametricky odhadnúť a sú ekvivalentné priamej štandardizácii kriviek prežitia pre populáciu v štúdii. V prípade viacerých kovariátov sa na odhad váh musia použiť semi- alebo plne parametrické modely, ktoré sa potom použijú na vytvorenie kriviek prežitia upravených pomocou viacerých kovariancií. Výhodou tejto metódy je, že nepodlieha predpokladu proporcionálnych rizík, môže sa použiť pre časovo premenné premenné a tiež sa môže použiť pre spojité premenné.

Prečo potrebujeme parametrické prístupy k analýze údajov čas od udalosti?

Neparametrický prístup k analýze údajov TTE sa používa na jednoduchý opis údajov o prežití s ​​ohľadom na skúmaný faktor. Modely využívajúce tento prístup sa tiež označujú ako nemenné modely. Častejšie sa vyšetrovatelia zaujímajú o vzťah medzi niekoľkými premennými a čas do udalosti. Použitie semi- a plneparametrických modelov umožňuje analyzovať čas udalosti s ohľadom na mnoho faktorov súčasne a poskytuje odhady sily účinku pre každý faktor, ktorý je súčasťou.

Čo je to semi-parametrický prístup a prečo sa tak bežne používa?

Cox Proporcionálny model je najbežnejšie používaným prístupom s mnohými premennými na analýzu údajov o prežití v lekárskom výskume. Jedná sa v podstate o regresný model čas-k-udalosti, ktorý popisuje vzťah medzi incidenciou udalosti, vyjadrenou nebezpečnou funkciou, a množinou kovariancií. Coxov model je napísaný nasledovne:

nebezpečná funkcia, h (t) = h0 (t) exp {β1X1 + β2X2 +… + βpXp}

Považuje sa za semi-parametrický prístup, pretože model obsahuje neparametrický komponent a parametrický komponent. Neparametrická zložka je základné riziko, h0 (t). Toto je hodnota nebezpečenstva, keď sú všetky premenné rovné 0, čo zdôrazňuje dôležitosť centrovania premenných v modeli pre interpretovateľnosť. Nezamieňajte východiskové nebezpečenstvo za nebezpečenstvo v čase 0. Funkcia východiskového nebezpečenstva sa odhaduje neparametricky, a tak sa na rozdiel od väčšiny ostatných štatistických modelov nepredpokladá, že časy prežitia budú zodpovedať konkrétnemu štatistickému rozdeleniu a tvaru východiskovej hodnoty. nebezpečenstvo je ľubovoľné. Funkciu základného rizika nie je potrebné odhadovať, aby bolo možné vyvodiť závery o relatívnom riziku alebo pomere rizika. Táto vlastnosť robí Coxov model robustnejším ako parametrické prístupy, pretože nie je náchylný na nesprávnu špecifikáciu základného rizika.

Parametrickú zložku tvorí kovariančný vektor. Kovariátový vektor znásobuje základné nebezpečenstvo o rovnaké množstvo bez ohľadu na čas, takže účinok ktorejkoľvek kovariácie je kedykoľvek v priebehu sledovania rovnaký, a to je základ pre predpoklad pomerného rizika.

Aký je predpoklad pomerných rizík?

Predpoklad proporcionálnych rizík je zásadný pre použitie a interpretáciu Coxovho modelu.

doktorát verejného zdravotníctva

Za tohto predpokladu existuje konštantný vzťah medzi výsledkom alebo závislou premennou a kovariančným vektorom. Dôsledky tohto predpokladu sú, že rizikové funkcie pre ktorékoľvek dva jednotlivce sú v akomkoľvek okamihu proporcionálne a miera nebezpečenstva sa nemení s časom. Inými slovami, ak má jednotlivec riziko úmrtia v určitom počiatočnom časovom bode, ktorý je dvakrát vyšší ako v prípade iného jednotlivca, potom zostáva riziko úmrtia vo všetkých neskorších časových obdobiach dvakrát také vysoké. Tento predpoklad znamená, že krivky nebezpečnosti pre skupiny by mali byť proporcionálne a nemali by sa krížiť. Pretože je tento predpoklad taký dôležitý, mal by sa určite otestovať.

Ako testujete predpoklad primeraných rizík?

Na vyhodnotenie platnosti predpokladaného proporcionálneho nebezpečenstva existuje celá škála grafických a testovacích techník. Jednou z techník je jednoduché vykreslenie Kaplan-Meierových kriviek prežitia, ak porovnávate dve skupiny bez kovariátov. Ak sa krivky skrížia, môže dôjsť k porušeniu proporcionálneho predpokladu nebezpečenstva. Pre malé štúdie je potrebné mať na pamäti dôležitú výhradu k tomuto prístupu. S odhadom kriviek prežitia v prípade štúdií s malou veľkosťou vzorky môže byť spojené veľké množstvo chýb, preto sa krivky môžu krížiť, aj keď je splnený predpoklad proporcionálneho nebezpečenstva. Doplnkový záznam log-log je robustnejším testom, ktorý vykresľuje logaritmus záporného logaritmu odhadovanej funkcie prežitia proti logaritmu doby prežitia. Ak sú riziká proporcionálne naprieč skupinami, tento graf prinesie paralelné krivky. Ďalšou bežnou metódou na testovanie predpokladu proporcionálnych rizík je zahrnutie termínu časovej interakcie na určenie, či sa HR mení v priebehu času, pretože čas je často vinníkom neproporcionality rizík. Dôkaz, že termín * časovej interakcie skupiny nie je nula, je dôkazom proti proporcionálnym rizikám.

Čo ak predpoklad pomerných rizík neplatí?

Ak zistíte, že predpoklad PH neplatí, nemusíte nevyhnutne upustiť od používania Coxovho modelu. V modeli existujú možnosti na zlepšenie neproporcionality. Napríklad môžete do modelu zahrnúť ďalšie premenné, buď nové premenné, nelineárne výrazy pre existujúce premenné alebo interakcie medzi premennými. Alebo môžete stratifikovať analýzu na jednu alebo viac premenných. Týmto sa odhaduje model, v ktorom je dovolené, aby sa východiskové nebezpečenstvo líšilo v rámci každej vrstvy, ale efekty kovariátov sú v rámci všetkých vrstiev rovnaké. Medzi ďalšie možnosti patrí rozdelenie času do kategórií a použitie premenných ukazovateľov, ktoré umožňujú, aby sa miera nebezpečnosti v priebehu času menila, a zmena časovej premennej analýzy (napr. Z uplynulého času do veku alebo naopak).

Ako skúmate prispôsobenie semi-parametrického modelu?

Okrem kontroly porušenia predpokladu proporcionality by sa mali preskúmať aj ďalšie aspekty vhodnosti modelu. Štatistiky podobné tým, ktoré sa používajú pri lineárnej a logistickej regresii, sa dajú na vykonanie týchto úloh pre Coxove modely s určitými rozdielmi použiť, ale základné myšlienky sú vo všetkých troch nastaveniach rovnaké. Je dôležité skontrolovať linearitu kovariančného vektora, čo je možné vykonať skúmaním zvyškov, rovnako ako to urobíme pri lineárnej regresii. Zvyšky v dátach TTE však nie sú také priame a lineárne regresné, čiastočne preto, že hodnota výsledku nie je pre niektoré údaje známa a zvyšky sú často skreslené. Na posúdenie Coxovho modelu vhodného pre údaje TTE bolo vyvinutých niekoľko rôznych druhov zvyškov. Patria sem napríklad Martingale a Schoenfeld. Môžete sa tiež pozrieť na zvyšky a identifikovať veľmi vplyvné a zle vyhovujúce pozorovania. Existujú aj testy zhody, ktoré sú špecifické pre modely Cox, napríklad test Gronnesby a Borgan a prognostický index Hosmer a Lemeshow. AIC môžete tiež použiť na porovnanie rôznych modelov, aj keď použitie R2 je problematické.

Prečo používať parametrický prístup?

Jednou z hlavných výhod semi-parametrických modelov je, že nie je potrebné špecifikovať základné nebezpečenstvo, aby bolo možné odhadnúť pomery rizika, ktoré popisujú rozdiely v relatívnom riziku medzi skupinami. Môže sa však stať, že zaujímavý je odhad samotného základného rizika. V takom prípade je nevyhnutný parametrický prístup. V parametrických prístupoch sú špecifikované tak nebezpečná funkcia, ako aj vplyv kovariátov. Funkcia nebezpečenstva sa odhaduje na základe predpokladaného rozdelenia v základnej populácii.

Výhody použitia parametrického prístupu k analýze prežitia sú:

  • Parametrické prístupy sú informatívnejšie ako neparametrické a semi-parametrické prístupy. Okrem výpočtu odhadov relatívnych účinkov je možné ich tiež použiť na predpovedanie času prežitia, mier rizika a priemerných a stredných časov prežitia. Môžu sa tiež použiť na predpovedanie absolútnych rizík v priebehu času a na vykreslenie kriviek prežitia upravených podľa kovariancie.

  • Ak je parametrický tvar správne zadaný, majú parametrické modely väčšiu výkonnosť ako semi-parametrické modely. Sú tiež efektívnejšie, čo vedie k menším štandardným chybám a presnejším odhadom.

  • Parametrické prístupy sa spoliehajú na úplnú maximálnu pravdepodobnosť odhadu parametrov.

  • Zvyšky parametrických modelov majú známu formu rozdielu v pozorovaných a očakávaných.

Hlavnou nevýhodou použitia parametrického prístupu je to, že sa zakladá na predpoklade, že je správne špecifikované základné rozdelenie populácie. Parametrické modely nie sú podľa špecifikácie robustné, a preto sú semi-parametrické modely v literatúre bežnejšie a ich použitie je menej riskantné, ak existuje neistota v súvislosti so základným rozdelením populácie.

Ako si vyberiete parametrický formulár?

Výber vhodnej parametrickej formy je najťažšou časťou parametrickej analýzy prežitia. Špecifikácia parametrickej formy by mala byť podložená hypotézou štúdie, spolu s predchádzajúcimi poznatkami a biologickou pravdepodobnosťou tvaru základného rizika. Napríklad, ak je známe, že riziko úmrtia dramaticky stúpa hneď po operácii a potom klesá a vyrovnáva sa, nebolo by vhodné špecifikovať exponenciálne rozdelenie, ktoré v priebehu času predstavuje neustále nebezpečenstvo. Údaje je možné použiť na posúdenie, či sa zdá, že uvedená forma vyhovuje údajom, ale tieto metódy založené na údajoch by mali výbery založené na hypotézach dopĺňať, nie nahrádzať.

Aký je rozdiel medzi modelom proporcionálnych rizík a modelom zrýchlenej doby zlyhania?

Aj keď je Coxov model proporcionálnych rizík semi-parametrický, môžu byť parametrické aj modely proporcionálnych rizík. Modely parametrických proporcionálnych rizík možno napísať ako:

h (t, X) = h0 (t) exp (Xi β) = h0 (t) λ

kde východiskové nebezpečenstvo, h0 (t), závisí iba od času, t, ale nie od X, a λ je jednotková špecifická funkcia premenných, ktorá nezávisí od t, ktorá stupňuje základnú východiskovú funkciu nahor alebo nadol. λ nemôže byť záporné. V tomto modeli je miera rizika multiplikatívnou funkciou základného rizika a pomery rizika je možné interpretovať rovnakým spôsobom ako v semi-parametrickom modeli proporcionálnych rizík.

Modely AFT (Accelerated Failure Time) sú triedou parametrických modelov prežitia, ktoré je možné linearizovať pomocou prirodzeného protokolu modelu doby prežitia. Najjednoduchším príkladom modelu AFT je exponenciálny model, ktorý je napísaný ako:

ln (T) = β0 + β1X1 +…. + βpXp + ε *

Hlavný rozdiel medzi modelmi AFT a PH je v tom, že modely AFT predpokladajú, že účinky kovariátov sú na časovej škále multiplikatívne, zatiaľ čo modely Cox používajú stupnicu nebezpečnosti, ako je uvedené vyššie. Odhady parametrov z modelov AFT sa interpretujú ako efekty na časovej škále, ktorá môže buď zrýchliť alebo spomaliť čas prežitia. Exp (β)> 1 z modelu AFT znamená, že faktor urýchľuje čas prežitia alebo vedie k dlhšiemu prežitiu. Exp (β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Niektoré rozdelenia chýb je možné zapísať a interpretovať ako modely PH a AFT (tj. Exponenciálne, Weibull), iné sú iba modely PH (tj. Gompertz) alebo iba modely AFT (tj. Log-logistické) a iné nie sú ani modelmi PH, ani AFT. (tj. osadenie drážky).

Aké formy môžu mať parametrické modely?

Funkcia nebezpečenstva môže mať akúkoľvek formu, pokiaľ h (t)> 0 pre všetky hodnoty t. Aj keď primárnym hľadiskom pre parametrickú formu by mala byť predbežná znalosť tvaru základného rizika, každá distribúcia má svoje výhody a nevýhody. Niektoré z najbežnejších foriem budú stručne vysvetlené a ďalšie informácie budú k dispozícii v zozname zdrojov.

Exponenciálne rozdelenie

Exponenciálne rozdelenie predpokladá, že h (t) závisí iba od modelových koeficientov a premenných a je konštantná v čase. Hlavnou výhodou tohto modelu je, že ide o model proporcionálnych rizík aj o model zrýchlenej doby zlyhania, takže odhady efektov možno interpretovať buď ako pomery nebezpečnosti, alebo ako časové pomery. Hlavnou nevýhodou tohto modelu je, že je často nepravdepodobné, že v priebehu času prevezmete neustále nebezpečenstvo.

Weibullova distribúcia

Weibullovo rozdelenie je podobné exponenciálnemu rozdeleniu. Zatiaľ čo exponenciálne rozdelenie predpokladá konštantné nebezpečenstvo, Weibullovo rozdelenie predpokladá monotónne nebezpečenstvo, ktoré môže byť buď rastúce alebo klesajúce, ale nie oboje. Má dva parametre. Parameter tvaru (σ) riadi, či sa nebezpečenstvo zvyšuje (σ1) (v exponenciálnom rozdelení je tento parameter nastavený na 1). Parameter stupnice, (1 / σ) exp (-β0 / σ), určuje rozsah tohto prírastku / úbytku. Pretože Weibullova distribúcia sa zjednodušuje na exponenciálne rozdelenie, keď σ = 1, nulovú hypotézu, že σ = 1 možno testovať pomocou Waldovho testu. Hlavnou výhodou tohto modelu je, že ide o model PH aj AFT, takže je možné odhadnúť pomer nebezpečnosti aj čas. Hlavnou nevýhodou je opäť to, že predpoklad monotónnosti základného rizika môže byť v niektorých prípadoch nepravdepodobný.

Gompertzova distribúcia

Gompertzova distribúcia je model PH, ktorý sa rovná distribúcii log-Weibull, takže logická funkcia nebezpečenstva je lineárna v t. Toto rozdelenie má exponenciálne sa zvyšujúcu poruchovosť a je často vhodné pre poistno-matematické údaje, pretože riziko úmrtnosti sa tiež časom exponenciálne zvyšuje.

Log-logistická distribúcia

Log-logistická distribúcia je model AFT s chybovým výrazom, ktorý nasleduje po štandardnej logistickej distribúcii. Môže zodpovedať nemonotónnym rizikám a všeobecne sa najlepšie hodí, keď základné riziko stúpne na vrchol a potom klesne, čo môže byť pravdepodobné pri určitých chorobách, ako je tuberkulóza. Logicko-logistické rozdelenie nie je modelom PH, ale je to model proporcionálnych šancí. To znamená, že podlieha predpokladu proporcionálnych šancí, ale výhodou je, že svahové koeficienty je možné interpretovať ako časové pomery a tiež ako pomery šancí. Napríklad pomer šancí 2 z parametrického logaritmického modelu by sa interpretoval tak, že šanca na prežitie po čase t medzi subjektmi s x = 1 je dvojnásobná šanca medzi subjektmi s x = 0.

Zovšeobecnená distribúcia gama (GG)

Zovšeobecnená distribúcia gama (GG) je v skutočnosti rodina distribúcií, ktorá obsahuje takmer všetky najbežnejšie používané distribúcie vrátane exponenciálnej, Weibullovej, logaritmickej normálnej a gama distribúcie. To umožňuje porovnanie medzi rôznymi distribúciami. Rodina GG obsahuje aj všetky štyri najbežnejšie typy nebezpečných funkcií, čo robí distribúciu GG obzvlášť užitočnou, pretože tvar nebezpečnej funkcie môže pomôcť optimalizovať výber modelu.

Prístup Splines

Pretože jediným všeobecným obmedzením špecifikácie funkcie základného rizika je to (t)> 0 pre všetky hodnoty t, môžu sa na maximálnu flexibilitu pri modelovaní tvaru základného rizika použiť splajny. Obmedzené kubické spline sú jednou z metód, ktorá sa nedávno v literatúre odporúčala pre parametrickú analýzu prežitia, pretože táto metóda umožňuje flexibilitu tvaru, ale obmedzuje lineárnu funkciu na koncoch, kde sú údaje riedke. Spline môžu byť použité na zlepšenie odhadu a sú tiež výhodné pre extrapoláciu, pretože maximalizujú prispôsobenie pozorovaným údajom. Ak je správne zadané, odhady efektov z modelov prispôsobených pomocou spline by nemali byť ovplyvnené. Rovnako ako v iných regresných analýzach, aj pri spájaní spline môže medzi problémy patriť výber počtu a umiestnenia uzlov a problémy s nadmerným spájaním.

Ako skúmate prispôsobenie parametrického modelu?

Najdôležitejšou súčasťou posudzovania zhody parametrického modelu je kontrola, či údaje podporujú zadaný parametrický formulár. To je možné hodnotiť vizuálne grafom kumulatívneho rizika založeného na modeli proti Kaplan-Meierovej odhadovanej funkcii kumulatívneho nebezpečenstva. Ak je zadaný formulár správny, graf by mal prechádzať počiatkom so sklonom 1. Skúšku správnosti zhody Grønnesby-Borgan možno použiť aj na to, či sa pozorovaný počet udalostí významne líši od očakávaného počtu udalostí v skupinách diferencovaných podľa skóre rizika. Tento test je vysoko citlivý na počet zvolených skupín a má tendenciu odmietnuť nulovú hypotézu adekvátneho prispôsobenia príliš liberálne, ak sa vyberie veľa skupín, najmä v malých súboroch údajov. Testu chýba sila na zistenie porušenia modelu, ak je však vybraných príliš málo skupín. Z tohto dôvodu sa javí ako neuvážené spoliehať sa pri určovaní, či je určený parametrický tvar primeraný, iba na teste dobrej zhody.

AIC možno tiež použiť na porovnanie modelov spustených s rôznymi parametrickými formami, pričom najnižšia AIC naznačuje najlepšiu zhodu. AIC však nemožno použiť na porovnanie parametrických a semi-parametrických modelov, pretože parametrické modely sú založené na časoch pozorovaných udalostí a semi-parametrické modely sú založené na poradí časov udalostí. Tieto nástroje by sa opäť mali používať na preskúmanie toho, či sa zadaný formulár hodí k údajom, ale vierohodnosť špecifikovaného základného nebezpečenstva je stále najdôležitejším aspektom výberu parametrického formulára.

Len čo sa určí, že zadaný parametrický formulár vyhovuje údajom, môžu sa na výber medzi rôznymi modelmi použiť podobné metódy ako tie, ktoré sa už predtým opísali pre modely proporcionálneho nebezpečenstva, ako napríklad zvyškové grafy a testy zhody.

Čo ak sa prediktory časom zmenia?

Vo vyššie uvedených modelových vyhláseniach sme predpokladali, že expozície sú v priebehu sledovania konštantné. Expozície s hodnotami, ktoré sa časom menia alebo časovo premenné premenné, je možné zahrnúť do modelov prežitia zmenou jednotky analýzy z jednotlivca na časové obdobie, keď je expozícia konštantná. Toto rozdeľuje osobnú dobu jednotlivcov na intervaly, ktoré každá osoba prispieva k množstvu rizík vystavených a neexponovaných pre danú premennú. Hlavným predpokladom zahrnutia časovo premennej kovariácie týmto spôsobom je, že efekt časovo premennej kovariácie nezávisí od času.

Pre Coxov model proporcionálneho nebezpečenstva by zahrnutie časovo premennej kovariácie malo formu: h (t) = h0 (t) e ^ β1x1 (t). V parametrických modeloch môžu byť zahrnuté aj časovo premenné kovariáty, aj keď je to trochu komplikovanejšie a zložitejšie na interpretáciu. Parametrické modely môžu tiež modelovať časovo premenné premenné pomocou spline pre väčšiu flexibilitu.

Spravidla by sa mali používať časovo premenné kovariáty, ak sa predpokladá, že nebezpečenstvo závisí viac od neskorších hodnôt kovariátu ako od hodnoty kovariátu na začiatku. Výzvami, ktoré vznikajú s časovo premennými premennými, sú chýbajúce údaje o premenných v rôznych časových bodoch a potenciálna odchýlka v odhade rizika, ak je časovo premenná premenná skutočne sprostredkovateľom.

Čo je analýza konkurenčných rizík?

Tradičné metódy analýzy prežitia predpokladajú, že sa vyskytne iba jeden typ zaujímavej udalosti. Existujú však pokročilejšie metódy, ktoré umožňujú skúmanie niekoľkých typov udalostí v tej istej štúdii, napríklad úmrtia z viacerých príčin. Pre tieto štúdie, v ktorých sa doba prežitia končí prvou z niekoľkých udalostí, sa používa analýza konkurenčných rizík. Sú potrebné špeciálne metódy, pretože môže byť ovplyvnená analýza času pre každú udalosť zvlášť. Konkrétne v tejto súvislosti má metóda KM tendenciu nadhodnocovať podiel subjektov, ktoré prežívajú udalosti. Analýza konkurenčných rizík využíva metódu kumulatívnej incidencie, pri ktorej je celková pravdepodobnosť udalosti kedykoľvek súčtom pravdepodobností špecifických pre danú udalosť. Modely sa zvyčajne implementujú tak, že sa každý účastník štúdie zadá niekoľkokrát - jeden pre každý typ udalosti. U každého účastníka štúdie je čas do akejkoľvek udalosti cenzurovaný v čase, keď pacient zažil prvú udalosť. Viac informácií nájdete na stránke advancedepidemiology.org na stránke konkurenčné riziká .

Čo sú krehké modely a prečo sú užitočné pre korelované údaje?

Korelované údaje o prežití môžu vzniknúť v dôsledku opakujúcich sa udalostí, ktoré prežívajú jednotlivci, alebo keď sú pozorovania zoskupené do skupín. Z dôvodu nedostatku vedomostí alebo uskutočniteľnosti sa niektoré kovariáty súvisiace so záujmovou udalosťou nemusia merať. Krehké modely zodpovedajú za heterogenitu spôsobenú nemeranými premennými pridaním náhodných účinkov, ktoré pôsobia multiplikatívne na funkciu nebezpečenstva. Krehké modely sú v podstate rozšírením Coxovho modelu s pridaním náhodných efektov. Aj keď sa na popis týchto modelov používajú rôzne klasifikačné schémy a názvoslovie, štyri bežné typy krehkých modelov zahŕňajú zdieľanú, vnorenú, krehkú a aditívnu krehkosť.

Existujú aj iné prístupy k analýze údajov o opakujúcich sa udalostiach?

Údaje o opakujúcich sa udalostiach korelujú, pretože u toho istého subjektu sa môže vyskytnúť viac udalostí. Zatiaľ čo modely krehkosti sú jednou z metód na zohľadnenie tejto korelácie v analýzach opakujúcich sa udalostí, jednoduchším prístupom, ktorý môže tiež zohľadniť túto koreláciu, je použitie robustných štandardných chýb (SE). S pridaním robustných SE je možné vykonať analýzu rekurentných udalostí ako jednoduché rozšírenie semi-parametrických alebo parametrických modelov.

Aj keď sa dá ľahko implementovať, existuje niekoľko spôsobov, ako modelovať údaje o opakujúcich sa udalostiach pomocou robustných SE. Tieto prístupy sa líšia v tom, ako definujú riziko pre každú recidívu. Týmto spôsobom odpovedajú na mierne odlišné študijné otázky, takže výber toho, ktorý modelový prístup sa má použiť, by mal byť založený na študijnej hypotéze a platnosti modelových predpokladov.

Proces počítania alebo Andersen-Gillov prístup k modelovaniu rekurentných udalostí predpokladá, že každá rekurencia je nezávislou udalosťou a nezohľadňuje poradie ani typ udalosti. V tomto modeli čas sledovania pre každý predmet začína na začiatku štúdie a je rozdelený na segmenty definované podľa udalostí (recidív). Subjekty prispievajú k riziku stanovenému pre udalosť, pokiaľ sú v tom čase pod pozorovaním (nie sú cenzurované). Tieto modely sa dajú ľahko prispôsobiť ako Coxov model s pridaním robustného odhadcu SE a pomery rizika sa interpretujú ako vplyv kovariácie na mieru rekurencie v sledovanom období. Tento model by však bol nevhodný, ak predpoklad nezávislosti nie je primeraný.

Podmienené prístupy predpokladajú, že subjekt nie je vystavený riziku následnej udalosti, kým nenastane predchádzajúca udalosť, a preto zohľadňujú poradie udalostí. Sú vhodné pomocou stratifikovaného modelu s počtom udalostí (alebo v tomto prípade počtom opakovaní) ako premennými vrstvami a zahŕňajúcimi robustné SE. Existujú dva rôzne podmienené prístupy, ktoré používajú rôzne časové škály, a preto majú odlišné súbory rizík. Prístup podmienenej pravdepodobnosti využíva na vymedzenie časových intervalov čas od začiatku štúdie a je vhodný, ak je záujem v celom priebehu procesu opakujúcich sa udalostí. Prístup s časovým odstupom v podstate resetuje hodiny pre každú recidívu použitím času od predchádzajúcej udalosti na definovanie časových intervalov a je vhodnejší, keď sú zaujímavé odhady účinku špecifické pre udalosť (alebo opakovanie).

Nakoniec, marginálne prístupy (tiež známe ako WLW - Wei, Lin a Weissfeld - prístup) považujú každú udalosť za samostatný proces, takže subjekty sú vystavené riziku všetkých udalostí od začiatku sledovania bez ohľadu na to, či zažili predchádzajúca udalosť. Tento model je vhodný, ak sa predpokladá, že udalosti sú výsledkom rôznych základných procesov, aby subjekt mohol zažiť napríklad 3. udalosť bez toho, aby zažil prvú. Aj keď sa tento predpoklad zdá byť nepravdepodobný pre niektoré typy údajov, ako sú recidívy rakoviny, bolo by možné ho použiť na modelovanie recidív poranení v určitom časovom období, keď by subjekty mohli v danom období zaznamenať rôzne typy zranení, ktoré nemajú prirodzený poriadok. Okrajové modely je možné prispôsobiť aj pomocou stratifikovaných modelov s robustnými SE.

Čítania

Cieľom tohto projektu bolo opísať metodologické a analytické rozhodnutia, ktorým môže človek čeliť pri práci s údajmi o čase, ale nie sú nijako vyčerpávajúce. Nižšie sú uvedené zdroje, ktoré sa týmto témam venujú hlbšie.

Učebnice a kapitoly

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Regresné metódy v biostatistike, 2. New York, NY: Springer.

  • Úvodný text k lineárnym, logistickým modelom, modelom prežitia a modelom opakovaných opatrení, najlepšie pre tých, ktorí chcú základné východisko.

  • Kapitola Analýza prežitia poskytuje dobrý prehľad, ale nie hĺbku. Príklady sú založené na STATA.

Hosmer DW, Lemeshow S, May S. (2008) Applied Survival Analysis: Regression Modeling of Time-to-Event Data, 2. vyd. Hoboken, NJ: John Wiley & Sons, Inc.

  • Hĺbkový prehľad neparametrických, semiparametrických a parametrických Coxových modelov, najlepšie pre tie, ktoré majú znalosti v iných oblastiach štatistiky. Pokročilé techniky nie sú podrobne prebraté, ale sú poskytnuté odkazy na ďalšie špeciálne učebnice.

Kleinbaum DG, Klein M (2012). Analýza prežitia: Self-Learning Text, 3. vyd. New York, NY: Springer Science + Business Media, LLC

  • Vynikajúci úvodný text

Klein JP, Moeschberger ML (2005). Analýza prežitia: Techniky pre cenzurované a skrátené údaje, 2. vyd. New York, NY: Springer Science + Business Media, LLC

  • Táto kniha je určená pre študentov postgraduálneho štúdia a poskytuje mnoho praktických príkladov

Therneau TM, Grambsch PM (2000). Modelovanie údajov o prežití: Rozšírenie Coxovho modelu. New York, NY: Springer Science + Business Media, LLC

  • Dobrý úvod do procesu počítania a analýzy korelovaných údajov o prežití. Autor tiež napísal balíček na prežitie v R.

Allison PD (2010). Analýza prežitia pomocou SAS: Praktický sprievodca, 2. vyd. Cary, NC: Ústav SAV

  • Skvelý aplikovaný text pre používateľov SAS

Bagdonavicius V, Nikulin M (2002). Zrýchlené modely života: modelovanie a štatistická analýza. Boca Raton, FL: Chapman & Hall / CRC Press.

  • Dobrý zdroj pre viac informácií o parametrických a semi-parametrických zrýchlených modeloch doby zlyhania a o tom, ako sa porovnávajú s proporcionálnymi modelmi nebezpečenstva

Metodické články

Úvodné / prehľadné články

Hougaard P (1999). Základy údajov o prežití. Biometrické údaje 55 (1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analýza prežitia, časť I: základné pojmy a prvé analýzy. Br J Cancer 89 (2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analýza prežitia, časť II: analýza viacerých premenných - úvod do koncepcií a metód. Br J Cancer 89 (3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analýza prežitia, časť II: analýza viacerých premenných - výber modelu a hodnotenie jeho primeranosti a vhodnosti. Br J Cancer 89 (4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Analýza prežitia, časť IV: ďalšie koncepcie a metódy v analýze prežitia. Br J Cancer 89 (5): 781-6. PMID: 12942105

  • Séria štyroch článkov uvedených vyššie predstavuje vynikajúci úvodný prehľad metód v analýze prežitia, ktorý je mimoriadne dobre napísaný a ľahko zrozumiteľný - veľmi sa odporúča.

Vek ako časová škála

Korn EL, Graubard BI, Midthune D (1997). Analýza pozdĺžnych následkov prieskumu v čase od udalosti: výber časovej škály. Am J Epidemiol 145 (1): 72-80. PMID: 8982025

  • Príspevok obhajujúci použitie veku ako časovej škály namiesto času štúdia.

Ingram DD, Makuc DM, Feldman JJ (1997). Re: Time-to-event analysis of longitudinal followup of an survey: choice of the time-scale. Am J Epidemiol 146 (6): 528-9. PMID: 9290515 .

  • Komentár k Kornovej práci s popisom preventívnych opatrení, ktoré je potrebné podniknúť pri použití veku ako časovej škály.

Thiébaut AC, Bénichou J (2004). Voľba časového rozsahu v Coxovej modelovej analýze údajov o epidemiologickej skupine: simulačná štúdia. Stat Med 30; 23 (24): 3803-20. PMID: 15580597

  • Simulačná štúdia ukazujúca veľkosť skreslenia pre rôzne stupne asociácie medzi vekom a záujmovou premennou pri použití času na štúdiu ako časovej škály.

Canchola AJ, Stewart SL, Bernstein L a kol. Coxova regresia pomocou rôznych časových mierok. Dostupný v: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Pekný článok porovnávajúci 5 Coxových regresných modelov s variáciami času v štúdiu alebo veku ako časovej stupnice s kódom SAS.

Cenzúra

Huang CY, Ning J, Qin J (2015). Semiparametrické vyvodenie pravdepodobnosti pre údaje skrátené vľavo a vpravo cenzurované. Biostatistika [epub] PMID: 25796430 .

  • Tento príspevok predstavuje pekný úvod do analýzy cenzurovaných údajov a poskytuje nový postup odhadu rozdelenia času prežitia s údajmi skrátenými doľava a doprava. Je veľmi hustý a má pokročilé štatistické zameranie.

Cain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Predpätie v dôsledku skrátenia vľavo a cenzúry vľavo v pozdĺžnych štúdiách vývojových a chorobných procesov. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • Vynikajúci zdroj, ktorý vysvetľuje predpojatosť, ktorá je inherentná pre údaje z ľavej strany z epidemiologického hľadiska.

    webová aplikácia cumc outlook

Sun J, Sun L, Zhu C (2007). Testovanie modelu proporcionálnych šancí na údaje intervalovo cenzurované. Doživotné údaje Anal 13: 37–50. PMID 17160547 .

  • Ďalší štatisticky hustý článok o podrobnom aspekte analýzy údajov TTE, ale poskytuje dobré vysvetlenie údajov s intervalovou cenzúrou.

Robins JM (1995a) Analytická metóda pre randomizované štúdie s informatívnou cenzúrou: časť I. Celoživotné údaje Anal 1: 241–254. PMID 9385104 .

Robins JM (1995b) Analytická metóda pre randomizované štúdie s informatívnou cenzúrou: časť II. Doživotné údaje, analýza 1: 417–434. PMID 9385113 .

  • Dva príspevky, ktoré pojednávajú o metódach riešenia informačnej cenzúry.

Neparametrické metódy prežitia

Borgan Ø (2005) Kaplan-Meierov odhad. Encyklopédia biostatistiky DOI: 10.1002 / 0470011815.b2a11042

  • Vynikajúci prehľad o Kaplan-Meierovom odhade a jeho vzťahu k Nelson-Aalenovmu odhadu

Rodríguez G (2005). Neparametrický odhad v modeloch prežitia. Dostupné z: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Úvod do neparametrických metód a Coxovho modelu proporcionálneho nebezpečenstva, ktorý vysvetľuje vzťahy medzi metódami pomocou matematických vzorcov

Cole SR, Hernan MA (2004). Upravené krivky prežitia s inverznými váhami pravdepodobnosti. Programy výpočtových metód Biomed 75 (1): 35-9. PMID: 15158046

  • Opisuje použitie IPW na vytvorenie upravených Kaplan-Meierových kriviek. Zahŕňa príklad a makro SAS.

Zhang M (2015). Robustné metódy na zvýšenie účinnosti a zníženie skreslenia pri odhadovaní kriviek prežitia v randomizovaných klinických štúdiách. Doživotné údaje, analýza 21 (1): 119-37. PMID: 24522498

  • Navrhovaná metóda pre kovariančne upravené krivky prežitia v RCT

Poloparametrické metódy prežitia

Cox DR (1972) Regresné modely a tabuľky života (s diskusiou). J R Statistiky Soc B 34: 187–220.

  • Klasický odkaz.

Christensen E (1987) Multivariačná analýza prežitia pomocou Coxovho regresného modelu. Hepatology 7: 1346–1358. PMID 3679094 .

  • Popisuje použitie Coxovho modelu pomocou motivačného príkladu. Vynikajúci prehľad kľúčových aspektov analýzy modelu Cox, vrátane toho, ako vyhovovať modelu Cox a kontroly predpokladov modelu.

Grambsch PM, Therneau TM (1994) Testy proporcionálnych rizík a diagnostika na základe vážených zvyškov. Biometrika 81: 515–526.

  • Hĺbkový dokument o testovaní predpokladu proporcionálnych rizík. Dobrá kombinácia teórie a pokročilé štatistické vysvetlenie.

Ng’andu NH (1997) Empirické porovnanie štatistických testov na hodnotenie predpokladu proporcionálnych rizík podľa Coxovho modelu. Stat Med 16: 611–626. PMID 9131751 .

  • Ďalším podrobným dokumentom o testovaní predpokladu proporcionálnych rizík, ktorý sa zaoberá kontrolou zvyškov a účinkov cenzúry.

Parametrické metódy prežitia

Rodrίguez, G (2010). Parametrické modely prežitia. Dostupné z: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • krátke predstavenie najbežnejších distribúcií používaných v parametrickej analýze prežitia

Nardi A, Schemper M (2003). Porovnanie Coxových a parametrických modelov v klinických štúdiách. Štatistika Med 22 (23): 2597-610. PMID: 14652863

  • Poskytuje dobré príklady porovnania semi-parametrických modelov s modelmi pomocou bežných parametrických rozdelení a zameriava sa na posúdenie zhody modelu

Royston P, Parmar MK (2002). Flexibilné parametrické modely proporcionálnych rizík a modely proporcionálnych šancí pre údaje o prežívaní cenzúry s aplikáciou na prognostické modelovanie a odhad účinkov liečby. Stat Med 21 (15): 2175-97. PMID: 12210632

  • Dobré vysvetlenie základov proporcionálnych nebezpečenstiev a pravdepodobnostných modelov a porovnaní s kubickými spline

Cox C, Chu H, Schneider MF, Muñoz A (2007). Parametrická analýza prežitia a taxonómia nebezpečných funkcií pre zovšeobecnené rozdelenie gama. Statist Med 26: 4352–4374. PMID 17342754 .

  • Poskytuje vynikajúci prehľad o parametrických metódach prežitia vrátane taxonómie nebezpečných funkcií a podrobnej diskusie o zovšeobecnenej skupine gama distribúcie.

Crowther MJ, Lambert PC (2014). Všeobecný rámec pre parametrickú analýzu prežitia. Stat Med 33 (30): 5280-97. PMID: 25220693

  • Popisuje obmedzujúce predpoklady bežne používaných parametrických rozdelení a vysvetľuje obmedzenú metodiku kubického spline

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Parametrické modely prežitia pre intervalovo cenzurované údaje s časovo závislými premennými. Biometrics 7 (4): 599-614. PMID: 16597670

  • Rozšírenie a príklad toho, ako používať parametrické modely s intervalovo cenzurovanými údajmi

Časovo sa meniace kovovariáty

Fisher LD, Lin DY (1999). Časovo závislé premenné v Coxovom regresnom modeli proporcionálnych rizík. Annu Rev Public Health 20: 145-57. PMID: 10352854

  • Dôkladné a ľahko pochopiteľné vysvetlenie časovo premenných premenných v Coxových modeloch s matematickou prílohou

Petersen T (1986). Vybavenie parametrických modelov prežitia časovo závislými premennými. Appl Statist 35 (3): 281-88.

  • Hustý článok, ale s užitočným aplikovaným príkladom

Konkurenčná analýza rizík

Viď Konkurenčné riziká

Tai B, Machin D, White I, Gebski V (2001) Analýza konkurenčných rizík pacientov s osteosarkómom: porovnanie štyroch rôznych prístupov. Stat Med 20: 661–684. PMID 11241570 .

  • Dobrý podrobný dokument, ktorý popisuje štyri rôzne metódy analýzy údajov o konkurenčných rizikách a na porovnanie týchto štyroch prístupov využíva údaje z randomizovanej štúdie s pacientmi s osteosarkómom.

Checkley W, Brower RG, Muñoz A (2010). Vyvodenie vzájomne sa vylučujúcich konkurenčných udalostí prostredníctvom zmesi zovšeobecnených distribúcií gama. Epidemiológia 21 (4): 557–565. PMID 20502337 .

  • Príspevok o konkurenčných rizikách pomocou zovšeobecnenej distribúcie gama žiarenia.

Analýza zoskupených údajov a krehkých modelov

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Modely proporcionálnych rizík s náhodnými účinkami na preskúmanie účinkov centra v multicentrických klinických skúškach na rakovinu. Stat Methods Med Res 11: 221–236. PMID 12094756 .

  • Príspevok s vynikajúcim teoretickým a matematickým vysvetlením zohľadnenia zhlukovania pri analýze údajov o prežití z multicentrických klinických štúdií.

O’Quigley J, Stare J (2002) Proporcionálne modely rizík s krehkosťami a náhodnými účinkami. Stat Med 21: 3219–3233. PMID 12375300 .

  • Priame porovnanie krehkých modelov a modelov náhodných efektov.

Balakrishnan N, Peng Y (2006). Zovšeobecnený model krehkosti gama. Statist Med 25: 2797–2816. PMID

  • Príspevok o krehkých modeloch využívajúcich ako rozdelenie krehkých síl zovšeobecnené rozdelenie gama.

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: Balíček R na analýzu korelovaných údajov o prežití s ​​modelmi Frailty pomocou odhadu pravdepodobnosti alebo parametrického odhadu. Journal of Statistical Software 47 (4): 1-28.

  • Vigneta balíka R s dobrými základnými informáciami o krehkých modeloch.

Schaubel DE, Cai J (2005). Analýza zoskupených údajov o opakujúcich sa udalostiach s aplikáciou na mieru hospitalizácie u pacientov so zlyhaním obličiek. Biostatistika 6 (3): 404-19. PMID 15831581 .

  • Vynikajúci dokument, v ktorom autori prezentujú dve metódy analýzy klastrovaných údajov o opakujúcich sa udalostiach a potom porovnávajú výsledky navrhovaných modelov s výsledkami založenými na krehkom modeli.

Gharibvand L, Liu L (2009). Analýza údajov o prežití s ​​klastrovanými udalosťami. Príspevok SAS Global Forum 2009 z 237-2009.

  • Stručný a ľahko pochopiteľný zdroj pre analýzu údajov o čase do udalosti s klastrovanými udalosťami pomocou postupov SAS.

Analýza opakujúcich sa udalostí

Twisk JW, Smidt N, de Vente W (2005). Aplikovaná analýza opakujúcich sa udalostí: praktický prehľad. J Epidemiol Community Health 59 (8): 706-10. PMID: 16020650

  • Veľmi ľahko pochopiteľný úvod do modelovania opakujúcich sa udalostí a koncepcie súborov rizík

Villegas R, Juliá O, Ocaña J (2013). Empirická štúdia korelovaného času prežitia pre opakujúce sa udalosti s proporcionálnymi hranicami rizika a účinkom korelácie a cenzúry. BMC Med Res Methodol 13:95. PMID: 23883000

  • Používa simulácie na testovanie robustnosti rôznych modelov pre údaje o opakujúcich sa udalostiach

Kelly PJ, Lim LL (2000). Analýza prežitia pre údaje o opakujúcich sa udalostiach: aplikácia na detské infekčné choroby. Stat Med 19 (1): 13-33. PMID: 10623190

  • Aplikované príklady štyroch hlavných prístupov k modelovaniu údajov o opakujúcich sa udalostiach

Wei LJ, Lin DY, Weissfeld L (1989). Regresná analýza mnohorozmerných neúplných údajov o čase zlyhania modelovaním okrajových distribúcií. Journal of the American Statistical Association84 (108): 1065-1073

Pôvodný článok popisujúci marginálne modely pre analýzu rekurentných udalostí

Kurzy

Letný inštitút pre epidemiológiu a zdravie populácie na Kolumbijskej univerzite (EPIC)

Statistical Horizons, súkromný poskytovateľ špecializovaných štatistických seminárov organizovaných odborníkmi v tejto oblasti

Medziuniverzitné konzorcium pre politický a sociálny výskum (ICPSR), letný program kvantitatívnych metód sociálneho výskumu, súčasť Inštitútu pre sociálny výskum na University of Michigan

  • Trojdňový seminár o analýze prežitia, modelovaní histórie udalostí a analýze trvania ponúkaný v dňoch 22. - 24. júna 2015 v Berkeley v Kalifornii, vedený Tenkom Raykovom z Michiganskej štátnej univerzity. Komplexný prehľad metód prežitia v rôznych odboroch (nielen v oblasti verejného zdravia): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

Inštitút pre štatistický výskum ponúka dva online kurzy analýzy prežitia, ktoré sa ponúkajú niekoľkokrát do roka. Tieto kurzy vychádzajú z učebnice Aplikovaná analýza od Kleina a Kleinbauma (pozri nižšie) a môžu sa absolvovať a la carte alebo ako súčasť certifikačného programu v štatistike:

Inštitút pre digitálny výskum a vzdelávanie na UCLA ponúka to, čo nazývajú semináre, prostredníctvom svojej webovej stránky na analýzu prežitia v rôznych štatistických softvéroch. Tieto semináre ukazujú, ako vykonávať aplikovanú analýzu prežitia so zameraním viac na kód ako na teóriu.

Zaujímavé Články

Redakcia Choice

Larysa Kondracki '01 (GS) na Mini-sériu Direct, Picnic at Hanging Rock
Larysa Kondracki '01 (GS) na Mini-sériu Direct, Picnic at Hanging Rock
Alumna Larysa Kondracki '01 režíruje tri epizódy očakávaného televízneho miniseriálu Piknik na Hanging Rock, ktorý bude mať premiéru v máji 2018.
Magyar Jeti Zrt v. Maďarsko
Magyar Jeti Zrt v. Maďarsko
Globálna sloboda prejavu v Kolumbii sa usiluje o lepšie porozumenie medzinárodným a národným normám a inštitúciám, ktoré najlepšie chránia voľný tok informácií a prejavu v prepojenom globálnom spoločenstve s hlavnými spoločnými výzvami. Na splnenie svojho poslania globálna sloboda prejavu realizuje a zadáva výskumné a politické projekty, organizuje podujatia a konferencie a zúčastňuje sa globálnych diskusií o ochrane slobody prejavu a informácií v 21. storočí a prispieva k nim.
The Online Citizen Pte Ltd v. Generálny prokurátor
The Online Citizen Pte Ltd v. Generálny prokurátor
Globálna sloboda prejavu v Kolumbii sa snaží lepšie porozumieť medzinárodným a národným normám a inštitúciám, ktoré najlepšie chránia voľný tok informácií a prejavu v vzájomne prepojenom globálnom spoločenstve s hlavnými spoločnými výzvami. Na splnenie svojho poslania globálna sloboda prejavu realizuje a zadáva výskumné a politické projekty, organizuje podujatia a konferencie a zúčastňuje sa globálnych diskusií o ochrane slobody prejavu a informácií v 21. storočí a prispieva k nim.
Po zotavení zostáva riziko reinfekcie koronavírusmi
Po zotavení zostáva riziko reinfekcie koronavírusmi
Nový výskum expertov z Columbia Health University School of Public Health zistil, že reinfekcie endemickými koronavírusmi nie sú nezvyčajné ani do jedného roka od predchádzajúcej infekcie. Štúdia zameraná na štyri endemické koronavírusy - okrem vírusu SARS-CoV-2, ktorý spôsobuje COVID-19 - zistila, že keď došlo k reinfekcii, nespájala sa s menej závažnými príznakmi.
CEO spoločnosti Antena 3 v. Extraconfidencial, S.L.
CEO spoločnosti Antena 3 v. Extraconfidencial, S.L.
Globálna sloboda prejavu v Kolumbii sa usiluje o lepšie porozumenie medzinárodným a národným normám a inštitúciám, ktoré najlepšie chránia voľný tok informácií a prejavu v prepojenom globálnom spoločenstve s hlavnými spoločnými výzvami. Na splnenie svojho poslania globálna sloboda prejavu realizuje a zadáva výskumné a politické projekty, organizuje podujatia a konferencie a zúčastňuje sa globálnych diskusií o ochrane slobody prejavu a informácií v 21. storočí a prispieva k nim.
'Kodachrome' Režíroval Alumnus Mark Raso ‘12 Premiéra na Netflixe
'Kodachrome' Režíroval Alumnus Mark Raso ‘12 Premiéra na Netflixe
Kodachrome, ktorý režíroval Alumnus Mark Raso ’12, mal premiéru minulý týždeň ako originálna produkcia Netflixu. Kliknite sem a pozrite si oficiálny trailer.
Boot Camp NIH Grant Writing: Budovanie silného základu pre financovanie úspechu
Boot Camp NIH Grant Writing: Budovanie silného základu pre financovanie úspechu
Kurz 19. - 20. júla je plný! Pripojte sa k nasledujúcemu živému prenosovému táboru NIH Grant Writing Boot Camp: 8. - 9. novembra 2021. NIH Grant Writing Boot Camp je dvojdňový intenzívny výcvikový tábor, ktorý kombinuje prednášky, praktické aktivity a diskusie s cieľom demystifikovať proces žiadosti o NIH. Toto školenie pripraví účastníkov na predloženie návrhu grantu NIH, z ktorého sa stane recenzent