© Copyright StatSoft, Inc., 1984-2011
Przeszukaj Internetowy Podręcznik Statystyki
Analiza przeżycia


Ogólne informacje

Techniki te początkowo były rozwijane w naukach medycznych i biologicznych, ale obecnie są stosowane również w naukach społecznych i ekonomicznych, a także w inżynierii.

Wyobraźmy sobie, że badamy skuteczność nowej terapii w przypadku generalnie nieuleczalnej choroby. Główną interesującą nas zmienną będzie liczba dni, którą przeżyją pacjenci. Zasadniczo w celu opisania przeciętnego przeżycia i porównania nowej terapii z metodami tradycyjnymi, można by wykorzystać standardowe statystyki parametryczne lub nieparametryczne (patrz Podstawowe statystyki oraz Statystyki nieparametryczne ). Jednakże przy końcu badania pozostaną pacjenci, którzy przeżyli cały okres obserwacji, w szczególności wywodzący się spośród pacjentów, którzy przybyli do szpitala (i zostali objęci projektem badawczym) w późniejszym etapie badań; będą także tacy pacjenci, z którymi straciliśmy kontakt. Z pewnością nie chcielibyśmy wykluczyć wszystkich tych pacjentów z naszych badań przez przypisanie im braków danych (ponieważ większość z nich to ci, którzy pozostaną przy życiu, a zatem odzwierciedlają oni powodzenie nowej metody terapii). Takie obserwacje, które zawierają tylko częściową informację, nazywa się obserwacjami uciętymi (np. "pacjent A przeżył co najmniej 4 miesiące zanim został wypisany i straciliśmy z nim kontakt"). Terminu censoring (ucinanie) użył po raz pierwszy Hald, 1949.
Indeks

Obserwacje ucięte

Ogólnie, obserwacje ucięte, pojawiają się wtedy, gdy interesująca nas zmienna zależna odzwierciedla czas do ostatecznego zdarzenia, a okres badań jest ograniczony w czasie. Obserwacje ucięte mogą pojawić się w wielu dziedzinach badań. Na przykład w naukach społecznych możemy badać przeżycie małżeństw, okres edukacji szkolnej (czas do opuszczenia szkoły), wymianę kadr w organizacjach itd. W każdym przypadku na końcu okresu badania część osobników pozostanie w stanie małżeńskim, nie opuści szkoły, będzie nadal pracowała w tym samym przedsiębiorstwie; zatem osobnicy ci reprezentują obserwacje ucięte.

W ekonomii możemy badać "przeżycie" nowych firm lub czasy "przeżycia" takich produktów jak samochody. W badaniach kontroli jakości powszechnie studiuje się "przeżycie" części poddanych naprężeniom (analiza czasu bezawaryjności).
Indeks

Techniki analityczne

Zasadniczo metody analizy przeżycia odnoszą się do takich samych pytań badawczych, jak w przypadku wielu innych procedur; jednakże wszystkie metody w analizie przeżycia mogą operować na danych uciętych . Tablice trwania życia, rozkład przeżycia oraz estymacja funkcji przeżycia Kaplana-Meiera to metody służące do estymacji rozkładu czasów przeżycia na podstawie próby. Dołączono także kilka technik do porównania przeżycia w dwóch lub więcej grupach. Wreszcie, analiza przeżycia zawiera kilka modeli regresji do estymacji zależności (wielokrotnych) zmiennych ciągłych z czasami przeżycia.
Indeks

Analiza tablic trwania życia

Najprościej opisać czas przeżycia w próbie obliczając Tablicę trwania życia. Technika oparta na tablicach trwania życia jest jedną z najstarszych metod analizy danych dotyczących przeżycia (czasu bezawaryjności); np. patrz Berkson i Gage, 1950; Cutler i Ederer, 1958; Gehan, 1969. Tablicę taką można traktować jako rozbudowaną tablicę rozkładu liczności. Rozkład czasów przeżycia dzieli się na pewną liczbę przedziałów. Dla każdego przedziału możemy obliczyć liczbę i proporcję przypadków lub obiektów, które weszły do danego przedziału "żywe", liczbę i proporcję przypadków, które uległy awarii w danym przedziale (tzn. liczbę ostatecznych zdarzeń lub liczbę przypadków, które "wymarły") oraz liczbę przypadków utraconych lub uciętych w danym przedziale.

W oparciu o te liczby i proporcje oblicza się kilka dodatkowych statystyk:

Liczba przypadków zagrożonych.Jest to liczba przypadków, które weszły do danego przedziału żywe minus połowa liczby przypadków utraconych lub uciętych w danym przedziale.

Proporcja przypadków ulegających awarii.Proporcję tę oblicza się jako stosunek liczby przypadków wymierających w danym przedziale do liczby przypadków zagrożonych w tym przedziale.

Proporcja przypadków przeżywających.Proporcję tę oblicza się jako 1 minus proporcja przypadków wymierających.

Skumulowana proporcja przeżywających (Funkcja przeżycia). Jest to skumulowana proporcja przypadków przeżywających aż do danego przedziału. Ponieważ zakłada się, że prawdopodobieństwa przeżycia są niezależne w kolejnych przedziałach, prawdopodobieństwo to oblicza się przez wymnożenie prawdopodobieństw przeżycia ze wszystkich poprzednich przedziałów. Wynikową funkcję nazywa się także przeżyciem lub funkcją przeżycia.

Gęstość prawdopodobieństwa. Jest to oszacowane prawdopodobieństwo defektu w danym przedziale obliczone w jednostce czasu, to jest:

Fi = (Pi-Pi+1) /hi

W powyższym wzorze, Fi oznacza odpowiednią gęstość prawdopodobieństwa w i-tym przedziale, Pi to oszacowana skumulowana proporcja przeżywających na początku i-tego przedziału (na końcu przedziału i-1 ), Pi+1 to skumulowana proporcja przeżywających przy końcu przedziału i, a hi to szerokość danego przedziału.

Stopa hazardu. Stopę hazardu (terminu użył po raz pierwszy Barlow, w roku 1963) definiuje się jako prawdopodobieństwo na jednostkę czasu, że przypadek, który przeżył do początku danego przedziału ulegnie w tym przedziale awarii. W szczególności oblicza się ją jako liczbę przypadków awarii w jednostkach czasu w danym przedziale, podzieloną przez przeciętną liczbę przypadków przeżywających w środku przedziału.

Mediana czasu przeżycia. Jest to czas przeżycia, w którym skumulowana funkcja przeżycia jest równa 0.5. Odpowiednio można policzyć inne percentyle (percentyl 25 i 75) skumulowanej funkcji przeżycia. Zauważmy, że 50 percentyl (mediana) skumulowanej funkcji przeżycia zazwyczaj nie jest tym samym punktem w czasie, do którego przeżyło 50% próby. (Byłoby tak tylko wtedy, gdyby w czasie poprzedzającym nie było żadnych obserwacji uciętych ).

Wymagane wielkości prób. Aby otrzymać rzetelne oszacowania trzech głównych funkcji (przeżycia, gęstości prawdopodobieństwa i hazardu) oraz ich błędy standardowe, w każdym przedziale czasowym minimalna zalecana wielkość próby powinna wynosić 30.
Indeks

Dopasowanie rozkładu

Ogólne informacje. Generalnie, tablica trwania życia dobrze pokazuje rozkład awarii w czasie. Jednak dla celów predykcyjnych często pożądana jest znajomość kształtu podstawowej funkcji przeżycia w populacji. Do modelowania czasów przeżycia lub bezawaryjności zaproponowano głównie rozkłady wykładniczy (i liniowo wykładniczy), rozkład Weibulla zdarzeń ekstremalnych oraz rozkład Gompertza.

Estymacja. Procedura estymacji parametrów (w przypadku estymacji parametrów teoretycznych funkcji przeżycia) opiera się zasadniczo na algorytmie regresji liniowej najmniejszych kwadratów (patrz Gehan i Siddiqui, 1973). Można stosować algorytm regresji liniowej, ponieważ wszystkie cztery rozkłady teoretyczne dają się sprowadzić do liniowych przez odpowiednie przekształcenia. Przekształcenia takie dają czasem różne wariancje reszt dla różnych okresów, co prowadzi do estymatorów obciążonych.

Dobroć dopasowania. Mając parametry różnych funkcji rozkładu i odpowiedni model możemy obliczyć wiarygodność danych. Można także obliczyć wiarygodność danych przy modelu zerowym, to znaczy takim modelu, który dopuszcza różne stopy hazardu w poszczególnych przedziałach. Nie wchodząc w szczegóły, obie wiarygodności można porównać przy pomocy przyrostowej statystyki testowej chi-kwadrat . Jeśli statystyka ta jest istotna statystycznie, to wnioskujemy, że dany rozkład teoretyczny pasuje do danych istotnie gorzej niż model zerowy. Wtedy odrzucamy testowany rozkład jako model naszych danych.

Wykresy. Można tworzyć wykresy funkcji przeżycia, hazardu i gęstości prawdopodobieństwa dla danych obserwowanych oraz dla odpowiednich rozkładów teoretycznych. Wykresy te pozwalają na szybkie wizualne sprawdzenie dobroci dopasowania rozkładu teoretycznego. Umieszczony poniżej, przykładowy wykres pokazuje funkcję przeżycia dla danych obserwowanych i dopasowany do niej rozkład Weibulla .

Wyszczególnione trzy linie na powyższym wykresie obrazują teoretyczne rozkłady, będące wynikiem trzech różnych procedur estymacyjnych (najmniejszych kwadratów oraz dwóch metod ważonych najmniejszych kwadratów).

Estymator Kaplana-Meiera

Zamiast klasyfikować obserwowane czasy przeżycia w postaci tablicy trwania życia możemy szacować funkcję przeżycia bezpośrednio z ciągłych czasów przeżycia lub bezawaryjności. Wyobraźmy sobie, że tworzymy tablicę trwania życia, tak że każdy przedział czasowy zawiera dokładnie jeden przypadek. Mnożąc kolejne prawdopodobieństwa przeżycia z tych przedziałów (tzn. dla każdej pojedynczej obserwacji) otrzymujemy funkcję przeżycia:

S(t) = jt= 1 [(n-j)/(n-j+1)]( j )

W równaniu tym, S(t) to oszacowana funkcja przeżycia, n to całkowita liczba przypadków, a oznacza iloczyn wszystkich przypadków mniejszych lub równych t; (j) to stała, która wynosi 1, jeśli j-ty przypadek jest nie ucięty (kompletny) lub 0, jeśli jest ucięty . Ten estymator funkcji przeżycia nazywa się także estymatorem limitu iloczynowego i po raz pierwszy został wprowadzony przez Kaplana i Meiera (1958). Poniżej znajduje się przykładowy wykres omawianej funkcji.

Przewaga metody Kaplana-Meiera nad metodą tablic trwania życia w przypadku analizy danych dotyczących czasu przeżycia lub bezawaryjności polega na tym, że uzyskiwane oceny nie zależą od grupowania danych (w pewną liczbę przedziałów czasowych). Metoda Kaplana-Meiera i metoda tablic trwania życia są identyczne, jeśli przedziały tablicy trwania życia zawierają najwyżej po jednej obserwacji.

Indeks

Porównanie prób

Ogólne informacje. Można porównywać czasy przeżycia lub bezawaryjności w dwóch lub więcej próbach. Zasadniczo, ponieważ czasy przeżycia nie podlegają rozkładowi normalnemu, powinno się stosować testy nieparametryczne, które są oparte na porządku rangowym czasów przeżycia. W celu porównania czasów przeżycia można wykorzystać obszerny zestaw testów nieparametrycznych, jednakże testy te nie mogą operować na obserwacjach uciętych .

Dostępne testy.Analiza przeżycia zawiera pięć różnych (najczęściej nieparametrycznych) testów dla danych uciętych: uogólnienie Gehana testu Wilcoxona, test Coxa-Mantela, test F Coxa, test log-rank (logarytmiczny rang) oraz uogólnienie Peto i Peto testu Wilcoxona. Dostępny jest także test nieparametryczny do porównywania wielu grup. Większości tych testów towarzyszą odpowiednie wartości z (wartości standardowego rozkładu normalnego); wartości z można wykorzystać do testowania istotności statystycznej wszelkich różnic między grupami. Jednakże zauważmy, że większość z tych testów daje rzetelne wyniki tylko przy odpowiednio dużych próbach, natomiast efektywność testów przy małych próbach jest mniej poznana.

Wybór testu dla dwóch prób. Nie ma powszechnie akceptowanych zasad wyboru testu w danej sytuacji. Test F Coxa wydaje się być mocniejszy niż uogólnienie Gehana testu Wilcoxona, gdy:

  1. Próby są małe (tzn. n na grupę mniejsze niż 50);
  2. Próby pochodzą z rozkładu wykładniczego lub Weibulla ;
  3. Nie ma obserwacji uciętych (patrz Gehan i Thomas, 1969).
Lee, Desu i Gehan (1975) porównali test Gehana z kilkoma innymi i pokazali, że test Coxa-Mantela i test log-rank są mocniejsze (bez względu na ucinanie), gdy próby zostały pobrane z populacji o rozkładzie wykładniczym lub Weibulla ; przy takich założeniach występuje mała różnica między testem Coxa-Mantela a testem log-rank. Problem mocy różnych testów bardziej szczegółowo rozważa Lee (1980).

Test dla wielu prób. Test dla wielu prób jest rozwinięciem (uogólnieniem) testu Gehana, testu Peto i Peto oraz testu log-rank. Najpierw przy zastosowaniu procedury Mantela (Mantel, 1967) każdemu czasowi przeżycia przypisuje się punkty; następnie oblicza się wartość statystyki chi-kwadrat w oparciu o sumy (dla każdej grupy) tych punktów. Jeśli mamy tylko dwie grupy, to test ten jest równoważny testowi Gehana i w tym przypadku stosowany będzie domyślnie właśnie ten test.

Nierówne proporcje danych uciętych. Przy porównywaniu dwóch lub więcej grup bardzo ważne jest zbadanie liczby obserwacji uciętych w każdej grupie. Szczególnie w badaniach medycznych ucinanie może być wynikiem na przykład zastosowania różnych terapii: pacjenci, którzy w wyniku leczenia szybciej dochodzą do zdrowia lub stan ich się pogarsza, mogą być bardziej skłonni do opuszczenia grupy badanej, co spowoduje różne liczby obserwacji uciętych w każdej grupie. Takie systematyczne ucinanie może poważnie obciążyć wyniki porównania.

Indeks

Modele regresji Ogólne informacje

Typowe pytanie badawcze stawiane w badaniach medycznych, biologicznych czy inżynieryjnych (czas bezawaryjności) dotyczy rozstrzygnięcia, czy pewne zmienne ciągłe (niezależne) są skorelowane z czasami przeżycia lub bezawaryjności. Z dwóch głównych powodów ta kwestia badawcza nie może być przedmiotem prostych technik regresji wielokrotnej (dostępnych w Regresji wielokrotnej ): Po pierwsze, interesująca zmienna zależna (czas przeżycia/bezawaryjności) przeważnie nie ma rozkładu normalnego, co jest poważnym naruszeniem założeń regresji wielokrotnej przeprowadzanej zwykłą metodą najmniejszych kwadratów. Czasy przeżycia mają zazwyczaj rozkład wykładniczy lub Weibulla . Po drugie, występuje problem wykorzystania obserwacji uciętych , co oznacza, że pewne obserwacje będą niekompletne.

Model proporcjonalnego hazardu Coxa

Model proporcjonalnego hazardu jest najbardziej ogólnym z modeli regresji, ponieważ nie jest on oparty na jakichkolwiek założeniach dotyczących natury lub kształtu rozkładu czasu przeżycia. Model zakłada, że podstawowa stopa hazardu (raczej niż czas przeżycia) jest funkcją zmiennych niezależnych (zmiennych objaśniających). Nie przyjmuje się żadnych założeń o naturze lub kształcie funkcji hazardu. Zatem w pewnym sensie model regresji Coxa można traktować jako metodę nieparametryczną. Model można zapisać jako:

h{(t), (z1, z2, ..., zm)} = h0(t)*exp(b1*z1 + ... + bm*zm)

gdzie h(t,...) oznacza wynikowy hazard przy danych wartościach m zmiennych objaśniających dla przypadku (z1, z2, ..., zm) i czasu przeżycia (t). Składnik h0(t) nazywa się hazardem bazowym. Jest to hazard dla danej jednostki, gdy wszystkie wartości zmiennych niezależnych są równe zero. Model taki można zlinearyzować przez podzielenie obu stron równania przez h0(t) a następnie przez zastosowanie logarytmu naturalnego po obu stronach równania:

log[h{(t), (z...)}/h0(t)] = b1*z1 + ... + bm*zm

Otrzymujemy w ten sposób prosty model liniowy, który można bez trudu estymować.

Założenia. O ile nie uczyniono żadnych założeń co do kształtu podstawowej funkcji hazardu, to równania modelu podane powyżej kryją w sobie dwa założenia. Po pierwsze, określają one multiplikatywną zależność między ukrytą funkcją hazardu a log-liniową funkcją zmiennych objaśniających. Założenie to nazywa się także założeniem proporcjonalności. Praktycznie rzecz biorąc, zakłada się, że dla dwóch obserwacji o różnych wartościach dla zmiennych niezależnych, stosunek funkcji hazardu dla tych dwóch obserwacji nie zależy od czasu. Drugie założenie mówi oczywiście, że istnieje log-liniowa zależność między zmiennymi niezależnymi a ukrytą funkcją hazardu.

Model proporcjonalnego hazardu Coxa ze zmiennymi objaśniającymi zależnymi od czasu

W modelu proporcjonalnego hazardu zakłada się, że funkcja hazardu dla jednostki (tzn. obserwacji w analizie) zależy od wartości zmiennych objaśniających (ang. covariates) i wartości hazardu bazowego. Dla dwóch jednostek o określonych wartościach zmiennych objaśniających stosunek estymowanych wartości hazardu w czasie będzie stały -- stąd nazwa metody: model proporcjonalnego hazardu. Trafność takiego założenia może być często sporna. Na przykład w badaniach zdrowia fizycznego często uwzględnia się wiek. Załóżmy, że badamy przeżycie po operacji. Prawdopodobne jest, że wiek jest ważniejszym predyktorem ryzyka bezpośrednio po operacji niż jakiś czas po operacji (po początkowej poprawie). W przyśpieszonych próbach trwałości często stosuje się zmienną objaśniającą określającą naprężenie (np. wielkość napięcia), które powoli zwiększa się w czasie aż do pojawienia się awarii (np. aż zepsuje się izolacja elektryczna; patrz Lawless, 1982, str. 393). W takim przypadku wpływ zmiennej objaśniającej wyraźnie zależy od czasu. Użytkownik może określić wyrażenia arytmetyczne definiujące zmienne objaśniające jako funkcje kilku zmiennych i czasu przeżycia.

Testowanie założenia proporcjonalności. Jak pokazano w poprzednich przykładach, istnieje wiele zastosowań, gdzie możliwe jest niedotrzymanie założenia proporcjonalności. W takim przypadku można bezpośrednio zdefiniować zmienne objaśniające jako funkcje czasu. Na przykład zbiór danych zaprezentowany przez Pikea (1966) składa się z czasów przeżycia dla dwóch grup szczurów, które wystawiono na działanie substancji rakotwórczych (patrz także Lawless, 1982, str. 393, gdzie znajduje się podobny przykład). Załóżmy, że z jest zmienną grupującą o kodach 1 i 0 wskazującą, czy dany szczur był wystawiony na działanie, czy nie. Można następnie oszacować następujący model proporcjonalnego hazardu:

h(t,z) = h0(t)*exp{b1*z + b2*[z*log(t)-5.4]}

Zatem w powyższym modelu, warunkowy hazard w czasie t jest funkcją (1) hazardu bazowego h0, (2) zmiennej objaśniającej z oraz (3) z razy logarytm czasu. Zauważmy, że stałą 5.4 zastosowano tu jedynie w celu skalowania: średnia logarytmu czasów przeżycia w zbiorze danych wynosi 5.4. Innymi słowy, warunkowy hazard w każdym punkcie czasu jest funkcją zmiennej objaśniającej i czasu; zatem wpływ zmiennej objaśniającej na przeżycie zależy od czasu; stąd nazwa zmiennej objaśniającej zależnej od czasu. Model taki umożliwia w szczególności testowanie założenia proporcjonalności. Jeśli parametr b2 jest istotny statystycznie (np. jest co najmniej dwa razy taki, jak jego błąd standardowy), to można powiedzieć, że rzeczywiście wpływ zmiennej objaśniającej (z) na przeżycie zależy od czasu, a także, w konsekwencji, założenie proporcjonalności nie jest spełnione.

Regresja wykładnicza

Model ten zakłada, że rozkład czasu przeżycia jest wykładniczy i uwarunkowany wartościami zbioru zmiennych niezależnych (zi). Parametr stosunkowy rozkładu wykładniczego można wyrazić jako:

S(z) = exp(a + b1*z1 + b2*z2 + ... + bm*zm)

S(z) oznacza czasy przeżycia, a jest stałą, a bito współczynniki regresji.

Dobroć dopasowania. Wartość miary dobroci dopasowania chi-kwadrat oblicza się jako funkcję logarytmu wiarogodności dla modelu z wszystkimi ocenami parametrów (L1) i logarytmu wiarogodności modelu, w którym do wszystkich zmiennych objaśniających podstawiono 0 (zero; L0). Jeśli wartość chi-kwadrat jest istotna, odrzucamy hipotezę zerową i zakładamy, że zmienne niezależne są istotnie związane z czasami przeżycia.

Standardowa wykładnicza statystyka pozycyjna. Jeden ze sposobów sprawdzenia założenia o wykładniczej postaci modelu polega na wykreśleniu resztowych czasów przeżycia względem standardowej wykładniczej statystyki pozycyjnej teta. Jeśli założenie o wykładniczej postaci jest spełnione, to wszystkie punkty na tym wykresie zostaną rozmieszczone w przybliżeniu na linii prostej.

Regresja normalna i log-normalna

W modelu tym zakłada się, że czasy przeżycia (lub logarytmy czasów przeżycia) pochodzą z rozkładu normalnego ; model wynikowy jest identyczny z modelem typowej regresji wielokrotnej i może być ujęty jako:

t = a + b1*z1 + b2*z2 + ... + bm*zm

gdzie t oznacza czasy przeżycia. Jeśli wywołamy regresję log-normalną, to t zostaje zastąpione przez jego logarytm naturalny. Normalny model regresji jest szczególne przydatny, ponieważ wiele zbiorów danych można przekształcić tak, by dały aproksymacje rozkładu normalnego. Zatem w pewnym sensie jest to najbardziej ogólny, w pełni parametryczny model (w odróżnieniu od modelu proporcjonalnego hazardu Coxa, który jest nieparametryczny) i pozwala otrzymać estymatory dla wielu różnych, branych pod uwagę rozkładów przeżycia.

Dobroć dopasowania.Wartość chi-kwadrat oblicza się jako funkcję logarytmu wiarygodności dla modelu z wszystkimi zmiennymi niezależnymi (L1) i logarytmu wiarygodności modelu, w którym do wszystkich zmiennych niezależnych podstawiono 0 (zero, L0).

Analizy warstwowe

Celem analizy warstwowej jest testowanie hipotezy, czy identyczne modele regresji są właściwe dla różnych grup, to znaczy, czy zależność między zmiennymi niezależnymi a przeżyciem jest identyczna w różnych grupach. Jeśli zażyczymy sobie wykonania analizy warstwowej, moduł analizy przeżycia najpierw dopasuje odpowiedni model regresji oddzielnie w ramach każdej grupy. Suma logarytmów wiarygodności tych analiz odzwierciedla logarytm wiarygodności modelu z różnymi współczynnikami regresji (i wyrazami wolnymi tam gdzie są stosowne) w różnych grupach. Następnie program dopasuje żądany model regresji do wszystkich danych w zwykły sposób (tzn. pomijając przynależność do grupy) i obliczy logarytm wiarygodności tego całkowitego dopasowania. Różnica między logarytmami wiarygodności zostanie następnie wykorzystana do testowania istotności (przy pomocy statystyki chi-kwadrat ).




© Copyright StatSoft, Inc., 1984-2011
STATISTICA is a trademark of StatSoft, Inc.