Estymator Kaplana-Meiera – używany w statystycznej analizie przeżycia estymator prognozujący funkcję przeżycia. W badaniach medycznych może być użyty np. do przewidywania frakcji pacjentów, którzy przeżyją określony czas po operacji. Ekonomista może szacować czas jaki ludzie pozostają bezrobotni po utracie pracy. Inżynier może mierzyć czas do awarii urządzenia.
Wykres estymaty Kaplana-Meiera funkcji przeżycia składa się z szeregu poziomych odcinków, schodzących coraz niżej (funkcja schodkowa). Coraz większa próba statystyczna powoduje powstanie coraz większej liczby coraz krótszych odcinków, w granicy dążąc do prawdziwej funkcji przeżycia.
Ważną zaletą estymatora Kaplana-Meiera jest branie pod uwagę obserwacji cenzorowanych – braków danych od pewnego momentu czasu, różnego dla każdego obserwowanego obiektu (np. w przypadku odejścia pacjenta ze szpitala, utraty kontaktu z badanym itp.).
W statystyce medycznej typowe zastosowanie może obejmować podział pacjentów na grupy różniące się tylko jedną cechą, np. występowaniem określonego genu, albo podawaniem innego leku. Na wykresie pacjenci z grupy B umierają znacznie szybciej niż z grupy A. Po dwóch latach 80% pacjentów z grupy A ciągle żyje, a z grupy B mniej niż połowa.
Obliczanie
Niech będzie prawdopodobieństwem, że element populacji przeżyje co najmniej Uporządkujmy -elementową próbę z tej populacji według czasu przeżycia:
Z każdym związana jest liczba tych, o których wiemy, że dożyli do tego momentu oraz liczba śmierci w momencie Warto zauważyć, że odległości pomiędzy kolejnymi momentami zwykle nie będą stałe. Na przykład jeśli rozpatrujemy 10 przypadków, ze śmiercią w dniu 3, utratą kontaktu (obserwacja cenzorowana) w dniu 9 i kolejną śmiercią w dniu 11, to wówczas:
Estymator Kaplana-Meiera to nieparametryczny estymator największej wiarygodności Jest to iloczyn postaci:
Alternatywną, używaną niekiedy definicją jest:
Definicje różnią się tylko warunkiem na czas. W pierwszej estymator jest funkcją lewostronnie ciągłą, a w drugiej funkcją prawostronnie ciągłą.
Niech będzie zmienną losową mierzącą czas życia a jej dystrybuantą. Wówczas:
Stąd definicja z ciągłością prawostronną może być preferowana, gdy chcemy uzyskać prawostronnie ciągłą estymatę dystrybuanty.
Wariancja
Stworzono wiele różnych wzorów dla celów estymacji wariancji estymatora Kaplana-Meiera. Jednym z najczęściej używanych jest wzór Greenwooda:
Porównywanie estymat
W niektórych przypadkach potrzebne jest porównanie dwóch różnych krzywych przeżycia otrzymanych z estymatora Kaplana-Meiera. Można to zrobić na wiele sposobów, w szczególności:
- test Coxa
- test Coxa-Mantela
- logarytmiczny test rang (ang. log-rank test)
- uogólnienie Gehana testu Wilcoxona
- uogólnienie Peto i Peto testu Wilcoxona.
Bibliografia
- Kaplan E.L., Meier Paul, „Nonparametric estimation from incomplete observations”. J. Am. Stat. Assoc. 53, s. 457–481 (1958).
- Kaplan E.L na temat tej pracy w „This week’s citation classic”. Current Contents 24, s. 14 (1983). Dostępne w UPenn jako PDF.
- Greenwood M., The natural duration of cancer. Reports on Public Health and Medical Subjects. London: Her Majesty’s Stationery Office 1926; 33: s. 1–26.
Linki zewnętrzne
- Przykład estymacji Kaplana-Meiera w czasie rzeczywistym w Javie (ang.)
- Obliczanie krzywych Kaplana-Meiera autorstwa Steve Dunn. cancerguide.org. [zarchiwizowane z tego adresu (2019-06-17)]. (ang.).
- Kalkulator MTBF (ang.)