Recepta na statystyke,
czyli analiza danych w badaniach medycznych
18-19 maja 2011


Badania biomedyczne czyli o sztuce zadawania ważnych pytań i poszukiwaniu wiarygodnych odpowiedzi

„Nie istnieje droga na skróty do miejsca,
do którego dojść warto“
(Beverly Sills).

W ostatnich latach, mimo wielkiego postępu technik molekularnych, które dostarczają nam wciąż nowych narzędzi do poznawania prawd biomedycznych, często zapominamy o ostatecznym celu prowadzonych badań, jakim powinno pozostać dobro chorego.

W tradycyjnym, hipokratejskim rozumieniu, lekarz w każdych okolicznościach powinien służyć chorej osobie, przedkładając jej dobro ponad wszystko. Tymczasem, podstawową zasadą etyki badań naukowych jest służba i podporządkowanie poszukiwaniu prawdy. Coraz większe znaczenie nauki w rozwiązywaniu problemów medycznych prowadzi do sytuacji, w której konieczne staje się stworzenie nowego paradygmatu nauk biomedycznych. Można by zaryzykować tezę, iż nauka medyczna, powinna w pierwszym rzędzie służyć choremu, a poszukiwanie prawdy powinno być nie celem, a podstawowym narzędziem. Teza ta jest naturalnie i podświadomie akceptowana przez naukowców, pracujących w dziedzinach biomedycznych. O ile jednak służba choremu jest bezwarunkowo wpisana w misję lekarza, o tyle droga naukowca do chorego jest bardziej skomplikowana. Często obejmuje swoistą „podróż“ i wiedzie z laboratorium do łóżka chorego, jednak tu się nie kończy, prowadząc dalej, często z powrotem do laboratorium. Uporządkowania tej drogi dokonuje właśnie, nazwana niedawno, choć istniejącą od początku badań biomedycznych – medycyna translacyjna. Najważniejszym elementem badań biomedycznych jest umiejętność stawiania „ważnych” pytań i poszukiwanie na nie odpowiedzi wyłącznie za pomocą wiarygodnych metod. O ile zdefiniowanie ważnego pytania jest dość trudne, a uprościć je może np. świadomość czy odpowiedź na pytanie zwiększy przeżycie pacjentów, to ocena wiarygodności zastosowanych metod jest ściśle związana z umiejętnością stosowania statystyki. Prawidłowe stosowanie metod statystycznych w badaniach biomedycznych jest najważniejszym warunkiem nie tylko wiarygodności uzyskanych wyników lecz także poprzez stosowanie odpowiedniego podejścia statystycznego na etapie planowania badań – niejednokrotnie warunkiem odpowiedniego doboru grupy badanej. Stąd nauczanie statystyki staje się kluczowym elementem wykształcenia uczonych, który jednak nadal pozostaje w sposób niewystarczający doceniany. Świadomość, iż ostatecznym celem jaki stawiamy sobie nie jest po prostu publikowanie pracy, lecz właśnie dobro chorego nakłada na nas uczonych szczególny obowiązek dbałości o wiarygodność wyników i analiz który umożliwia nam rozumne stosowanie właśnie biostatystyki.


Przystępnie o statystycznym podejściu do testowania hipotez badawczych i szacowania liczebności próby

Konieczność dobrego rozumienia statystycznego podejścia do analizy i interpretacji wyników badań klinicznych wynika bezpośrednio z obowiązku dbałości o wiarygodność wniosków z badań, który w całości spoczywa na badaczu. Ze względu na konieczność oparcia badań na danych empirycznych dobrze sformułowanie pytanie badawcze wymaga odpowiedniego przełożenia na język hipotez statystycznych. Kolejną ważną kwestią jest dobór stosownego testu statystycznego oraz poprawna interpretacja jego wyników. Należy przy tym odróżniać dwa ważne pojęcia: istotność statystyczną oraz istotność praktyczną (np. kliniczną). Badacz powinien także zdawać sobie sprawę z grożących mu błędów wnioskowania. Jedną z ważnych, praktycznych korzyści jakie daje znajomość podstaw wnioskowania statystycznego jest możliwość oszacowania liczebności jednostek, które należy uwzględnić w badaniach.

W trakcie wystąpienia w oparciu o dane medyczne zostaną pokazane praktyczne przykłady testowania hipotezy badawczej oraz szacowania liczebności próby w programie STATISTICA. Dalsze przykłady oraz ćwiczenia praktyczne z komputerami zostaną przeprowadzone w trakcie warsztatów.


Ocena przyczyn i konsekwencji występowania tętniaka tętnicy płucnej u pacjentów z nadciśnieniem płucnym

Choroby naczyń płucnych, niezależnie od etiologii prowadzą do wzrostu naczyniowego oporu płucnego i ciśnienia w tętnicy płucnej. Proksymalny odcinek tętnicy płucnej w tej grupie chorych wykazuje tendencję do poszerzania się i tworzenia tętniaka, co można zobrazować w badaniu tomografii komputerowej. Indywidualna skłonność do tworzenia tętniaka jest bardzo zróżnicowana i nie wydaje się wprost zależeć od wartości ciśnień rejestrowanych wewnątrz naczynia. Dodatkowo – analogicznie jak w przypadku tętniaków aorty – znaczne poszerzenie tętnicy płucnej może prowadzić do jej pęknięcia i zgonu pacjenta. W trakcie wystąpienia zostaną przedstawione wyniki analizy 182 pacjentów, u których dokonano pomiaru szerokości pnia płucnego w tomografii komputerowej oraz wykonano cewnikowanie serca celem oceny wartości ciśnień w tętnicy płucnej. Dodatkowo oceniono przeżycie całkowite i zakończone nagłym zgonem. Przeprowadzona analiza statystyczna ma na celu odpowiedzenie na pytanie jakie czynniki mogą być odpowiedzialne za tworzenie się tętniaka tętnicy płucnej oraz jaki to ma wpływ na rokowanie chorych. Zostanie przedstawione zastosowanie regresji wieloczynnikowej w celu oceny związku parametrów klinicznych i szerokości tętnicy płucnej, ocena przeżycia metodą Kaplana-Meiera z wykorzystaniem modelu proporcjonalnego hazardu Coxa oraz analiza ROC dla znalezienia wartości średnicy tętnicy płucnej wiążącej się ze zwiększonym ryzykiem zgonu.


Ocena ryzyka występowania zaburzeń neuropsychicznych u chorych po operacjach kardiochirurgicznych

Tematyka wystąpienia dotyczy możliwości modelowania ryzyka występowania powikłania pooperacyjnego, jakim jest majaczenie (powikłanie neuropsychiczne dotykające około 5-10% chorych po operacjach kardiochirurgicznych). W kolejnych krokach zostanie zaprezentowane rozwiązanie z wykorzystaniem systemu skoringowego. Dodatkowo porównane będą wyniki z rezultatami otrzymanymi na podstawie typowej analizy statystycznej: analiz dla jednej i wielu zmiennych. Ryzyko modelowane będzie w oparciu o zbiór liczący ponad 80 zmiennych, obejmujących zarówno wyjściowe dane demograficzne i obciążenie chorobami dodatkowymi (czynniki predysponujące do wystąpienia majaczenia), jak i zmienne okołooperacyjne (czynniki wyzwalające majaczenie). Zaproponowany skoring będzie następnie poddany procedurze walidacji w celu oceny jego trafności diagnostycznej.


Przebieg zapalenia autoimmunologicznego w czasie 12-miesięcznej obserwacji na przykładzie oftalmopatii Gravesa

Oftalmopatia naciekowa (GO) jest jednym z objawów choroby Graves-Basedowa (MGB) sprawiającym największe trudności terapeutyczne. Podobnie jak nadczynność tarczycy w MGB, tak i oftalmopatia jest chorobą o podłożu autoimmunologicznym z pewna nie końca jeszcze wyjaśnioną predyspozycją genetyczną. Głównym antygenem wydaje się być receptor TSH, przeciwko któremu uczulone komórki immunokompetentne produkują przeciwciała (TRAb). Stężenie TRAb jest miarą nasilenia procesu zapalnego w oczodole i w praktyce klinicznej koreluje ze stopniem aktywności choroby CAS (Clinical Activity Score, maximum 7 punktów) i stopniem zaawansowania choroby NOSPECS, wyrażanym jako indeks oftalmopatii (IO, maksimum 15 punktów). Leczenie nadczynności tarczycy radiojodem 131-I prowadzi u około 5% pacjentów do zaostrzenia istniejącej łagodnej GO lub powstanie GO de novo.

Celem pracy jest:

  • porównanie przebiegu oftalmopatii (ciężkości GO – CAS, NOSPECS) oraz markerów zapalenia (TRAb, cytokiny) pomiędzy grupą chorych z nadczynnością tarczycy leczonych doustnymi lekami tyreostatycznymi (ATD) a grupą leczoną radiojodem 131-I,
  • określenie czynników, które wpływają na stopień zaawansowania GO
  • pomiar zależności indeksu oftalmopatii IO od stężenia TRAb.
  • określenie częstości występowania oporności na leczenie glikokortykoidami (non-responders) w grupie pacjentów z oftalmopatią w przebiegu choroby Graves-Basedowa w badaniu prospektywnym oraz określenieczynników predykcyjnych.

w latach 2000-2008 do Kliniki Endokrynologii UJCM zgłaszało się około 50 pacjentów rocznie z powodu zaostrzenia objawów oftalmopatii w przebiegu choroby Graves-Basedowa (GO). 168 z nich wyraziło zgodę na udział w prospektywnym badaniu obserwacyjnym z ankietą, polegającym na 12-miesięcznym monitorowaniu po zakończonym leczeniu z powodu GO. Grupa składała się z 119 kobiet (70,8% pacjentów ) i 49 mężczyzn (29,2% pacjentów), średnia wieku 52,2± 11,2 lat. Nadczynność tarczycy rozpoznano średnio 31,5±52,4 miesięcy przed zgłoszeniem się pacjentów do Kliniki z powodu objawów oftalmopatii, które średnio trwały 12,5±20,3 miesięcy.

w latach 2004-2007 w Klinice Endokrynologii UJCM leczono radiojodem 131-I 1200 pacjentów z powodu nadczynności tarczycy , w tym 696 (58% ) pacjentów z chorobą Graves-Basedowa. Leczenie radiojodem proponowano tylko pacjentom z indeksem oftalmopatii IO <3 punkty i z indeksem aktywności zapalenia (Clinical Activity Score) CAS <3 punkty. Stężenie TSH w surowicy krwi przed leczeniem 131-I wynosiło w tej grupie chorych 0,24±0,58 μU/ml, średni 24 hrs wychwyt 131-I nad tarczycą wynosił 54,0±14,6%, średnia aktywność podana 496±141 MBq.

46 pacjentów, 37 kobiet (80,4%) i 9 (19,6%) mężczyzn, średnia wieku 52,1±13,3 lat w kolejnych miesiącach po leczeniu, średnio 11,9±17,8 miesięcy, zgłosiło się do Ambulatorium z powodu pojawienia się de novo lub zaostrzenia objawów oftalmopatii. Nadczynność tarczycy w tej grupie pacjentów rozpoznano średnio 72,3±67,8 miesięcy przed zgłoszeniem się pacjentów do Kliniki w celu leczenia radiojodem. u 76% , którzy zgłosili się z objawami GO, stwierdzono niedoczynność tarczycy, średnie stężenie TSH wynosiło 23,9±24,5 μU/ml (mediana 15,4; max=91,7; min=1,7 μU/ml). Pacjentów leczono odpowiednią dawka L-tyroksyny przez cały czas obserwacji w celu przywrócenia i utrzymania eutyreozy.

Pacjenci obu grup zostali zakwalifikowani do leczenia glikokortykoidami metodą pulsacyjną (2,0 g SoluMedrolu i.v. na tydzień do łącznej dawki 8,0g) oraz radioterapii oczodołów (20 Gy w 10 frakcjach) w Zakładzie Radioterapii Szpitala Dziecięcego w Krakowie-Prokocimiu. po zakończonym leczeniu pacjenci zgłaszali się do kontroli i oceny wyników leczenia po 1, 6, i 12 miesiącach w Poradni Endokrynologicznej i Okulistycznej.

Ponieważ rozkłady wielu badanych cech zdecydowanie odbiegały od rozkładu normalnego zatem zachodziła potrzeba zastosowania nieparametrycznych metod statystycznych. Porównania grup maja dwojaki charakter. po pierwsze można w jednej grupie chorych śledzić zmiany konkretnego parametru w czasie, w związku z pomiarami dokonywanymi w miesiącach 0, 1, 6 oraz 12. Stosowane to testy muszą uwzględniać fakt, że takie obserwacje są obserwacjami zależnymi. Zazwyczaj lekarze nie zadowalają się wynikiem testowania głoszącym istotność różnic pomiarów dokonywanych w różnych momentach czasu. Chcą odpowiedzi na pytanie w których interwałach czasowych te zmiany były istotne. Wymaga to stosowania porównań parami, co z kolei stawia problem testowania wielokrotnego. Relatywnie bardziej prostym zagadnieniem jest porównywanie dwóch rozłącznych grup w zadanym momencie czasu. W prezentacji pokazy będzie też sposób poszukiwania i estymacji ważonych funkcji trendu opisujących zmiany parametrów zaawansowania choroby.


Zastosowanie narzędzi klasyfikacyjnych opartych na technikach statystycznych i metodach sztucznej inteligencji w ocenie prawdopodobieństwa istnienia raka jajnika

Guzy złośliwe jajnika stanowią jeden z najtrudniejszych problemów onkologii ginekologicznej. Powszechnie wiadomo, że w odniesieniu do tego nowotworu nie istnieje pojedynczy test spełniający wszystkie wymagania stawiane przez akceptowaną metodą skriningową. W związku z tym poprawna klasyfikacja wykrytych guzów często wymaga nie tylko doświadczenia, ale też zastosowania zaawansowanych metod modelowania statystycznego i rozważnego zgłębienia wszystkich możliwych sposobów działania. Wyodrębnienie grup wysokiego ryzyka istnienia raka jajnika realizowano przy pomocy analiz doboru predyktorów jakościowych i ciągłych. Wyłonione podzbiory zmiennych były następnie przedmiotem dokładniejszych poszukiwań z wykorzystaniem sieci neuronowych oraz innych metod uczenia tj. naiwnych klasyfikatorów Bayesa, metody k-najbliższych sąsiadów, metody SVM. Ocena prawdopodobieństwa istnienia w guzie jajnika nowotworu złośliwego jest bardzo ważna, gdyż ma na celu podjęcie dla danej chorej optymalnej decyzji dotyczącej sposobu terapii i wybór leczenia zachowawczego lub operacyjnego. Ponadto kombinacja szeregu metod diagnostycznych może zostać wykorzystana w badaniach przesiewowych raka jajnika w postaci tzw. skriningu multimodalnego.


Jak w praktyce wybierać i interpretować wyniki testów istotności różnic w badaniach medycznych?

W dobie łatwego dostępu do komputerów oraz odpowiednich programów statystycznych coraz większego znaczenia nabiera umiejętność wyboru technik statycznych oraz poprawna interpretacja wyników analizy. W praktycznych zastosowaniach statystyki w badaniach medycznych stosunkowo najczęściej wykorzystywane są tzw. testy istotności różnic. Jednocześnie można podać kryteria, które decydują o wyborze konkretnego testu. W trakcie zajęć warsztatowych zostaną zaprezentowane przykłady wyboru testów, ich przeprowadzanie w środowisku programu STATISTICA oraz statystyczna i merytoryczna interpretacja wyników badań, pochodzących z różnych dziedzin medycyny.


Praktyczne aspekty szacowania liczebności próby w badaniach medycznych

Jednym z najczęstszych pytań stawianych przez badacza statystykowi jest pytanie o liczebność jednostek (osób, obiektów), która powinna zostać poddana badaniom. Odpowiedź na to pytanie wymaga wiedzy na temat tego kim są badani, co jest przedmiotem badania oraz jaki schemat badań będzie zastosowany. Nawet najbardziej pieczołowicie przeprowadzone badanie może nie dać jednoznacznej odpowiedzi na postawione pytania w sytuacji gdy liczba badanych jest zbyt mała. z drugiej strony przebadanie dużej liczby obiektów może wiązać się z dużym nakładem sił i środków. W związku z tym zadanie sprowadza się do oszacowania odpowiedniej liczebności próby dla przyjętego w badaniach schematu.

w trakcie zajęć warsztatowych zostaną zaprezentowane przykłady szacowania liczebności próby w programie STATISTICA.


Ocena jakości reguł decyzyjnych za pomocą krzywych ROC

Krzywa ROC (Receiver Operating Characteristic) jest narzędziem do oceny poprawności klasyfikatora, zapewnia ona łączny opis jego czułości i specyficzność. Ten sposób wspomagania systemu decyzyjnego jest szeroko stosowany w różnych obszarach analizy danych, również medycynie. Na przykład, korzystając z krzywych ROC możemy z kilku czynników diagnostycznych możemy wybrać najlepszy, zdefiniować najbardziej optymalny próg decyzyjny (tzw. punkt odcięcia, cut-off point) oraz ocenić jakość decyzji podejmowanych na podstawie tak skonstruowanej reguły. W trakcie warsztatów zaprezentowane zostanie rozszerzenie programu STATISTICA do wykreślania krzywych ROC oraz poszukiwania optymalnego punktu odcięcia, również przy zdefiniowanych przez użytkownika kosztach błędnych klasyfikacji.


Regresja logistyczna w praktyce badań medycznych

Regresja logistyczna jest jedną z bardziej popularnych technik wielowymiarowej analizy danych wykorzystywanych w medycynie. Jest ona szczególnie przydatna w sytuacji, gdy wartości zmiennej dwustanowej typu CHORY/ZDROWY bądź POWIKŁANIA/BRAK POWIKŁAŃ pragniemy objaśnić za pomocą innych zmiennych oraz ocenić siłę i kierunek wpływu tych zmiennych na analizowane zjawisko.

Podczas warsztatów zostanie zaprezentowany przykład praktycznego modelowana danych w programie STATISTICA. W pierwszej części warsztatów uczestnicy koncentrować się będą na kwestii przygotowania danych na potrzeby regresji logistycznej. Między innymi poruszone zostaną problemy braków danych, współliniowości zmiennych, oceny liniowości wpływu zmiennych na zjawisko oraz sposobu uwzględniania zmiennych jakościowych w programie.

w drugiej części warsztatów uczestnicy koncentrować się będą na procesie modelowania. Poruszone zostaną zagadnienia doboru optymalnego zestawu zmiennych do modelu, interpretacji uzyskanych wyników oraz oceny jakości modelu. 


Analiza przeżycia i model Coxa

Analiza przeżycia jest jedną z najpopularniejszych technik analizy danych w medycynie. Przedmiotem badania jest tu czas jaki upłynął pomiędzy dwoma zdarzeniami (np. zabiegiem i wystąpieniem powikłań). Cechą charakterystyczną analizy przeżycia jest uwzględnianie tzw. obserwacji uciętych, czyli tych przypadków, dla których mamy niepełną informację – wiemy, że czas pomiędzy dwoma badanymi zdarzeniami był dłuższy niż pewna wartość, ale nie wiemy, ile dokładnie wynosił (np. W sytuacji gdy, pacjent przestał zgłaszać się do kontroli).

Podczas warsztatów zostanie pokazane, w jaki sposób przeprowadzić analizę przeżycia w programie STATISTICA. Warsztaty będą miały charakter praktyczny, pierwszym etapem będzie omówienie w jaki sposób należy przygotować dane i na co należy zwrócić uwagę podczas samego ich procesu gromadzenia. W kolejnym kroku, zostanie pokazane, w jaki sposób wykreślić i zinterpretować krzywą przeżycia Kaplana-Meiera, omówione zostanie zagadnienie estymacji funkcji przeżyć, testowanie różnic między grupami oraz modelowanie wpływu zdefiniowanych czynników na przeżycie (model proporcjonalnego hazardu Coxa).


Jak połączyć wyniki wielu badań opisujących skuteczność terapii? – Metaanaliza w programie STATISTICA Zestaw Medyczny

Jeżeli badacz ma dostęp do danych surowych z badań opisujących np. skuteczność określonej terapii, może bezpośrednio na ich podstawie obliczyć efekt łączny. Najczęściej jednak udostępnione zostają jedynie wyniki zbiorcze poszczególnych badań. Podstawowym zadaniem metaanalizy jest dostarczenie narzędzi do sensownego połączenia wyników badań z uwzględnieniem różnego wpływu poszczególnych składowych. Podejście takie pozwala rozszerzyć wnioski z pojedynczych badań na szerszą populację i zwiększyć wiarygodność otrzymanych wyników.

w trakcie warsztatów wykorzystany zostanie moduł Metaanaliza dostępny w programie STATISTICA Zestaw Medyczny. Prezentowane narzędzie umożliwi wykonanie obliczeń dla szeregu miar efektu i przedstawienie wyników w postaci szczegółowego raportu oraz wykresu leśnego (forest plot). W ramach analizy wrażliwości zbadany zostanie wpływ zmiany założeń, np. uwzględnienia badań niespełniających kryterium włączenia do podstawowej analizy, na uzyskany efekt łączny. Przeprowadzenie metaanalizy w grupach pozwoli z kolei ocenić zróżnicowanie łącznego efektu względem wybranego czynnika jakościowego.