Wstęp
Spojrzenie na dane
Wizualizacja danych
Techniki obliczeniowe
Zakończenie
Znajomość i wykorzystanie statystyki wśród lekarzy wydaje się powszechne. Każda praca z tej dziedziny zawiera przecież dane ilościowe opracowane i poddane procedurom statystycznym: policzono średnie, odchylenia standardowe, poziom istotności różnic między grupami, niekiedy nawet wartość χ². Zatem wszystko wygląda pięknie, tylko jakoś nikt później nie traktuje uzyskanych w ten sposób wyników nazbyt serio. Czemu? Czyżby ich czytelnicy przypomnieli sobie, jak sami opracowywali statystycznie własne prace? Dwa zasadnicze grzechy można wypomnieć lekarzom w związku z wykorzystaniem przez nich statystyki. Pierwszy z nich to traktowanie statystyki jak uciążliwego, zbytecznego, ale za to dobrze widzianego przez innych ozdobnika, pozwalającego nadać pracy potrzebny walor naukowości. Drugi zaś to nader pobieżna znajomość nawet podstawowych technik statystycznych i stosowanie ich tam, gdzie w zasadzie nie mają zastosowania. Nie namawiam wcale do tego, aby lekarze na gwałt zaliczali uniwersytecki kurs statystyki matematycznej, na podbudowie teorii miary i całki Lebesque'a; wręcz przeciwnie. Zamierzam zachęcić ich do częstszej współpracy ze statystykiem (on nie uczy się medycyny, kiedy boli go gardło, tylko właśnie idzie do lekarza). Jednakże są rzeczy tak proste, że ich przyswojenie naprawdę nie wymaga dużego nakładu pracy w kształtowanie muskulatury matematycznej. O takich właśnie prostych rzeczach chciałbym dzisiaj kilka słów powiedzieć. Jednak zanim przejdę do meritum, muszę - gwoli sprawiedliwości - wrzucić kamyczek do własnego, to znaczy matematycznego ogródka. Jest bowiem prawdą, że na medycynę wybierają się w większości ludzie, którzy matematyki nie kochają. Można się na to oburzać, ale jest to fakt. Zatem programy przedmiotu "Rachunek prawdopodobieństwa i statystyka matematyczna" powinny ten fakt uwzględniać. Powtarzanie w akademiach medycznych kawałków kursu uniwersyteckiego jest podstawowym błędem dydaktycznym. Efekt jest bowiem taki, że znakomita większość absolwentów tych akademii wychodzi z nich z uczuciem w najlepszym razie całkowitego niezrozumienia o co chodzi, a w najgorszym - z obrzydzeniem do statystyki w ogóle. Jaki ma to wpływ na ich późniejszy stosunek do odpowiednich opracowań - nie muszę chyba mówić. Szczególnie zastanawiające jest to dzisiaj, kiedy naprawdę istnieją możliwości zupełnie innego kształcenia w tej dziedzinie. Przede wszystkim istnieją narzędzia umożliwiające pominięcie większości podbudowy teoretycznej statystyki i skoncentrowanie się na tym co jest naprawdę ważne, to jest na zrozumieniu, czemu służą określone techniki i jak można je wykorzystać w praktyce. Narzędziami takimi są pakiety statystyczne, natomiast kwestia rozumienia tego, co się robi, jest właśnie tematem, na którym skupimy swoją uwagę.
| Powrót do spisu treści |
Przyjrzyjmy się dość typowej karcie opisu pacjenta przyjmowanego do szpitala. Przedstawiam oczywiście jej fragment, interesujący nas pod pewnymi względami.
| 1. Imię | 11. Hematokryt | ||||||||||||||||||
| 2. Nazwisko | 12. OB. | ||||||||||||||||||
| 3. Data ur. | 13. RBC | ||||||||||||||||||
| 4. Data ostatniej operacji | 14. WBC | ||||||||||||||||||
| 5. Operacja (typ) | 15. Jonogram | ||||||||||||||||||
| 6. Znieczulenie |
- Lokalne - Przewodowe - Dożylne - Dotchawicze |
16. Albuminy | |||||||||||||||||
| 7. Stan po operacji |
- Bardzo dobry - Dobry - Dostateczny - Zły |
17.Reszta azotowa | |||||||||||||||||
| 8. Powikłania |
- Wystąpiły - Nie wystąpiły |
18. APTT | |||||||||||||||||
| 9. Leczenie poszpitalne |
- Miało miejsce - Nie miało miejsca |
19. HBS |
- Dodatni - Ujemny |
||||||||||||||||
| 10. Ponowna hospitalizacja |
- Ten sam powód - Inny powód - Brak |
20. HIV |
- Dodatni - Ujemny |
||||||||||||||||
| Powrót do spisu treści |
No właśnie - jedna z najprostszych metod analizy, nie wymagająca znajomości statystyki, a w jakimże jest lekceważeniu! Nie w tym rzecz, że się jej nie stosuje, tylko w tym, iż niczemu nie służy. A przecież spojrzenie na właściwie zilustrowane dane pozwala od razu nabrać pewnego wyobrażenia o tym, jakie z nich informacje możemy uzyskać.
Spójrzmy na poniższe wykresy, zwane histogramami lub wykresami słupkowymi.

Przedstawiają one średnią podstawową płacę miesięczną lekarzy w pewnej przychodni oraz ich roczną premię. Zasadnicza różnica między tymi wykresami jest oczywista: pierwszy pozwala sensownie mówić o średniej płacy zasadniczej (700 zł), w drugim natomiast średnia premia (także 700 zł) jest absolutnie nieprzydatna, gdyż żadna premia nie jest nawet zbliżona do średniej. Co w takim wypadku mamy robić? Musimy znać inne miary tendencji centralnej. Możemy na przykład wybrać sobie wynik najczęściej występujący.
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 715 | 850 | 690 | 720 | 450 | 890 | 630 | 715 | 870 | 690 | 940 | 710 | 420 | 560 | 880 | 910 | 740 | 530 | 770 | 715 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 |
| 640 | 810 | 910 | 560 | 800 | 190 | 950 | 580 | 690 | 715 | 530 | 900 | 650 | 410 | 840 | 565 | 820 | 700 | 630 | 715 |
W przypadku tabeli 1 (to znaczy płacy) wynikiem takim jest liczba 715. Jak widzimy, nie odbiega ona wiele od średniej. Taką wartość nazywamy wartością modalną. Możemy jeszcze postąpić inaczej. Uporządkujmy posiadane wartości od największej do najmniejszej i wybierzmy środkową. Jeśli mamy nieparzystą liczbę wyników, to taka liczba jest jednoznacznie określona. Natomiast w naszej sytuacji (40 obserwacji) powinniśmy wybrać średnią arytmetyczną z pomiaru dwudziestego i dwudziestego pierwszego w kolejności, to znaczy z pomiarów środkowych, Jednak w naszym wypadku pomiary te są równe 715, więc możemy powiedzieć, że wartość ta jest także równa 715. Nazywamy ją medianą lub wartością środkową. Zatem pierwszą tabelę możemy w pełni scharakteryzować podając jedną z trzech wartości: średnią, medianę lub modalną. Natomiast dla drugiej tabeli średnia wartość nie ma sensu z powodów, o których wspomniano wcześniej, natomiast mediana jest średnią pomiaru dwudziestego (810) i dwudziestego pierwszego (815), a zatem jest równa 812.5 i także nie oddaje rzeczywistego charakteru rozkładu premii w rozpatrywanej grupie, a więc również jest niemiarodajna dla tego zbioru danych.
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 815 | 900 | 490 | 820 | 430 | 900 | 530 | 815 | 970 | 590 | 940 | 810 | 320 | 460 | 920 | 910 | 840 | 430 | 870 | 815 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 |
| 540 | 910 | 910 | 460 | 900 | 220 | 900 | 480 | 590 | 815 | 530 | 900 | 550 | 410 | 900 | 565 | 920 | 800 | 530 | 600 |
Jak wobec tego syntetycznie przedstawić dane zawarte w drugiej tabeli? Otóż w tym przypadku stosujemy prostą sztuczkę. Dzielimy (co w świetle powiedzianego wyżej jest całkiem uzasadnione) dane z tabeli na dwie grupy i nazywamy taki rozkład dwumodalnym. Możemy teraz podać dla każdej z wydzielonych grup oddzielnie średnie lub - co robi się częściej - wartości modalne. Taki rozkład opisany jest zatem dwoma wskaźnikami. Gdybyśmy mogli wydzielić trzy wyraźnie różniące się grupy, to rozkład taki nazwalibyśmy trójmodalnym. Odkryliśmy zatem ideę rozkładów wielomodalnych. Należy jednak pamiętać, że to wyróżnianie grup jest zawsze nieco arbitralne, ponadto wyróżniamy nie tyle grupy, co poziomy danej cechy w grupie. Tym niemniej podane wykresy dobrze ilustrują różnicę między płacą a premią.
Powstaje zatem naturalne pytanie, kiedy korzystać z jakich wskaźników tendencji centralnej. Otóż istnieje tu (względnie) prosta reguła:
Zagadnienie to jest istotne jeszcze z jednego powodu. Wiele technik statystycznych wykorzystuje w istotny sposób normalność rozkładu. Często już spojrzenie na histogram pozwala ocenić, czy rozkład w zadawalającym stopniu spełnia założenie normalności. W przypadku płacy można rozkład ten uznać za normalny (na pewno nie idealnie, ale nikt nie jest doskonały). W przypadku premii żadna siła nie zmusi statystyka, aby uznał jej rozkład za normalny. Zatem nie można bezmyślnie stosować np. testu różnic między średnimi, który to test zakłada normalność obu rozkładów. Do tego tematu jeszcze wrócimy.
Częstym zagadnieniem spotykanym w praktyce jest wyznaczenie współczynnika korelacji między dwiema wielkościami. Po pierwsze, dane muszą być typu liczbowego. Jeśli ktoś ponumerował sobie klasy dla dwóch cech nominalnych i liczy dla nich współczynnik korelacji, to nie można mu nawet współczuć. Po drugie, sporządzenie odpowiedniej ilustracji właściwych cech (tj. wykresu rozrzutu) pozwala od razu ocenić opłacalność wyznaczania takiego współczynnika. Spójrzmy na poniższy rysunek.

Przedstawione na tym wykresie punkty wyraźnie (choć nie całkiem dokładnie) układają się wzdłuż wykreślonej linii prostej. Jej znaczenie jest oczywiste: to jest prosta regresji premii względem płacy, czyli prosta najlepszego dopasowania tych cech. Wobec tego dla takich danych ma sens liczenie współczynnika korelacji (z pewnymi ograniczeniami). Jeśli natomiast punkty na takim wykresie tworzą nieregularną chmurkę zbliżoną do koła, to określanie współczynnika korelacji nie ma merytorycznych podstaw. Można oczywiście go wyznaczyć, ale pożytek z tego żaden.
Wiele rodzajów wykresów jest oferowanych przez pakiety statystyczne. Tylko o tych, oferowanych przez pakiet STATSTICA można mówić cały dzień. Tutaj ograniczę się tylko do pokazanie jednego z takich dość zabawnych, a w sumie niekiedy przydatnych (tzw. twarze Chernoffa).
| Powrót do spisu treści |
Po obejrzeniu wykresów chciałoby się pewnie coś wyliczyć. Najczęściej jest to porównanie dwóch średnich (dwa różne leki na tę samą chorobę) lub też dwóch - czy więcej - grup (zapadalność na choroby naczyń wieńcowych wśród kobiet i mężczyzn albo przedstawicieli różnych zawodów). Pierwsze obliczenia można robić w zasadzie tylko wtedy, gdy cecha ma rozkład nie odbiegający zbytnio od normalnego, to znaczy jednomodalny, symetryczny i trochę porozrzucany. A jak szybko to sprawdzić? Wykorzystać testy nieparametryczne, które pozwalają odpowiedzieć na pytanie, czy o danej cesze można z sensem powiedzieć, że ma rozkład normalny. Spojrzyj na poniższy wykres.
| Gęstość | Obrastanie naczyń |
Obrastanie nerwów |
Naciekanie kości |
Zrost z pajęczynówką |
| Do 39 J.H. | 8 | 16 | 32 | 2 |
| 40-49 | 13 | 9 | 6 | 1 |
| 50-59 | 5 | 3 | 6 | 2 |
| 60-69 | 4 | 3 | 4 | 2 |
| Od 70 J.H. | 1 | 5 | 4 | 5 |
I tu właśnie mamy kolejne źródło częstych błędów. Warunkiem sensownego stosowania testu χ² jest posiadanie dostatecznej liczby obserwacji (co najmniej 30, oraz tyle, żeby ich liczba była co najmniej 5 razy większa od liczby komórek w tabeli) oraz wartości oczekiwane w komórkach nie mniejsze od 5. Tabela powyższa spełnia warunek pierwszy, ale nie spełnia drugiego. Musimy zatem dokonać korekty tej tabeli do postaci jak niżej
| Gęstość | Obrastanie naczyń |
Obrastanie nerwów |
Naciekanie kości lub zrost |
| Do 39 J.H. | 8 | 16 | 34 |
| 40-49 | 13 | 9 | 7 |
| Od 50 J.H. | 10 | 11 | 21 |
Teraz dopiero można z sensem sprawdzać powyższą zależność. Po uruchomieniu odpowiedniej procedury otrzymamy poniższą tabelę.
Otrzymane wyniki (p<0.01) wyraźnie świadczą o tym, że istnieje zależność między gęstością guza a jego złośliwością (wzrost gęstości ma wpływ na obserwowany wynik śródoperacyjny).
| L.P. | Lek A | Lek B | RÓZNICA |
| 1 | 14 | 19 | -5 |
| 2 | 13 | 10 | 3 |
| 3 | 11 | 9 | 2 |
| 4 | 24 | 29 | -5 |
| 5 | 26 | 24 | -2 |
| 6 | 15 | 13 | 2 |
| 7 | 36 | 34 | 2 |
| 8 | 17 | 15 | 2 |
| 9 | 13 | 17 | -4 |
| 10 | 20 | 14 | 6 |
| 11 | 25 | 23 | 2 |
| 12 | 15 | 15 | 0 |
| 13 | 11 | 8 | 3 |
| 14 | 18 | 15 | 3 |
| 15 | 13 | 11 | 2 |
| 16 | 24 | 22 | 2 |
| 17 | 16 | 14 | 2 |
| 18 | 35 | 33 | 2 |
| 19 | 13 | 12 | 1 |
| 20 | 20 | 19 | 1 |
| 21 | 14 | 10 | 4 |
| 22 | 24 | 20 | 4 |
| 23 | 17 | 15 | 2 |
| 24 | 14 | 19 | -5 |
| 25 | 26 | 36 | -10 |
| 26 | 22 | 20 | 2 |
| 27 | 10 | 10 | 0 |
| 28 | 10 | 18 | -8 |
| 29 | 23 | 21 | 2 |
| 30 | 21 | 18 | 3 |
| 31 | 12 | 10 | 2 |
| 32 | 19 | 17 | 2 |
| 33 | 14 | 12 | 2 |
| 34 | 47 | 42 | 5 |
| 35 | 19 | 17 | 2 |
| 36 | 24 | 21 | 3 |
| 37 | 10 | 15 | -5 |
| 38 | 15 | 13 | 2 |
| 39 | 17 | 13 | 4 |
| 40 | 25 | 23 | 2 |
Zamieszczona powyżej tabela ilustruje czas, po jakim dwa leki (A i B) powodują obniżenie ciśnienia skurczowego o 10 mm Hg. Leki te podawano tym samym pacjentom, ale w różnej kolejności, w postaci próby podwójnie ślepej. Czwarta kolumna pokazuje różnicę między A i B. Znak plus oznacza szybsze działanie leku B dla danego pacjenta, zaś znak minus - szybsze działanie leku A. Testowano oczywiście hipotezę zerową o jednakowym działaniu leków przeciw alternatywnej, o wyższości leku B.
Jeśli nasza hipoteza o braku związku między czasem, po jakim następuje obniżenie ciśnienia skurczowego, a rodzajem leku jest prawdziwa, to w czwartej kolumnie powinniśmy uzyskać dużo wyników równych zero, zaś liczba wyników dodatnich i ujemnych powinna być w przybliżeniu taka sama. Jednakże rzeczywistość radykalnie odbiega od tych wyobrażeń: wyników równych zero jest tylko dwa, a wyników ujemnych 7, tak więc wyników dodatnich jest 31. Mamy więc podstawy przypuszczać, że lek B jest istotnie skuteczniejszy. Jednakże intuicja nie podpowiada nam, czy taki wynik wskazuje na istotną różnicę, czy nie. Tak więc teraz musimy - chcąc nie chcąc - posłużyć się testem obliczającym (przy założeniu hipotezy zerowej właśnie) prawdopodobieństwo uzyskania określonej liczby różnic dodatnich (plusów) dla danej liczby porównań. Wykonujemy go wtedy, gdy porównujemy ze sobą pomiary wykonane dwukrotnie w różnych warunkach na tych samych obiektach. Ponieważ test ten porównuje liczbę znaków różnic takich pomiarów nazywamy go testem znaków.
Wynik testu (to znaczy to, co jest dla nas najbardziej istotne) daje się opisać jednym wskaźnikiem p = 0.000191. Ułatwmy sobie życie, zaokrąglając otrzymaną wartość do 0.0002. Sens tego wyniku jest taki: jeśli hipoteza zerowa jest prawdziwa, to nasz wynik mógłby się zdarzyć raz na ile? No, no! Ni mniej, ni więcej, tylko raz na 5 000 przypadków. Oczywiście otrzymana wartość p jest mniejsza niż ostrożnie przyjmowana wartość 0.01. Jeśli zatem nie wierzymy w cuda, to mamy podstawę do odrzucenia hipotezy zerowej i przyjęcia tezy o istotnie wyższej skuteczności leku A. Powstaje teraz pytanie o przyczyny tego zjawiska. Na podstawie posiadanych danych oczywiście nie możemy na nie odpowiedzieć, ale możemy snuć przypuszczenia na ten temat. Przypuszczenia te są dalej weryfikowalne przy pomocy statystyki, ale w tym celu trzeba przeprowadzić dalsze badania.
A gdzie tu zapowiadany problem? Otóż jeśli zastosujemy do tych wyników test różnic między średnimi, to otrzymamy wynik, mówiący o braku istotnych różnic między lekami. Powstaje zatem pytanie, skąd tak różne wyniki? Badana cecha w przypadku żadnego z leków nie ma rozkładu normalnego, wobec czego wynik uzyskany przy pomocy testu znaków (ostrożniejszego i niewrażliwego na typ rozkładów) należy uznać za bardziej wiarygodny.
| Powrót do spisu treści |
Wniosek z tego co zostało powiedziane? Prosty: statystyka nie jest taka bardzo trudna, a może być nawet przydatna. Jeśli ją polubisz, to ona naprawdę potrafi Ci się odwdzięczyć. Do bliższych kontaktów z nią serdecznie zapraszam.
| Powrót do spisu treści | |
| Następny artykuł | |