„There are three kinds of lies: lies, damned lies, and statistics.”
przypisywane Benjaminowi Disraeliemu, spopularyzowane przez Marka Twaina
Jak powszechnie wiadomo największym kłamstwem jest statystyka.
Czy to stwierdzenie jest prawdziwe? Czy w obecnych czasach gdy testy statystyczne, wyniki modeli czy odpowiedzi AI stają się świętością, prawdą objawioną to nadal możemy tak twierdzić? Czy wyniki statystki mają przeważać, mieć pierwszeństwo nad zdrowym rozsądkiem? Odpowiedź nigdy nie jest jednoznaczna. Jak mawia klasyk: „To zależy”.
Chciałbym by ten wpis skłonił czytelnika do refleksji. Do zastanowienia się czy warto bezkrytycznie wierzyć w wyniki każdej analizy, w każde badanie. Poruszę tutaj kilka kontrowersyjnych mniej bądź bardziej medialnych tematów.
- Polacy popełniają najwięcej przestępstw na Wyspach: proste manipulacje na danych.
W 2016 roku Onet opublikował artykuły sugerujące, że to Polacy dokonują najwięcej przestępstw w Wielkiej Brytanii.[1] [2] Eksponował te dane, ale nie uwzględnił faktu, że Polacy stanowią jedną z największych mniejszości narodowych na Wyspach. Nie uwzględniał ciężaru zarzutów poszczególnych przestępstw. Wszystkie liczone były równo. Po uwzględnieniu informacji o wielkości mniejszości narodowych okazało się, że odsetek przestępstw popełnionych przez Polaków był znikomy.
- Sprawa dr Zbigniewa Martyki: konsensus naukowy a badania statystyczne.
Okres pandemii wirusa Covid19 przyniósł wiele zmian w naszym życiu. Był również okresem, gdzie cały czas byliśmy „atakowani” różnymi danymi statystycznymi, wynikami badań. Główne media wskazywały jak ważne jest noszenie maseczek, szczepienia, izolacje itp. Z drugiej strony mieliśmy osoby które pokazywały inne badania twierdzące całkiem inne tezy. Osoby te zazwyczaj pomijane były w mediach, były cenzurowane. Często te same dane były interpretowany w całkiem odmienny sposób.
Takim uosobieniem kontrowersyjnych opinii był dr. Zbigniew Martyka. Kwestionował m. in. Skuteczność noszenia maseczek, zasadność testowania całej populacji, realnego zagrożenia COVID-19 dla dzieci czy konieczność szczepień. W swoich wypowiedziach powoływał się na randomizowane badania kontrolowane (RCT), które uważał za „złoty standard” dowodów naukowych.
Pod koniec 2022 roku sąd lekarski zawiesił dr. Zbigniewowi Martyce prawo wykonywania zawodu na okres jednego roku. Wyrok nie był prawomocny. Oskarżyciele powoływali się na badania obserwacyjne i modele, które uważane są za zdecydowanie mniejszej wagi. Proces ciągnął się aż do marca 2025 i jego przebieg również budził wiele kontrowersji (m. in. wyrok bez dowodów). Ostatecznie sąd anulował zakaz wykonywania zawodu i jedynie udzielił karę nagany.[3] [4] [5] [6]
Nie będę tutaj szczegółowo omawiał sprawy polecam samemu ją przejrzeć. Zapoznać się z przypisami. Przytaczam ją by zwrócić uwagę jak badania statystyczne mogą być różnie interpretowane i wykorzystywane instrumentalnie by uwiarygodnić swoje tezy. Czy to dr Martyka miał rację, czy „konsensus naukowy” pozostawiam pod rozwagę czytelnika.
- Tradycyjne produkty lecznicze roślinne[7] czy syntetyczne?
Kolejny przykładem, gdzie zarzuca się manipulowanie statystyką, jest podejście do medycyny naturalnej vs leki syntetyczne. Ostatnio można zauważyć coraz większą krytykę, ograniczenia w stosowaniu tradycyjnych naturalnych leków sugerując, że nie zostały dostatecznie przebadane, że nie ma statystycznych dowodów na ich skuteczność. Oto kilka przykładów:
- Chińskie zioła na Covid
W trakcie pandemii Chiny dopuściły do leczenia COVID-19 trzy preparaty z tradycyjnej medycyny chińskiej. W The Lancet ukazał się komentarz pt. „Use of Herbal Drugs to Treat COVID-19 Should be with Caution” – podkreślający brak rygorystycznych dowodów na ich skuteczność i potencjalne ryzyko.[8]
Z drugiej strony (od strony zwolenników tradycyjnej chińskiej medycyna) przyszła odpowiedź w magazynie Journal of Integrative Medicine[9], która zarzuciła takiemu podejściu uprzedzenia i przytoczyła dostępne dowody obserwacyjne świadczące na korzyść ziół. Wskazano również, że w trakcie pandemii standardowe leki również były stosowane przy ograniczonych dowodach (w początkowej fazie pandemii żadna terapia nie miała pełnych badań). [10] - Artemisia annua (zioło na malarię) vs leki syntetyczne na malarię
Roślina ta od wieków stosowana w Chinach na gorączki. Jej aktywny składnik (artemizynina) stał się bazą nowoczesnych leków na malarię. WHO stanowczo jednak odradza stosowanie tradycyjnych wyciągów czy herbatek z Artemisia annua w profilaktyce i leczeniu malarii – argumentując brakiem standaryzacji i pewności co do dawki oraz skuteczności takich form.[11] Sugeruje stosowanie wyłącznie zatwierdzonych, standaryzowanych leków przeciwmalarycznych, takich jak ACT.
Inne badania wskazują jednak, że stosowanie samej rośliny może skutecznie zwalczać malarię odporną na samą artemizynę oraz spowalnia rozwój oporności na leki przeciw malarii.[12] Trzeba dodać, że kraje gdzie występuje malaria są krajami biednymi. Ludność może nie być w stanie zaopatrzyć się w drogie leki. - Ashwagandha
Ashwaganda od ponad 3000 lat jest filarem medycyny ajurwedyjskiej, stosowanym na stres, bezsenność, odmłodzenie organizmu. W 2023 Dania całkowicie zakazała sprzedaży ashwagandhy na swoim rynku powołując się na potencjalne negatywne skutki dla hormonów tarczycy i płciowych oraz możliwość wywoływania poronień. Dowody kliniczne na te skutki są jednak ograniczone i niejednoznaczne. Brakuje solidnych dowodów naukowych potwierdzających te obawy.[13]
Warto jednak pamiętać, że choć wiele naturalnych preparatów ma długą historię stosowania, to tylko leki, które przeszły odpowiednie badania kliniczne, dają nam realną pewność co do ich skuteczności i bezpieczeństwa.
- Jeden rabin powie tak, drugi rabin powie nie: interpretacja wyników statystycznych
Wpływ mediów społecznościowych na psychikę młodzieży to jeden z tych tematów, które co jakiś czas rozgrzewają media i opinię publiczną do czerwoności. Z jednej strony badacze alarmują, że smartfony rujnują życie nastolatkom. Z drugiej, że te same dane wcale nie są tak jednoznaczne. No więc… jak jest naprawdę?
W 2018 roku amerykańska psycholog Jean Twenge opublikowała głośne badanie, w którym analizowała dane z wielkich amerykańskich baz (Monitoring the Future, Youth Risk Behavior Surveillance System)[14]. Wnioski były niepokojące: im więcej czasu młodzież spędza w mediach społecznościowych, tym gorsze ma samopoczucie. Twenge sugerowała wręcz, że social media mogą być jedną z głównych przyczyn wzrostu depresji i zaburzeń lękowych u młodych ludzi – szczególnie u dziewcząt.
Zaraz potem – w 2019 roku – Amy Orben i Andrew Przybylski z Oxford Internet Institute przeanalizowali te same dane na nowo. Zastosowali bardziej zaawansowaną metodę statystyczną (Specification Curve Analysis[15]), która pokazuje, jak różne wybory metodologiczne wpływają na wynik. Co się okazało? Że wpływ social mediów na samopoczucie owszem – jest, ale znikomy. Statystycznie istotny, ale praktycznie bez znaczenia – tłumaczący mniej niż 0,4% różnicy w dobrostanie psychicznym. Dla porównania: wpływ ilości snu lub tego, czy dziecko zjadło śniadanie, był większy.
I teraz najciekawsze: obie interpretacje są statystycznie poprawne. Różnica polega na tym, jak skonstruowano analizę, jakie pytania badawcze postawiono i jakie przyjęto założenia. Twenge skupiła się na trendach społecznych i interpretowała dane w świetle szerszego zjawiska. Orben i Przybylski podeszli do sprawy matematycznie i pokazali, że to, co wygląda dramatycznie, wcale nie musi takie być, gdy spojrzymy chłodnym okiem.
Czyli klasyczna sytuacja: jeden rabin powie tak, drugi rabin powie nie. A statystyka? Statystyka da się wykorzystać do potwierdzenia obu wersji, jeśli tylko odpowiednio dobierzemy narzędzia. Dlatego właśnie warto czytać badania ze zrozumieniem – i zawsze zadawać sobie pytanie: co tu naprawdę zostało zmierzone?
O czym tak właściwie mają świadczyć powyższe przykłady?
Powyższe przykłady miały na celu unaocznić, że statystyka, choć w wielu dziedzinach jest niezbędna, pozwala obserwować i interpretować wiele złożonych procesów oraz ułatwia podejmowanie decyzji to jednak nie jest to dziedzina ściśle matematyczna. Wiele jej narzędzi jest wrażliwych na subiektywny wybór metod / zmiennych do analizy jak i jej wyniki podlegają merytorycznej interpretacji przez badaczy. Każdy badacz interpretuje wyniki przez pryzmat własnej wiedzy i przekonań. Interpretacje merytoryczne zawsze w jakiś sposób obarczone są subiektywizmem badacza.
Co możemy zrobić, by być w stanie zabezpieczyć się przed wpływem różnego typu manipulacji? Jak być w stanie wyrabiać swoje własne zdanie i jak czytać wyniki różnych badań. Odpowiedź jest jedna: należy samemu zdobyć podstawową wiedzę statystyczną. Jak statystyka działa, jakie są jej silne bądź słaby strony. W tym celu polecam różne szkolenia m. in. oferowane przez firmę StatSoft Polska.[16]
P.S. Czytając powyższy wpis można by nabrać przeświadczenia o poglądach autora.
Autor na potrzeby wpisu pokazywał jedynie mniej popularną stronę badań niekoniecznie tożsamą z jego prywatnymi przekonaniami.
P.S. 2 W poszukiwaniu danych i materiałów do wpisu w dużej mierze korzystano z ChatGPT. Większość tekstu napisał autor własnoręcznie. Jeden akapit napisał ChatGPT. Zagadka: który?
Autor: Mateusz Żołneczko, Starszy konsultant w zespole analizy danych w StatSoft
Wyrażone w tekście poglądy i opinie są jedynie opiniami autora i niekoniecznie odzwierciedlają poglądy firmy StatSoft Polska.
[1] https://wiadomosci.onet.pl/wbi/polacy-popelniaja-najwiecej-przestepstw-na-wyspach-wyprzedzaja-imigrantow-z-innych/lkn4t4y
[2] https://wiadomosci.onet.pl/tylko-w-onecie/polacy-najliczniejsza-grupa-przestepcza-wsrod-imigrantow-w-w-wielkiej-brytanii/q1efgc
[3] https://www.youtube.com/watch?v=Qh5C23W_ByM&t=2s
[4] https://wpolityce.pl/kraj/725253-lekarz-ktory-kwestionowal-obostrzenia-znow-moze-pracowac
[5] https://dorzeczy.pl/kraj/708156/jest-prawomocny-wyrok-w-sprawie-doktora-zbigniewa-martyki.html
[6] https://instytutsprawobywatelskich.pl/polowania-na-lekarzy-dr-martyka-covid-i-utajnione-rozprawy-sadowe/
[7] Produkty roślinne i tradycyjne roślinne są regulowane w UE https://www.ema.europa.eu/en/human-regulatory-overview/research-development/scientific-guidelines/multidisciplinary-guidelines/herbal-medicinal-products-scientific-guidelines
[8] https://www.thelancet.com/journals/lancet/article/PIIS0140-67362031143-0/fulltext
[9] https://pmc.ncbi.nlm.nih.gov/articles/PMC7498439/#:~:text=2
[10] Warto zauważyć The Lancet to jedno z najbardziej prestiżowych czasopism z bardzo rygorystycznym procesem recenzji i wysokim wskaźnikiem cytowań. Publikowane tam prace często mają realny wpływ na politykę zdrowotną. Journal of Integrative Medicine skupia się na medycynie komplementarnej i alternatywnej, czyli metodach, które nie zawsze opierają się na tych samych twardych dowodach, co medycyna konwencjonalna. Standardy mogą być mniej rygorystyczne, a publikacje często mają inny cel – np. eksplorowanie nowych podejść, które dopiero wymagają solidnych dowodów.
[11] https://www.who.int/news/item/10-10-2019-the-use-of-non-pharmaceutical-forms-of-artemisia#:~:text=Following%20an%20extensive%20evidence%20review,issue%20with%20a%20clear%20message
[12]https://pmc.ncbi.nlm.nih.gov/articles/PMC4311864/#:~:text=Dried%20whole,actually%20more%20resilient%20to
[13] https://www.mcgill.ca/oss/article/critical-thinking-health-and-nutrition/why-did-denmark-ban-ashwagandha#:~:text=Ashwagandha%20is%20a%20traditional%20Indian,consumers%20be%20worried%20about%20ashwagandha
[14] Twenge, J. M., Joiner, T. E., Rogers, M. L., & Martin, G. N. (2018). Increases in depressive symptoms, suicide-related outcomes, and suicide rates among U.S. adolescents after 2010 and links to increased new media screen time. Clinical Psychological Science, 6(1), 3–17
[15] Orben, A., & Przybylski, A. K. (2019). The association between adolescent well-being and digital technology use. Nature Human Behaviour, 3(2), 173–182. DOI: 10.1038/s41562-018-0506-1
[16] https://www.statsoft.pl/Uslugi/Kursy-i-szkolenia/Programy-szkolen/?