STATYSTYKA I DATA MINING W BADANIACH NAUKOWYCH



Jak skutecznie wykorzystywać metody statystyczne w planowaniu i przeprowadzaniu eksperymentu naukowego?
prof. zw. dr hab. Cezary Watała, Zakład Zaburzeń Krzepnięcia Krwi, Uniwersytet Medyczny w Łodzi

Wykład będzie obejmował następujące zagadnienia:


Biosystematyka trzcinników (Calamagrostis Adanson) w obrębie sekcji Deyeuxia
dr Beata Paszko, Zakład Systematyki Roślin Naczyniowych, Instytut Botaniki PAN im. W. Szafera w Krakowie

Przyrodnicy starają się jak najlepiej oddać wzajemne relacje pokrewieństwa pomiędzy organizmami. We współczesnej systematyce roślin szeroko stosowana jest taksonomia numeryczna (taksometria, fenetyka). Taksometria jest najbardziej użyteczna w sprawdzaniu istniejących klasyfikacji, w wykazywaniu ich słabych i mocnych stron, jak również wskazuje drogi ich modyfikacji i ulepszania. Odnosi ona sukces w przypadku, kiedy inne metody zawodzą, albo są żmudne, czy też trudne do zastosowania, jak na przykład w przypadku klasyfikacji różnych mikroorganizmów czy mieszańców w obrębie rodzaju Calamagrostis (Poaceae). Taksometria wykorzystuje wielowymiarowe metody statystyczne (multivariate statystical analysis - MSA): analizę grupującą, analizę składowych głównych (PCA), analizę dyskryminacyjną czy wielowymiarową analizę wariancji (MANOVA). Analizy numeryczne chociaż bardziej skomplikowane eliminują pierwiastek subiektywizmu.


Wpływ płci na farmakokinetykę wybranych leków
dr Lucyna Konieczna, prof. zw. dr hab. Henryk Lamparczyk, Katedra i Zakład Chemii Farmaceutycznej, AM w Gdańsku

Stężenie jak i dawkowanie leku zależą od stanu klinicznego pacjenta, stopnia zaawansowania choroby, współistniejących schorzeń wymagających podawania innych leków jak również innych czynników. Ponieważ farmakokinetyka umożliwia określenie współzależności dotyczących uwalniania leku, jego wchłaniania, dystrybucji, metabolizmu i wydalania, bardzo ważnym zagadnieniem jest zbadanie wpływu płci na los leku w ustroju warunkującym jego efekt terapeutyczny. Zagadnieniem tym zajmowało się już wielu autorów, a wyniki tych badań są często niejednoznaczne i sprzeczne. Może to być spowodowane wykorzystaniem nieodpowiednich metod statystycznych do oceny uzyskanych wyników. Zastosowanie przetworzonych danych, jakimi są wartości parametrów farmakokinetycznych takich jak: pole powierzchni pod krzywą zależności stężenie-czas (AUC), maksymalne stężenie leku we krwi (Cmax) oraz czas potrzebny do uzyskania stężenia maksymalnego (Tmax) jest regułą. Z tego powodu kilka ważnych informacji zostaje bezpowrotnie utraconych. Obserwujemy dużą zmienność osobniczą wśród podmiotów badań, która nie została właściwie oceniona pod względem statystycznym. Oznacza to, że temat wpływu płci na farmakokinetykę leków jest ważny i wciąż aktualny, nie tylko ze względów poznawczych, ale i praktycznych. Stąd celem obecnej analizy jest potwierdzenie lub zaprzeczenie obecności interakcji płeć-farmakokinetyka dla ofloksacyny i hydrochlorotiazydu po jednorazowym podaniu dawki zdrowym ochotnikom. Rozbudowany pakiet programów STATISTICA umożliwił weryfikację powyższej hipotezy badawczej. Zastosowanie wielowariancyjnych metod statystycznych (analiza składowych głównych - PCA oraz analiza skupień - CA) pozwoliło na zidentyfikowanie osób odpowiedzialnych za ewentualną różnicę płci. Stwierdzono statystycznie istotną zależność pomiędzy stężeniem substancji leczniczej a płcią zdrowych ochotników dla ofloksacyny, nie wykazano takiej interakcji dla hydrochlorotiazydu. Dane całego profilu farmakokinetycznego umożliwiły znalezienie subtelnych różnic pomiędzy grupą kobiet i mężczyzn.


Przykłady budowy modeli regresyjnych i klasyfikacyjnych
dr Janusz Wątroba, StatSoft Polska

Tematyka artykułu obejmuje wprowadzenie do problematyki modelowania statystycznego i jego roli w badaniu mechanizmów rządzących przebiegiem różnorodnych zjawisk i procesów, będących przedmiotem zainteresowania w wielu dziedzinach działalności praktycznej i badawczej człowieka. Rozważania teoretyczne zostały uzupełnione przykładami budowania i interpretacji wyników analizy modeli regresyjnych i klasyfikacyjnych.


Efektywność wybranych metod szacowania udziału źródeł punktowych w zanieczyszczeniu wód powierzchniowych
dr inż. Marzena Marcinowska, Wydział Inżynierii Środowiska, Politechnika Warszawska

Tematem prezentacji będzie analiza przydatności oraz porównanie ze sobą wybranych metod służących do szacowania wpływu punktowych źródeł zanieczyszczeń na jakość wód powierzchniowych. Porównania poszczególnych metod dokonano na podstawie danych pozyskanych z numerycznego modelu jakości wody stanowiącego tzw. rzeczywistość wirtualną. Wykonano eksperymenty służące określeniu udziałów trzech punktowych strumieni masy sześciu substancji w przyjętym punkcie kontrolnym. W czasie prezentacji przedstawiony zostanie m.in. sposób wykorzystania analizy regresji wielu zmiennych oraz analizy składowych głównych do przedstawionego zagadnienia oraz sposób wykorzystania programu STATISTICA do zautomatyzowania obliczeń niezbędnych do realizacji pracy.


Wpływ aktywności mieszkańców na poziom życia w gminach woj. małopolskiego
mgr Mariusz Łapczyński, Katedra Analizy Rynku i Badań Marketingowych, Akademia Ekonomiczna w Krakowie

Celem opracowania jest próba zbadania zależności między wskaźnikami aktywności a wskaźnikami poziomu życia mieszkańców gmin woj. małopolskiego. Aktywność traktowana jest w dwóch wymiarach: Poziom życia mieszkańców będą tutaj opisywać następujące wskaźniki: W badaniach połączono podejście statystyczne (współczynniki korelacji liniowej Pearsona, metoda k-średnich) oraz podejście data mining (drzewa klasyfikacyjne CART).


Sztuczna inteligencja we wspomaganiu procesu prognozowania w przedsiębiorstwie
dr inż. Tadeusz Grzeszczyk, Instytut Organizacji Systemów Produkcyjnych, Politechnika Warszawska

Autor bada zintegrowane systemy sztucznej inteligencji m. in. służące wspomaganiu procesu prognozowania w przedsiębiorstwie. Zgodnie z przyjętymi założeniami systemy te powinny umożliwiać zastosowanie zróżnicowanych, komplementarnych metod do analizy ilościowych i jakościowych parametrów. W referacie rozważa się możliwość wykorzystania neuronowego modelu szeregu czasowego do analizy ilościowej oraz metody zbiorów przybliżonych do tworzenia bazy wiedzy zawierającej jakościową wiedzę ekspertów. Do integracji metody ilościowej z ocenami ekspertów autor proponuje sieć neuronową.


Dlaczego blondynki są głupie? - Wpływ stereotypów na osoby będące ich obiektem
dr Sylwia Bedyńska, Szkoła Wyższa Psychologii Społecznej, Instytut Psychologii PAN

Celem wystąpienia będzie przedstawienie badań poszukujących zmiennych odpowiedzialnych za niskie wykonanie zadań poznawczych u osób zagrożonych negatywnym stereotypem. Na przykładzie badań eksperymentalnych z udziałem kobiet o jasnych włosach zostanie pokazane jak maksymalnie wykorzystać mierzone psychologiczne właściwości osób badanych w celu odpowiedzi na pytanie o naturę oddziaływania negatywnego stereotypu. Testowane będą hipotezy o mediacyjnym i moderacyjnym wpływie subiektywnego odczucia trudności w myśleniu na wielkość zasobów poznawczych.