STATYSTYKA I DATA MINING W BADANIACH NAUKOWYCH
Jak skutecznie wykorzystywać metody statystyczne w planowaniu i przeprowadzaniu eksperymentu naukowego?
prof. zw. dr hab. Cezary Watała, Zakład Zaburzeń Krzepnięcia Krwi, Uniwersytet Medyczny w Łodzi
Wykład będzie obejmował następujące zagadnienia:
- algorytm przeprowadzenia eksperymentu naukowego - spojrzenie statystyka
- planowanie doświadczenia wykorzystanie kwadratów łacińskich
- prawdopodobieństwo a proporcja
- hipotezy badawcze a hipotezy statystyczne
- budowanie i weryfikacja hipotez statystycznych, błędy statystyczne i co z nich wynika
- jak dobierać istotność testu - weryfikacja czy eksploracja statystyczna
- szacowanie wielkości próby badanej, po co i jak je przeprowadzamy?
- badanie asocjacji co, kiedy i w jaki sposób?
- jak dobieramy grupę kontrolną?
- kiedy i jak dokonać wyboru metody statystycznej / testu?
- podstawowe błędy popełniane w statystycznej analizie danych jak ich unikać lub minimalizować ich ryzyko?
Biosystematyka trzcinników (Calamagrostis Adanson) w obrębie sekcji Deyeuxia
dr Beata Paszko, Zakład Systematyki Roślin Naczyniowych, Instytut Botaniki PAN im. W. Szafera w Krakowie
Przyrodnicy starają się jak najlepiej oddać wzajemne relacje pokrewieństwa pomiędzy organizmami. We współczesnej systematyce roślin szeroko stosowana jest taksonomia numeryczna (taksometria, fenetyka). Taksometria jest najbardziej użyteczna w sprawdzaniu istniejących klasyfikacji, w wykazywaniu ich słabych i mocnych stron, jak również wskazuje drogi ich modyfikacji i ulepszania. Odnosi ona sukces w przypadku, kiedy inne metody zawodzą, albo są żmudne, czy też trudne do zastosowania, jak na przykład w przypadku klasyfikacji różnych mikroorganizmów czy mieszańców w obrębie rodzaju Calamagrostis (Poaceae). Taksometria wykorzystuje wielowymiarowe metody statystyczne (multivariate statystical analysis - MSA): analizę grupującą, analizę składowych głównych (PCA), analizę dyskryminacyjną czy wielowymiarową analizę wariancji (MANOVA). Analizy numeryczne chociaż bardziej skomplikowane eliminują pierwiastek subiektywizmu.
Wpływ płci na farmakokinetykę wybranych leków
dr Lucyna Konieczna, prof. zw. dr hab. Henryk Lamparczyk, Katedra i Zakład Chemii Farmaceutycznej, AM w Gdańsku
Stężenie jak i dawkowanie leku zależą od stanu klinicznego pacjenta, stopnia zaawansowania choroby, współistniejących schorzeń wymagających podawania innych leków jak również innych czynników. Ponieważ farmakokinetyka umożliwia określenie współzależności dotyczących uwalniania leku, jego wchłaniania, dystrybucji, metabolizmu i wydalania, bardzo ważnym zagadnieniem jest zbadanie wpływu płci na los leku w ustroju warunkującym jego efekt terapeutyczny. Zagadnieniem tym zajmowało się już wielu autorów, a wyniki tych badań są często niejednoznaczne i sprzeczne. Może to być spowodowane wykorzystaniem nieodpowiednich metod statystycznych do oceny uzyskanych wyników. Zastosowanie przetworzonych danych, jakimi są wartości parametrów farmakokinetycznych takich jak: pole powierzchni pod krzywą zależności stężenie-czas (AUC), maksymalne stężenie leku we krwi (Cmax) oraz czas potrzebny do uzyskania stężenia maksymalnego (Tmax) jest regułą. Z tego powodu kilka ważnych informacji zostaje bezpowrotnie utraconych. Obserwujemy dużą zmienność osobniczą wśród podmiotów badań, która nie została właściwie oceniona pod względem statystycznym. Oznacza to, że temat wpływu płci na farmakokinetykę leków jest ważny i wciąż aktualny, nie tylko ze względów poznawczych, ale i praktycznych. Stąd celem obecnej analizy jest potwierdzenie lub zaprzeczenie obecności interakcji płeć-farmakokinetyka dla ofloksacyny i hydrochlorotiazydu po jednorazowym podaniu dawki zdrowym ochotnikom. Rozbudowany pakiet programów STATISTICA umożliwił weryfikację powyższej hipotezy badawczej. Zastosowanie wielowariancyjnych metod statystycznych (analiza składowych głównych - PCA oraz analiza skupień - CA) pozwoliło na zidentyfikowanie osób odpowiedzialnych za ewentualną różnicę płci. Stwierdzono statystycznie istotną zależność pomiędzy stężeniem substancji leczniczej a płcią zdrowych ochotników dla ofloksacyny, nie wykazano takiej interakcji dla hydrochlorotiazydu.
Dane całego profilu farmakokinetycznego umożliwiły znalezienie subtelnych różnic pomiędzy grupą kobiet i mężczyzn.
Przykłady budowy modeli regresyjnych i klasyfikacyjnych
dr Janusz Wątroba, StatSoft Polska
Tematyka artykułu obejmuje wprowadzenie do problematyki modelowania statystycznego i jego roli w badaniu mechanizmów rządzących przebiegiem różnorodnych zjawisk i procesów, będących przedmiotem zainteresowania w wielu dziedzinach działalności praktycznej i badawczej człowieka. Rozważania teoretyczne zostały uzupełnione przykładami budowania i interpretacji wyników analizy modeli regresyjnych i klasyfikacyjnych.
Efektywność wybranych metod szacowania udziału źródeł punktowych w zanieczyszczeniu wód powierzchniowych
dr inż. Marzena Marcinowska, Wydział Inżynierii Środowiska, Politechnika Warszawska
Tematem prezentacji będzie analiza przydatności oraz porównanie ze sobą wybranych metod służących do szacowania wpływu punktowych źródeł zanieczyszczeń na jakość wód powierzchniowych. Porównania poszczególnych metod dokonano na podstawie danych pozyskanych z numerycznego modelu jakości wody stanowiącego tzw. rzeczywistość wirtualną. Wykonano eksperymenty służące określeniu udziałów trzech punktowych strumieni masy sześciu substancji w przyjętym punkcie kontrolnym.
W czasie prezentacji przedstawiony zostanie m.in. sposób wykorzystania analizy regresji wielu zmiennych oraz analizy składowych głównych do przedstawionego zagadnienia oraz sposób wykorzystania programu STATISTICA do zautomatyzowania obliczeń niezbędnych do realizacji pracy.
Wpływ aktywności mieszkańców na poziom życia w gminach woj. małopolskiego
mgr Mariusz Łapczyński, Katedra Analizy Rynku i Badań Marketingowych, Akademia Ekonomiczna w Krakowie
Celem opracowania jest próba zbadania zależności między wskaźnikami aktywności a wskaźnikami poziomu życia mieszkańców gmin woj. małopolskiego. Aktywność traktowana jest w dwóch wymiarach:
- jako aktywność ekonomiczna (współczynnik aktywności zawodowej w %, wskaźnik zatrudnienia w %, liczba podmiotów gospodarczych na 1000 mieszkańców oraz udział prywatnych podmiotów gospodarczych w całkowitej liczbie PGN w danej gminie);
- jako aktywność obywatelska (frekwencja mieszkańców gmin w kolejnych wyborach: prezydenckich w 2000 r., parlamentarnych w 2001 r., samorządowych w 2002 r., w referendum unijnym w 2003 r. i wyborach do Parlamentu UE w 2004 r. oraz liczba szkolnych klubów europejskich).
Poziom życia mieszkańców będą tutaj opisywać następujące wskaźniki:
- ekonomiczne (przeciętne miesięczne wynagrodzenie w zł, dochody własne gminy na 1 osobę w zł);
- mieszkaniowe - wyrażone przeciętną powierzchnią użytkową mieszkania na 1 osobę w m2;
- "konsumpcyjne" (zużycie gazu z sieci w ciągu roku na 1 odbiorcę w m3, zużycie energii elektrycznej w ciągu roku na 1 odbiorcę w kW-h);
- związane z infrastrukturą techniczną (długość sieci wodociągowej w km, długość sieci kanalizacyjnej w km)
- związany z migracją ludności (przyjęto, że gminy o dodatnim saldzie migracji stałych można traktować, jako bardziej atrakcyjne, jeśli chodzi o wybór miejsca zamieszkania, a tym samym, jako gminy o wyższym poziomie życia).
W badaniach połączono podejście statystyczne (współczynniki korelacji liniowej Pearsona, metoda k-średnich) oraz podejście data mining (drzewa klasyfikacyjne CART).
Sztuczna inteligencja we wspomaganiu procesu prognozowania w przedsiębiorstwie
dr inż. Tadeusz Grzeszczyk, Instytut Organizacji Systemów Produkcyjnych, Politechnika Warszawska
Autor bada zintegrowane systemy sztucznej inteligencji m. in. służące wspomaganiu procesu prognozowania w przedsiębiorstwie. Zgodnie z przyjętymi założeniami systemy te powinny umożliwiać zastosowanie zróżnicowanych, komplementarnych metod do analizy ilościowych i jakościowych parametrów. W referacie rozważa się możliwość wykorzystania neuronowego modelu szeregu czasowego do analizy ilościowej oraz metody zbiorów przybliżonych do tworzenia bazy wiedzy zawierającej jakościową wiedzę ekspertów. Do integracji metody ilościowej z ocenami ekspertów autor proponuje sieć neuronową.
Dlaczego blondynki są głupie? - Wpływ stereotypów na osoby będące ich obiektem
dr Sylwia Bedyńska, Szkoła Wyższa Psychologii Społecznej, Instytut Psychologii PAN
Celem wystąpienia będzie przedstawienie badań poszukujących zmiennych odpowiedzialnych za niskie wykonanie zadań poznawczych u osób zagrożonych negatywnym stereotypem. Na przykładzie badań eksperymentalnych z udziałem kobiet o jasnych włosach zostanie pokazane jak maksymalnie wykorzystać mierzone psychologiczne właściwości osób badanych w celu odpowiedzi na pytanie o naturę oddziaływania negatywnego stereotypu. Testowane będą hipotezy o mediacyjnym i moderacyjnym wpływie subiektywnego odczucia trudności w myśleniu na wielkość zasobów poznawczych.