Szczegółowe informacje

Seminarium
ZASTOSOWANIA STATYSTYKI
I DATA MINING
W BADANIACH NAUKOWYCH



Metodologiczne aspekty badań biologii człowieka. Wyjaśnianie strategii adaptacyjnej człowieka metodami genetyki ilościowej.
Realizacja molekularnych instrukcji w postaci wyposażenia genetycznego pokolenia oraz wpływów i roli środowiska w kształtowaniu ontogenezy człowieka jest zjawiskiem bardzo interesującym i niezwykle skomplikowanym, dlatego że zarówno materiał dziedziczy (geny), jak i środowisko (kultura) nie są jednoznacznie deterministyczne wobec zjawisk i cech kształtowanych w tym procesie. To oznacza, że zarówno geny, jak i środowisko determinują jedynie probabilistyczny charakter tych zjawisk. Probabilistyczna jest więc dla pokolenia oraz osobnika zarówno jego „wartość genotypowa”, jak i jakość „środowiska”. Ten nieprzewidywalny, samoregulacyjny charakter kształtowania zjawisk biologicznych w tym procesie jest właśnie z tego powodu niezwykle interesujący. W efekcie rozważamy fakt, w jaki sposób genom człowieka jest odpowiedzialny zarówno za to, co mamy wspólnego z innymi ludźmi, jak i za to, co jest w nas indywidualne i niepowtarzalne. Wyjaśnić tę równoczesną jedność i różnorodność da się, jak sądzę, metodami genetyki ilościowej, tj. matematycznym modelem determinacji genetycznej poligenicznej dla cech o charakterze ilościowym. Genetyka ilościowa to inaczej teoria wielogenowych wpływów, które wraz ze zmiennością środowiska wyrażają się w ilościowych ciągłych rozkładach fenotypów. Stosując metody statystyki, zarówno opisu, jak i analizy, np. modelu regresji oraz oceny rzetelności uzyskanych wyników za pomocą testów i prognozowania zjawisk, np. na podstawie regresji liniowej, da się wyjaśnić, jak sądzę, mechanizm kształtowania cech ilościowych w ontogenezie człowieka, wyjaśniając równocześnie, jak należy rozumieć ten niesprecyzowany jednoznacznie udział genów i środowiska w kształtowaniu fenotypu – cechy ilościowej.

Zastosowania statystyki w badaniach naukowych – potrzeba czy konieczność?
Przy próbie oceny korzyści i ograniczeń jakie występują w przypadku stosowania statystyki na różnych etapach badania naukowego warto rozważyć analogię do systemów sprawowania władzy. System demokratyczny jest dość powszechnie krytykowany, a jego oponenci przytaczają wiele argumentów potwierdzających ich tezy. Z drugiej jednak strony można również spotkać się z opinią, że demokracja ma oczywiście swoje wady, ale nic lepszego do tej pory nie wymyślono. W przypadku wykorzystywania podejścia statystycznego badacz świadomie lub nieświadomie godzi się na cały szereg uproszczeń ze względu na brak lepszej alternatywy. Jednocześnie w bardzo wielu badaniach można zaobserwować dość swobodne traktowanie zarówno wymogów statystycznych jak i metodologicznych. W niniejszym opracowaniu zwrócono uwagę na niektóre wybrane aspekty planowania i interpretacji wyników badań empirycznych, które powinny być brane pod uwagę przy ich podejmowaniu.

Zastosowanie technik data mining w badaniach naukowych
Zakres zastosowań analizy danych w różnych dziedzinach badań naukowych stale się poszerza. Wynika to w głównej mierze z coraz powszechniejszego przekonania, że przy rozwiązywaniu różnego rodzaju zagadnień poznawczych i praktycznych trzeba opierać się na empirycznych danych, opisujących badane zjawiska i procesy. Z drugiej strony obecnie dostępnych jest coraz więcej informacji, prawie wszystko jest mierzone, a pomiary archiwizowane. Bardzo szybko rośnie wolumen danych poddawanych analizie, stawiane są coraz to nowe problemy oraz rosną oczekiwania. W związku z tym musi się poszerzać również zakres stosowanych technik analizy danych.

Pamięć doświadczenia i opinia - strukturalna analiza wpływu informacji prasowych na preferencje wyborcze
Wyniki badań przeprowadzone w paradygmacie wstecznego kształtowania pamięci dowodzą, że istnieje możliwość zniekształcenia pamięci danego doświadczenia pod wpływem później przeczytanej opinii. Osoby badane w eksperymencie wstecznego kształtowania pamięci oceniały polityka, a następnie, po upływie tygodnia i przeczytaniu opinii prasowej na temat wcześniej ocenianego kandydata, przypominały swoje wcześniejsze oceny. Wyniki eksperymentów wykazały, że przypominane informacje mogą być związane z doświadczeniem, które nigdy w rzeczywistości nie zostało nabyte. Pokazano ponadto, że program wyborczy polityka, a nie jego cechy osobowe czy fizyczne, jest głównym elementem oceny jego wizerunku. Taki sposób konstruowania rzeczywistości politycznej umożliwia wykreowanie fałszywego wizerunku kandydata na urząd polityczny, zapisanego w pamięci wyborcy jako jego własne doświadczenie.

Jaką marchew wybrać na surówkę, czyli przykład zastosowania wybranych modeli dyskryminacyjnych w analizie danych
Prezentowane zagadnienie będzie dotyczyło klasyfikacji wzorcowej korzeni marchwi, na podstawie prostych danych obrazowych, charakteryzujących barwę tych korzeni. Klasyfikacja wzorcowa jest jednym z terminów, którym określa się analizę dyskryminacyjną. Głównym celem tej analizy jest znalezienie matematycznej reguły lub funkcji dyskryminacyjnej, która określa przynależność obserwacji do określonej klasy, na podstawie opisujących ją zmiennych ilościowych. Do metod realizujących analizę dyskryminacyjną zaliczyć można m.in. metody klasyczne (np. liniowe i kwadratowe funkcje dyskryminacyjne), metodę k-najbliższych sąsiadów, sieci neuronowe oraz metodę wektorów wspierających - SVM. Podczas prezentacji omówiona zostanie idea klasyfikatora SVM oraz jego ocena względem metod klasycznych.

Zastosowanie wybranych metod statystycznych do analizy rynku nieruchomości
Rzeczywistość możemy opisać na wiele sposobów. W naukach ścisłych badacze starają się przede wszystkim znaleźć związek funkcyjny lub stochastyczny pomiędzy badanymi wielkościami. Podstawowym problemem analizy rynku nieruchomości w Polsce, wielokrotnie wskazywanym w literaturze fachowej i raportach bankowych, jest brak wiarygodnych danych. Jest to trudne zagadnienie i w wielu przypadkach wręcz niemożliwe. W bardzo skomplikowanej i niezwykle szybko zmieniającej się rzeczywistości najczęstszym powodem braku jednoznacznych rozwiązań jest nieuwzględnienie odpowiednich danych w modelu matematycznym lub mała wiarygodność użytych danych. Na przykładzie badania rynku nieruchomości zostaną przedstawione niektóre możliwości pakietu STATISTICA do badania rynku nieruchomości.




Patronat nad seminarium objęło:




Patronat medialny: