Zastosowania statystyki i data mining w badaniach naukowych
22 październik 2009


Zrozumieć dane i wyniki (na przykładach badań epidemiologicznych)

Celem prezentacji jest przybliżenie problemów związanych z przeprowadzeniem badania statystycznego, startując od a (A może by tak zacząć od zaplanowania badania) a kończąc na z (Zaprezentujmy i zinterpretujmy uzyskane wyniki). Pomiędzy a i Z znajdą się także uwagi na temat: gromadzenia danych (m. in. cechy dobrego kwestionariusza, sposób zapisu danych), metod weryfikacji danych, zastosowanie metod statystyki opisowej (budowa tabel dla cech jakościowych i ilościowych) oraz zastosowanie odpowiednich, bardziej zaawansowanych analiz statystycznych.


Sondaże w prasie. o pożytku z badań ilościowych w mediach

Sondaże opinii publicznej są ważnym elementem debaty publicznej w Polsce. Odgrywają istotną rolę w diagnozie społecznej, a przez polityków i dziennikarzy są wykorzystywane jako argument w dyskusjach, przesłanka lub uzasadnienie decyzji. Wielu z nich sądzi, że sondaże mogą w istotny sposób wpłynąć na wyniki wyborów, przy czym ów wpływ jest nieokreślony, a empirycznie słabo uzasadniony. Podstawowym problemem jest sposób prezentacji sondaży w mediach. W trakcie wystąpienia zaprezentowane zostaną wyniki analizy publikowanych w prasie sondaży w kampaniach parlamentarnych w Polsce. Skupiono się na analizie jakości informacji metodologicznych i sposobem wykorzystania sondaży w mediach. Część empiryczną wystąpienia stanowi analiza 589 artykułów odwołujących się do sondaży i publikowanych w „Rzeczpospolitej” i „Gazecie Wyborczej” w latach 1991-2007. W odróżnieniu od badań europejskich i amerykańskich nie zaobserwowano poprawy jakości informacji dotyczących badań i sposobów interpretacji wyników, choć – podobnie jak w innych krajach – zanotowano znaczący wzrost ich obecności w mediach. Zestawiając sposób prezentacji wyników sondaży przedwyborczych, „Rzeczpospolita” rzetelniej niż „Gazeta Wyborcza” przedstawiała podstawowe dane dotyczące relacjonowanych badań. Jednocześnie okazało się, że badania własne, zlecane przez wydawców są w mediach nie tylko częściej ale i rzetelniej przedstawiane.


Wspomaganie statystycznej analizy wyników badań empirycznych STATISTICA 9

Badania empiryczne to proces wieloetapowy. Dla poprawnej ich realizacji badacz musi rozwiązać wiele problemów, w tym także takich, które nie dotyczą bezpośrednio dziedziny, w której są one prowadzone. Taka sytuacja może mieć miejsce w przypadku potrzeby zastosowania metod analizy danych. Dwie stosunkowo najczęściej zgłaszane trudności to: (1) dobór odpowiednich metod opracowania danych oraz (2) poprawna interpretacja wyników analiz. Waga problemu wynika z tego, że zarówno nieodpowiedni wybór metod jak i błędna interpretacja wyników prowadzą zwykle do formułowania błędnych wniosków końcowych z badań.

W artykule omówiono wybrane zagadnienia związane z powyższymi trudnościami. Zwrócono uwagę na kryteria decydujące o wyborze stosownych technik analizy danych oraz na przykładach zilustrowano sposób interpretacji wyników. Przy okazji zaprezentowano również narzędzia programu STATISTICA, wspomagające kolejne etapy analizy danych.


Wykorzystanie metod statystycznych w badaniach wpływu spękań na anizotropię prędkości fal sejsmicznych

Spękania występują w skałach powszechnie i mają znaczący wpływ na własności sprężyste masywu skalnego i związane z nimi prędkości propagacji fal sejsmicznych. Zależności te umożliwiają wykorzystanie metod sejsmicznych do określenia kierunków i gęstości spękań, co ma duże znaczenie w geologii inżynierskiej dla oceny stabilności i jakości masywów skalnych przy budowie tuneli, fundamentowaniu obiektów przemysłowych itp. W hydrogeologii rozpoznanie systemów spękań umożliwia określenie właściwości zbiornikowych skał i dróg przepływu wód podziemnych. Ze względu na znaczenie szczelinowatości istotnym zagadnieniem jest możliwość wyznaczenia parametrów spękań w masywach niedostępnych bezpośrednim obserwacjom geologicznym. Pomocny jest tutaj rachunek tensorowy, który określa zależność pomiędzy anizotropią spękań a anizotropią prędkości fal sejsmicznych. W wystąpieniu na przykładach zostanie przedstawiona istota zagadnienia anizotropii, związek anizotropii spękań z anizotropią prędkości fal sejsmicznych oraz zastosowanie metod statystycznych przydatnych przy rozwiązywaniu tego zagadnienia.


Rozmyte metody klasyfikacji w analizie segmentów rynkowych na przykładzie rynku motoryzacyjnego

W zagadnieniu segmentacji rynku jedne z częściej stosowanych metod statystycznych to metody klasyfikacji. Właściwością tych metod jest jednoznaczne przyporządkowywanie obiektów do wyodrębnionych segmentów. Okazuje się, że takie podejście nie zawsze odzwierciedla faktyczny stan rzeczy. Przykładem może być rynek samochodów osobowych gdzie często ten sam model samochodu pozycjonowany jest w dwóch różnych segmentach. Rozwiązaniem w takiej sytuacji może być zastosowanie rozmytych metod klasyfikacji, które pozwalają odejść od orzekania czy samochód należy do określonego segmentu czy nie poprzez określenie jego stopnia przynależności do różnych segmentów. W prezentacji zostaną przedstawione wyniki badania segmentacyjnego przeprowadzonego dla polskiego rynku samochodów osobowych za pomocą rozmytych metod klasyfikacji.