Zastosowania statystyki i data mining w badaniach naukowych
Warszawa, 22 października 2013


Praktyczne aspekty szacowania liczebności próby w badaniach empirycznych

Ustalanie odpowiedniej liczby obiektów do uwzględnienia w badaniach jest jednym z ważnych aspektów, które trzeba rozstrzygnąć w niemalże każdym projekcie badawczym. Jest wiele powodów uzasadniających znaczenie tego zagadnienia. Część z nich jest związana ze środkami, którymi dysponuje badacz oraz wymaganiami techniczno-organizacyjnymi natomiast część dotyczy wymogów o charakterze statystycznym. W trakcie wystąpienia zostaną krótko omówione najważniejsze z nich, gdyż uwzględnienie jednych i drugich jest sporym wyzwaniem dla badacza. z punktu widzenia wymogów statystycznych odpowiednia wielkość próby jest powiązana z kilkoma czynnikami, które występują w kontekście weryfikacji hipotez statystycznych. Znajomość tych czynników jest potrzebna w praktyce przy szacowaniu liczebności próby. W drugiej części zostaną zaprezentowane przykłady szacowania wielkości próby za pomocą odpowiednich procedur dostępnych w module Analiza mocy testu w programie STATISTICA.


Wpływ czynników degradacji wód na ocenę stanu ekologicznego rzek – wyniki badań doświadczalnych

Badano wpływ poziomu eutrofizacji wody i stopnia przekształceń hydromorfologicznych rzek na ich stan ekologicznych oceniony na podstawie roślin wodnych. W tym celu przeprowadzono badania terenowe odcinków rzek nizinnych o długości 500 m, na których określono skład jakościowy i ilościowy makrofitów oraz na tej podstawie obliczono wskaźniki stanu ekologicznego oraz różnorodności biologicznej. Ponadto zbadano stan fizyko-chemiczny wody oraz przeprowadzono badania hydromorfologiczne metodą RHS. Poziom eutrofizacji określono na podstawie trzech parametrów: stężeń fosforanów i azotu mineralnego w wodzie oraz konduktywności. Czynnik Eutrofizacja wody działał na dwóch poziomach: Niska i Wysoka. Stopień przekształceń hydromorfologicznych określono na podstawie wartości syntetycznego wskaźnika przekształcenia (HMS). Czynnik Przekształcenia hydromorfologiczne działał na trzech poziomach: Małe, Średnie i Duże. Wyniki doświadczenia opracowano za pomocą dwuczynnikowej analizy wariancji w programie STATISTICA. Zaobserwowano obniżenie stanu ekologicznego rzek, zarówno w przypadku wzrostu trofii wody, jak i zwiększenia stopnia przekształceń hydromorfologicznych. Wystąpił również efekt interakcji pomiędzy analizowanymi czynnikami. Przekształcenia hydromorfologiczne powodowały istotne obniżenie stanu ekologicznego wyłącznie w przypadku niskiej trofii wody. W odniesieniu do wskaźników różnorodności biologicznej, zaobserwowano efekt interakcji pomiędzy analizowanymi czynnikami. Przy braku przekształceń hydromorfologicznych wyższa bioróżnorodność występowała przy wysokim poziomie trofii wody, podczas gdy przy przekształceniach średnich i wysokich – przy niskim poziomie trofii.


Klasyfikatory pojedyncze i zintegrowane jako narzędzie wspomagania medycyny

Przy współczesnym rozwoju techniki medycznej uzyskuje się zbiory danych, reprezentowanych przez wiele zmiennych opisujących pacjentów. Ekspert medyczny jest w stanie analizować jednocześnie około kilkunastu cech. Zastosowanie metod statystycznych w połączeniu z możliwościami szybkiego wykonywania analiz z pomocą techniki komputerowej prowadzi do procedur wspomagania podejmowania decyzji, na przykład poprzez systemy skoringowe. Wprowadzenie metod statystyki wielowymiarowej, poprzez wykorzystanie zbioru z wzorcowymi rozpoznaniami do tworzenia modeli dyskryminacyjnych, przyczynić się może nie tylko do wspomagania decyzji biomedycznych, ale także poszerzać wiedzę z zakresu diagnostyki różnicowej poprzez wybór najsilniej różnicujących cech.

W pracy opisane zostaną motywacje, założenia i problemy związane z zastosowaniem dyskryminacji parametrycznej i nieparametrycznej do wspomagania diagnozy czy rokowania. Przedstawione zostaną wielowymiarowe nadzorowane metody klasyfikacyjne, pojedyncze oraz ich techniki ich integracji, mające na celu poprawienie własności modeli dyskryminacyjnych. Metody te zostaną zilustrowane przykładami analiz na zbiorach rzeczywistych danych medycznych.


Co wie smartfon? – rozpoznawanie aktywności człowieka metodami klasyfikacyjnymi STATISTICA Data Miner

Smartfony, oprócz podstawowej funkcji telefonu oferują wiele dodatkowych możliwości wynikających z wprowadzenia systemu operacyjnego i zastosowania różnych czujników mechanicznych. Już teraz urządzenia mogą śledzić nasze działania i uczyć się naszych zachowań. Informacje uzyskane z analizy zebranych sygnałów mogą być wykorzystane przykładowo w celu dopasowania środowiska do naszych upodobań lub poprawy bezpieczeństwa. Określenie aktywności użytkownika na podstawie informacji gromadzonych w smartfonach jest możliwe dzięki zastosowaniu modeli klasyfikacyjnych. W prezentacji przedstawiony zostanie przykład analizy takich danych wykorzystujący metodę klasyczną – analizę dyskryminacyjną oraz metody data mining – drzewa klasyfikacyjne i losowy las.


Uniwersalność zastosowań modeli scoringowych

Modele scoringowe znajdują zastosowanie we wszystkich obszarach badawczych, w których zadaniem badacza jest prognozowanie możliwości realizacji jednego z dwóch możliwych rezultatów określonego zdarzenia.

Model scoringowy wykorzystując zestaw cech (predyktorów) i nadanych im wag przypisuje prawdopodobieństwo realizacji wyróżnionego zdarzenia (ryzyka). Na tej podstawie możliwa jest predykcja wystąpienia określonego zdarzenia u poszczególnych jednostek jak i w całej populacji. Niewątpliwą zaletą modeli jest ich obiektywność, uniwersalność i prostota stosowania.

Modele scoringowe wykorzystywane są w wielu obszarach m.in. do badania ryzyka upadłości przedsiębiorstw, skuteczności: akcji windykacyjnych, działań marketingowych, lojalności klientów itp. Zastosowanie znalazły również w medycynie i we wszystkich tych dziedzinach w których buduje się modele predykcyjne.
W pierwszej części prezentacji przedstawiona zostanie idea budowy modeli scoringowych w oparciu o funkcję logistyczną, charakterystyka predyktorów, kryteria oceny jakości modelu i jego zdolności predykcyjnych. W drugiej części omówione zostaną wybrane modele scoringowe zbudowane dla oceny ryzyka w różnych problemach decyzyjnych.


Dobór planu doświadczenia i analiza wyników w badaniach technicznych

Na procedurę klasycznego planowania i analizy doświadczeń składa się z kilku wyraźnie wyodrębnionych etapów, które są rozdzielone w czasie i mają ustaloną kolejność realizacji. Dobra znajomość metodyki planowania doświadczeń umożliwia badaczowi realizację założonych celów badawczych przy uwzględnieniu ograniczonych środków, którymi zazwyczaj dysponuje . W trakcie wystąpienia zostaną przedstawione wybrane problemy, występujące na poszczególnych etapach projektowania badania.
Niektóre z poruszanych zagadnień zostaną rozwinięte na przykładzie badania właściwości eksploatacyjnych supertwardych powłok elektroiskrowych modyfikowanych laserowo. Praktyczne aspekty planowania eksperymentu oraz opracowania jego wyników zostaną zilustrowane przy okazji modelowania współczynnika tarcia w przypadku powierzchni teksturowanej laserowo.