Analiza danych dla managerów – źródło przewagi konkurencyjnej nowoczesnego biznesu




Warszawa, 19 października 2010

Aktualna oferta StatSoft Polska

W trakcie tego wprowadzającego wystąpienia zostaną przedstawione wybrane cechy oprogramowania STATISTICA w najnowszej wersji 9. W skrócie omówione zostaną także usługi StatSoft w zakresie analizy danych (m.in. szkolenia).

Opracowanie wyników badań ankietowych w programie STATISTICA

Często etap opracowywania wyników badań ankietowych pokazuje, ilu problemów można by uniknąć, gdyby poświęcono więcej uwagi samemu przeniesieniu odpowiedzi do postaci elektronicznej. Odpowiednie przygotowanie arkusza danych i sprawdzenie poprawności odpowiedzi mają szczególne znaczenie w przypadku, gdy wyniki są wprowadzane przez różnych ankieterów, lub gdy inne osoby zajmują się wprowadzeniem i analizą danych. W prezentacji pokażemy przykład przygotowania arkusza STATISTICA, zakodowania odpowiedzi różnego typu i wstępnego sprawdzenia poprawności danych. Zaprezentowane zostaną również metody wyszukiwania ukrytych nieprawidłowości, wynikających np. z nierzetelności ankietera lub nieuczciwego wypełnienia ankiety przez respondenta. W analizach wykorzystane zostaną zarówno podstawowe narzędzia analityczne STATISTICA, stosowane w opracowaniu wyników badań ankietowych, jak i bardziej specjalistyczne rozwiązania dostępne w programie STATISTICA Zestaw do Analiz Marketingowych i Rynkowych.

Sterowanie jakością procesu o wielu właściwościach: wielowymiarowe karty kontrolne i inne narzędzia

Statystyczne sterowanie jakością procesów (SPC) udowodniło swoją skuteczność w wielu dziedzinach. Jednak oryginalnie zostało opracowane dla procesów, w których ważna jest jedna właściwość. W rzeczywistości często mamy do czynienia z procesami charakteryzowanym przez wiele, powiązanych ze sobą cech. Zajmiemy się narzędziami służącymi do sterowania jakością takich właśnie procesów.

Wykorzystanie data mining do oceny produktów na podstawie widma NIR

Spektroskopia w bliskiej podczerwieni (ang. Near Infrared, NIR) oraz podobne techniki są coraz częściej stosowane w wielu dziedzinach (np. przemyśle farmaceutycznym, spożywczym i petrochemicznym, ale także w kryminalistyce). Dzieje się tak, ponieważ spektroskopia NIR umożliwia szybkie uzyskanie wyników badań i może być stosowana on-line, a nawet in-line, czyli bezpośrednio na linii produkcyjnej. Jednak do jej praktycznego wykorzystania wymagana jest tzw. kalibracja, umożliwiająca powiązanie widma z właściwościami badanych próbek. Zazwyczaj kalibrację wykonuje się za pomocą metod klasycznej statystyki wielowymiarowej: regresji wielorakiej, analizy składowych głównych (PCA), modeli cząstkowych najmniejszych kwadratów (PLS) i analizy Fouriera (zob. [1], [5]). W przykładzie wykorzystamy do tego celu metodę data mining: MARSplines.

WebUsage Mining, czyli jak sprzedać sukienkę ciążową w Internecie

Celem wystąpienia jest prezentacja nieukierunkowanego modelu data mining zbudowanego w oparciu o dane pochodzące ze sklepu internetowego. Jest to jedno z wielu zastosowań tzw. web miningu, które w tym wypadku dotyczy analizy strumienia ruchu na stronie internetowej. Dane nt. zakupów i odwiedzin witryny pochodzą z pierwszego półrocza 2008 r., zaś wykorzystane narzędzia analityczne to reguły sekwencyjne i uzupełniająco – na potrzeby analizy koszykowej – reguły asocjacyjne. Modele te są zwykle wykorzystywane do personalizacji przekazu, usprawnienia systemu czy modyfikacji wyglądu i struktury strony.

Modele skoringowe w biznesie i nauce

Modele skoringowe to popularny typ modeli klasyfikacyjnych wykorzystywany w sytuacji, gdy wartości dwustanowej zmiennej jakościowej, która w zależności od branży czy zastosowania może oznaczać na przykład zdrowie/chorobę, zakup/brak zakupu czy spłatę/brak spłaty, pragniemy objaśnić za pomocą innych zmiennych. Podczas wystąpienia przedstawione zostaną charakterystyczne cechy modeli skoringowych oraz ich możliwe zastosowania w biznesie, medycynie oraz różnych obszarach nauki. Zaprezentowane zostaną dwie grupy metod pozwalających na budowę modeli skoringowych – statystyczne oraz data mining, a także przedstawiony zostanie przykład budowy i oceny modeli w środowisku STATISTICA.