Analiza danych w programie STATISTICA – przegląd
16 październik 2012


Nowe możliwości analizy danych – STATISTICA Zestaw Plus

Podczas wystąpienia zaprezentowane zostaną najważniejsze możliwości programu STATISTICA Zestaw Plus, specjalistycznego pakietu analitycznego, który stanowi uzupełnienie funkcjonalności programów z rodziny STATISTICA.
Program przeznaczony jest zarówno dla osób pragnących wykonywać pogłębioną analizę danych w różnych obszarach biznesu jak również naukowców chcących opracować wyniki swoich badań. Możliwości programu zostaną zilustrowane przykładowymi analizami. Zaprezentowana zostanie analiza PROFIT będąca połączeniem skalowania wielowymiarowego z analizą regresji oraz analiza aglomeracyjna z możliwością wyboru punktu odcięcia.


Makro w cenie – analiza korelacji z wykorzystaniem makr STATISTICA

Analiza korelacji to jedna z najpopularniejszych metod statystycznych wykorzystywanych w badaniu współzależności zmiennych. W trakcie prezentacji zostanie krótko przedstawiona jej idea oraz sposób przeprowadzenia na przykładzie analizy współzmienności cen wybranych towarów i usług konsumpcyjnych.

Jednocześnie wykonywana analiza będzie dobrą okazją do przedstawienia możliwości wykorzystania makr SVB w pracy analityka. Istotną cechą makr jest możliwość ich automatycznego nagrywania i łatwej modyfikacji przy stosunkowo małym nakładzie pracy użytkownika. W efekcie końcowym wszystkie zarejestrowane w trakcie pracy analizy będą uruchamiane jednym przyciskiem umieszczonym w menu programu STATISTICA.


Jak poprawnie zastosować wielowymiarową analizę wariancji (MANOVA) – pokonać trudności i osiągnąć korzyści

W zastosowaniach metod statystycznych od dłuższego czasu można zaobserwować wyraźny wzrost zainteresowania metodami wielowymiarowymi. Wynika to w głównej mierze z faktu, iż w bardzo wielu dziedzinach badań empirycznych ich przedmiotem są zjawiska o złożonej, wielowymiarowej strukturze. Jedną z takich coraz chętniej stosowanych metod jest wielowymiarowa analiza wariancji (MANOVA). Jest ona wykorzystywana do jednoczesnego badania powiązań pomiędzy jedną lub wieloma zmiennymi niezależnymi typu jakościowego oraz dwoma lub większą liczbą zmiennych zależnych typu ilościowego. Stanowi zatem uogólnienie jednowymiarowej analizy wariancji (ANOVA) i podobnie jak w przypadku jednowymiarowym może być wykorzystywana zarówno w przypadku badań eksperymentalnych (gdy badacz kontroluje przypisanie badanych jednostek do porównywanych grup) jak i badań o charakterze obserwacyjnym (gdy przypisanie jednostek do porównywanych grup nie zależy od badacza).

Dla zilustrowania przebiegu i korzyści jakie daje zastosowanie wielowymiarowej analizy wariancji wykorzystano przykład badań międzykulturowych dotyczących oceny zróżnicowania cech osobowości wśród studentów amerykańskich pochodzących z różnych grup etnicznych, przedstawionych w artykule, którego autorami są Grice i Iwasaki.

Wszystkie zaprezentowane wyniki analiz statystycznych przeprowadzono z użyciem narzędzi dostępnych w środowisku programu STATISTICA.


Odkrywanie przyczyn powstawania wad produktów za pomocą STATISTICA Enterprise

Osoby odpowiedzialne za jakość wytwarzanych produktów coraz częściej widzą potrzebę zastosowania czegoś więcej niż „tradycyjne” SPC. Kolejnym naturalnym krokiem dla procesów które są odpowiednio dobrze sterowane jest optymalizacja jakości lub wydajności, którą można osiągnąć miedzy innymi dzięki analizie historycznych danych zebranych dla procesów i produktów. Z pomocą przychodzi tutaj STATISTICA Enterprise który pozwala okiełznać dane i poddać je odpowiedniej analizie statystycznej co często prowadzi do ciekawych wniosków i ułatwia podejmowanie trudnych decyzji związanych z inwestycjami w proces.


Statystyczny detektyw, czyli wykrywanie wyłudzeń za pomocą analizy danych

Wykrywanie nadużyć (ang. fraud detection) dotyczy bardzo wielu, bardzo różnych instytucji, począwszy od banków i instytucji ubezpieczeniowych, przez sklepy internetowe, portale aukcyjne, a skończywszy na administracji publicznej. Można powiedzieć, że wszędzie tam gdzie mamy do czynienia z pieniędzmi, informacją, władzą, sławą i pozycją mogą pojawić się oszustwa, nadużycia itp. – a jeśli mogą, to zapewne się pojawią. Trzeba więc im w jakiś sposób przeciwdziałać. Statystyka i data mining pomagają w wykrywaniu nadużyć, należy jednak pamiętać, że muszą być one ujęte w ramy ogólnych zasad prowadzenia działalności w danej dziedzinie. Musimy więc połączyć dwa światy: modelowanie predykcyjne i reguły decyzyjne w jednym systemie, który na bieżąco, z możliwie jak najmniejszym opóźnieniem będzie wskazywał podejrzane działania, transakcje itp. Podczas wystąpienia przedstawiony zostanie przykład tworzenia modelu predykcyjnego wskazującego podejrzane transakcje, a także stosowanie modelu wraz z regułami biznesowymi w systemie STATISTICA Decisioning Platform®.