Praktyczna analiza danych w ubezpieczeniach
25 październik 2011


Aktualna oferta StatSoft Polska

Podczas tego wystąpienia krótko zostaną przedstawione najważniejsze składniki oferty StatSoft Polska w zakresie analizy danych: oprogramowanie STATISTICA oraz usługi szkoleniowe, konsultingowe, wdrożeniowe itp. Szczególna uwaga zostanie poświęcona ulepszeniom, jakie zostały wprowadzone w najnowszej, dziesiątej wersji oprogramowania STATISTICA.


Prosto o dopasowaniu prostych, czyli analiza regresji liniowej w praktyce

W niemal wszystkich dziedzinach badań empirycznych mamy do czynienia ze złożonością zjawisk i procesów. W związku z tym występuje naturalne zainteresowanie ze strony badaczy metodami analizy danych, które umożliwiają ilościową ocenę związków występujących pomiędzy różnymi aspektami badanych zjawisk i procesów. Stosunkowo najczęściej do tego celu wykorzystywane są metody regresji liniowej prostej i wielorakiej. W opracowaniu przedstawiono krótko ideę metody regresji liniowej, sposób jej przeprowadzania oraz zagadnienie interpretacji oszacowanego modelu.

W drugiej części zaprezentowano przykłady analiz przeprowadzonych z użyciem narzędzi dostępnych w środowisku programu STATISTICA.


Niewierność małżeńska – statystyczna analiza wyników ankiety

W pracy przeprowadzono analizę czynników wpływających na zjawisko niewierności małżeńskiej. W tym celu przeprowadzono ankietę internetową. Ponad 800 respondentów wypełniło ją w sposób nadający się do analizy statystycznej. Oczywiście nie była to próba losowa reprezentująca ogół społeczeństwa. Wobec tego w pierwszej części przedstawiono charakterystykę respondentów pozwalającą zorientować się jaka grupę społeczną reprezentują. Zbudowano dwa modele (regresja logistyczna) powiązane ze sobą hierarchicznie. Pierwszy opisuje ryzyka pojawienia się okazji do niewierności, zaś drugi szanse wykorzystania tej okazji. Wstępna lista obejmowała charakterystyki demograficzne, społeczne i ekonomiczne oraz takie, które pozwalały ocenić hierarchię wartości respondentów. Listy te były takie same dla obu modeli, jednak okazało się, że inne czynniki mają znaczenie w zjawisku pojawienia się okazji do bycia niewiernym, a inne dla ryzyka wykorzystania tej okazji.


Kreator regresji logistycznej

Podczas wystąpienia zaprezentowany zostanie przykład analizy danych medycznych za pomocą Kreatora regresji logistycznej zawartego w programie STATISTICA Zestaw Medyczny. Podczas analizy krok po kroku wykonane zostaną kolejne etapy analizy począwszy od sprawdzenia założeń i przygotowania danych, poprzez wybór zmiennych do analizy i samo modelowanie aż po ocenę jakości dopasowania modelu.


Modelowanie czasu trwania – model proporcjonalnego hazardu Coxa

W wielu zastosowaniach analiza czasu trwania pewnego zjawiska jest interesującym przedmiotem badań. Często staje się tu przed dylematem, czy można, a jeśli tak to w jaki sposób uwzględnić obserwacje, które jeszcze nie dobiegły końca. Oprócz przewidywania samej wartości czasu trwania, interesuje nas również często jakie czynniki wpływają na taką a nie inną wartość. Pożądane jest, za pomocą cech badanych obiektów, przewidywać dla nich czas do wystąpienia pewnego zdarzenia. Cel ten można osiągnąć w wielu sytuacjach dzięki modelowi proporcjonalnego hazardu Coxa.


Tworzenie i stosowanie modelu prognostycznego z wykorzystaniem STATISTICA Enterprise

Badanie przebiegu rozmaitych wielkości w czasie w celu znalezienia zależności, wzorców i przewidywania przyszłych wartości może przynieść korzyści w niemal każdej dziedzinie np. W administracji państwowej, zarządzaniu przedsiębiorstwem czy optymalizacji procesów produkcyjnych.

Na wystąpieniu przedstawiony zostanie przykład tworzenie modelu prognostycznego w STATISTICA Data Miner i stosowania go w STATISTICA Enterprise. Prognozowanie będzie dotyczyło pewnej miary sprzedaży w ciągu godziny, a model zostanie stworzony za pomocą jednej z najskuteczniejszych metod data mining: drzew wzmacnianych (ang. boosted trees).