Data mining: poznaj siebie i swoich klientów


 



Data mining – automat czy metoda naukowa
dr hab. Andrzej Sokołowski, StatSoft Polska, AE w Krakowie

Wielu statystyków, głównie tych zajmujących się teorią statystyki wydaje się nie dostrzegać bujnego rozwoju gałęzi zwanej data mining. Niektórzy z nich odnoszą się do data mining z lekceważeniem lub wręcz wrogością uznając to podejście za „nienaukowe” i podejrzane. Umożliwiające realizację złośliwych żartów o statystyce, że można dotąd poszukiwać „właściwej” metody i tak długo „męczyć” dane, aż uzyska się wyniki pożądane przez badacza lub zleceniodawcę. Wydaje się, że przynajmniej w części te opinie mają źródło w lękach spowodowanych przez nadzieje twórców pierwszych metod data mining zafascynowanych rozwojem komputerów.



Segmentacja użytkowników serwisu WWW z użyciem metod statystycznych i sieci neuronowych

Grzegorz Migut, StatSoft Polska

Poznanie klientów jest kluczowym elementem prowadzenia skutecznych działań sprzedażowych. Jednym z miejsc interakcji pomiędzy nami a klientem jest nasza strona internetowa. Dzięki niej klienci mogą znaleźć interesujące informacje na temat naszej działalności i oferty. Strona internetowa jest jednak również dla nas nieocenionym źródłem informacji o klientach. Dzięki niej również my możemy lepiej poznać zainteresowania i preferencje gości naszego serwisu.
Wystąpienie poświęcone zostanie metodom data mining mającym zastosowanie do analizy informacji o osobach odwiedzających serwis WWW. Zaprezentowany zostanie również przykład segmentacji osób korzystających z zasobów przykładowego serwisu WWW.



Analiza czynników wpływających na sprzedaż i wspomaganie wyboru strategii działań marketingowych
dr Janusz Wątroba, StatSoft Polska

Celem wystąpienia będzie analiza czynników determinujących wielkość miesięcznej sprzedaży pewnego produktu spożywczego. Na podstawie danych, obejmujących 4 lata zostaną przedstawione techniki modelowania bazujące na regresji wielorakiej. Przy budowie modeli zostaną wykorzystane zmienne zero-jedynkowe oraz zmienne opóźnione. Otrzymany model zostanie wykorzystany pod kątem oceny skuteczności działań marketingowych.



Wspomaganie kampanii sprzedaży krzyżowej (cross-selling) na przykładzie oferty banku
Grzegorz Migut, StatSoft Polska

Sprzedaż krzyżowa polega na oferowaniu aktualnym klientom pewnych dodatkowych usług i produktów związanych z wcześniejszymi zakupami. Dzięki tego typu akcjom możemy liczyć na wzrost dochodowości i lojalności naszych klientów. Przeprowadzanie skutecznych akcji sprzedaży krzyżowej może być z powodzeniem wspomagane przez modele predykcyjne budowane za pomocą metod data mining. Podczas referatu przybliżona zostanie problematyka związana z budową tego typu modeli oraz zaprezentowany zostanie przykład budowy modelu prognozującego skłonność do zakupów produktów bankowych.



Przykład badania wzorców zachowań klientów za pomocą analizy koszykowej
Agnieszka Pasztyła, StatSoft Polska

Uzyskanie przewagi konkurencyjnej na rynku jest w dużym stopniu zależne od znajomości potrzeb i oczekiwań klientów. W ostatnim czasie, wiedza o kliencie zyskuje na znaczeniu również w przypadków dostawców usług masowych, takich jak firmy telekomunikacyjne, finansowe i ubezpieczeniowe lub farmaceutyczne. Jedną z metod analitycznych wykorzystywanych do formułowania prawidłowości opisujących zachowanie klientów jest analiza koszykowa.
Celem analizy koszykowej jest wykrywanie zależności ukrytych w bazach danych i przedstawienie ich w postaci prostych reguł. Reguły te mogą dotyczyć np. zwyczajów zakupowych klientów lub prawidłowości w korzystaniu z usług wybranego typu. Otrzymane reguły noszą nazwę reguł asocjacyjnych. Rozwinięciem analizy koszykowej jest analiza sekwencji, która pozwala na uwzględnienie powiązań zdarzeń w czasie. Uzupełnieniem analizy koszykowej i sekwencji jest analiza połączeń, która zapewnia narzędzia do przedstawienia dużej ilości reguł w postaci czytelnych schematów.
Celem referatu jest zaprezentowanie możliwości wykrywania wzorców zachowań klientów z wykorzystaniem programu STATISTICA Sequence and Link Analysis.



Text Mining jako narzędzie pozyskiwania informacji z dokumentów tekstowych
dr hab. Paweł Lula, Katedra Informatyki, AE w Krakowie

Stale i szybko rosnące zasoby informacyjne są jedną z cech współczesności. Ich prawidłowe pozyskanie, przeanalizowanie i przetworzenie jest warunkiem koniecznym do prawidłowego funkcjonowania każdego człowieka. To trudne zadanie jest w dużym stopniu wspomagane przez najnowsze zdobycze nauki i techniki, czego najlepszym przykładem jest rola, jaką odgrywa obecnie analiza danych i informatyka.
Należy jednak zauważyć, że wśród istniejących i obecnie tworzonych zasobów informacyjnych znaczną rolę odgrywają dokumenty tekstowe. Ich analiza i przetworzenie jest stosunkowo prosta dla człowieka, jednak próby automatyzacji tych zadań są zadaniem szczególnie trudnym. Podstawową przyczyną trudności jest niski stopień ustrukturyzowania tekstów i brak jednoznacznych metod ich interpretacji.
Przeprowadzane w wielu ośrodkach badania wskazują jednak, że zarezerwowana przez długi okres czasu wyłącznie dla człowieka działalność związana z przetwarzaniem dokumentów tekstowych może być z powodzeniem zautomatyzowana. Systemy komputerowe wyposażone w odpowiednie oprogramowanie są w stanie gromadzić olbrzymie zasoby tekstów, pozyskiwać zawarte w nich informacje i dokonywać sprawnego ich przetworzenia.
Podstawowym celem wystąpienia jest prezentacja eksploracyjnej analizy dokumentów tekstowych (text mining), która rozumiana jest jako zbiór koncepcji, metod oraz zaimplementowanych w postaci programów komputerowych algorytmów przetwarzania zasobów tekstowych prowadzących do zautomatyzowania procesów przechowywania i przetwarzania dokumentów sporządzonych w językach naturalnych.
W kolejnych częściach prezentacji ukazane zostaną:

  • cele i krótka historia text miningu,
  • metody reprezentacji informacji zawartych w dokumentach tekstowych,
  • typy problemów poznawczych rozpatrywanych na gruncie text miningu,
  • podstawowe algorytmy przetwarzania,
  • możliwości zastosowań omówionych metod

Ilustracją dla omawianych zagadnień będzie prezentacja analizy przykładowego zestawu dokumentów. Wszystkie obliczenia zostaną wykonane za pomocą programu STATISTICA Text Miner.



Wykorzystanie STATISTICA Data Miner do prognozowania w Krajowym Depozycie Papierów Wartościowych
Joanna Matych, Krajowy Depozyt Papierów Wartościowych S.A.

Analiza szeregów czasowych pozwala nie tylko lepiej poznać dane zjawisko, ale także stworzyć statystycznie najlepszą prognozę jego działania, co znajduje zastosowanie w wielu dziedzinach wiedzy. Artykuł dotyczy zastosowania prognozowania szeregów czasowych jako narzędzia dostarczającego informacji w zarządzaniu, a ściślej rzecz biorąc w procesach decyzyjnych przedsiębiorstwa. Przedstawiony w materiale przykład zawiera opis systemu modeli wyrównywania wykładniczego, skonstruowanego przy użyciu STATISTICA Data Miner, służącego do prognozowania danych związanych z rynkiem kapitałowym w Polsce. Wyliczane przez modele prognozy stanowią podstawę do sporządzania planów i analiz finansowych w Krajowym Depozycie Papierów Wartościowych.



Model data mining przewidujący odpowiedź klientów na ofertę
Tomasz Demski, StatSoft Polska

Jednym z najbardziej powszechnych zadań data mining jest przewidywanie, którzy klienci najchętniej odpowiedzą na ofertą. Wykład przedstawia przykład rozwiązania takiego zadania, a mówiąc konkretnie tworzenia modelu wskazującego, którzy klienci zakupią kartę kredytową. Omówione zostaną wstępne przygotowanie danych (sprawdzanie poprawności, dobór zmiennych, przekształcenia itp.), budowa modelu z wykorzystaniem rozmaitych narzędzi data mining, ocena modelu oraz przygotowanie do jego stosowania.