SAL (Sequence, Association and Link Analysis)


STATISTICA SAL wykorzystuje szereg najnowszych technik analitycznych przezna­czo­nych do znajdowania w zbiorach danych reguł, jakim podlegają „koszyki za­ku­pów”. Pro­gram ten można trak­to­wać jako rozszerzenie technik dostępnych w Analizie koszykowej za­wartej w STATISTICA Data Miner. STATISTICA SAL pomaga w następujących analizach:

  • wykrywanie reguł asocjacji (ustalanie reguł, które produkty kupowane są razem),
  • analiza sekwencji (badanie, w jakiej kolejności zjawiska zachodzą po sobie),
  • analiza skojarzeń (dzięki niej można, np. analizując dane dotyczące klientów, wnios­kować o tym, co będą oni chcieli kupić, bazując na informacjach o wcześniejszych ich zakupach).

STATISTICA SAL stanowi doskonałe rozszerzenie pakietu STATISTICA Data Miner, może też działać samodzielnie.

W programie STATISTICA SAL zastosowano szereg najnowszych technik analitycznych przeznaczonych do znajdywania w zbiorach danych reguł, jakim podlegają „koszyki zakupów”.


Zagadnienie „koszyka”. Problem ten dotyczy sytuacji, gdy klient dokonuje wyboru spośród szerokiej gamy produktów, a naszym zadaniem jest ustalenie reguł, które produkty kupowane są razem lub w określonej sekwencji. Produktami tymi mogą być zarówno najróżniejsze towary oferowane w supermarkecie, od spożywczych do elektroniki, jak i np. różne pakiety ubezpieczeń. Oczywiście klient nabywa (umieszcza w koszyku) jedynie małą część oferowanych produktów.


Reguły asocjacji. Reguły asocjacji wykrywamy analizując dane z bazy danych zakupów i szukając skojarzeń produktów, czyli pytając, które produkty nabywane są razem. Może się na przykład okazać, co nie byłoby dziwne, że razem z latarkami kupowane są też bateryjki. Jeżeli w bazie danych zarejestrowany jest czas zakupów, to możemy ponadto śledzić, w analogiczny sposób proces zakupów.


Analiza sekwencji. z sekwencją zakupów mamy do czynienia, gdy pytamy, co klient kupił dziś, jeżeli poprzednio kupił taki, a nie inny produkt. Na przykład „zakup” rozszerzonej gwarancji następował zwykle będzie po zakupie telewizora, kina domowego, czy innego, większego urządzenia elektronicznego. Taka sekwencja jest dość oczywista, jednak analiza sekwencji pozwoli wykryć odpowiednie skojarzenia nawet, jeśli nie manifestują się one wyraźnie w danych, a są raczej głęboko ukryte w ich strukturze. W wielu dziedzinach nauki i techniki używa się różnorodnych metod wykrywania sekwencji, poczynając właśnie od badania kolejności zakupów, sekwencji połączeń telefonicznych,sekwencji operacji na koncie (fraud detection) ,fluktuacji na rynkach giełdowych, sekwencjonowania DNA, czy analizowania „logów” internetowych, czyli sposobu poruszania się użytkownika po serwisie WWW.


Analiza skojarzeń. Wydobyte z bazy danych zakupów reguły asocjacji bądź sekwencji mogą być w przyszłości niezmiernie użyteczne w wielu różnych zastosowaniach. Znajomość struktury zakupów detalicznych pozwoli np. znacznie poprawić efektywność marketingu bezpośredniego, jeżeli wiedzieć będziemy, do których klientów, jaką ofertę skierować (ponieważ znamy reguły kolejności zakupów, oraz wiemy, kto, co kupił w przeszłości). Bazy danych zakupowych tworzone są przez wiele różnych podmiotów działalności rynkowej, np. przez banki, ogólnie mamy tu do czynienia z wyższym, „inteligentnym” poziomem obserwowania zachowań klientów. Termin „analiza skojarzeń” pojawia się wtedy, gdy techniki wydobywania z danych, sekwencyjnych czy niesekwencyjnych reguł asocjacji stosowane są by zapanować nad tym, co właściwie wiemy, czym dysponujemy, ale co ukryte jest w skomplikowanych strukturach bazy danych. Zachowania pojedynczych klientów podlegają opisowi w kategoriach „koszyka zakupów” i kolejnych „transakcji”, gdy zakłada on konto w banku, wymienia informacje z innym, konkretnym klientem i wykonuje różne inne, temu podobne działania. Omawiana technologia, zastosowana do tego typu baz danych pozwala szybko wydobyć na jaw ważne struktury i skojarzenia dotyczące klientów i ich działań.

Funkcjonalne omówienie modułu STATISTICA Sequence, Association and Link Analysis (SAL)

Program STATISTICA SAL służy do wykonywania wspomnianych wyżej zadań i analiz, poprzez intuicyjny, przyjazny użytkownikowi interfejs. Program stosuje, w sposób niezaprzątający uwagi użytkownika najnowocześniejsze, efektywne obliczeniowo, wielowątkowe, skalowalne algorytmy dające rozwiązanie w krótkim czasie. Narzędzie to ma ponadto unikalne możliwości uwzględniania w analizie zarówno zmiennych ciągłych jak i cech jakościowych, można też, w jednej analizie, dla jednego wyboru zmiennych, realizować zarówno analizę sekwencji jak i (niesekwencyjną) analizę asocjacji. Wszystkie te opcje są w pełni zintegrowane z platformą STATISTICA, udostępniając dla dogłębnej analizy otrzymanych wyników całe bogactwo narzędzi STATISTICA. W zasadzie, wszystkich narzędzi STATISTICA Data Miner można szybko, bez zbędnych operacji użyć do wyczerpującego „drążenia” wyników otrzymanych w STATISTICA SAL.

Ponadto, co nie jest bez znaczenia, STATISTICA SAL ma opcje wdrażania wyników, pozwalające sprawnie zastosować reguły odkryte poprzez analizę danych historycznych, w celu otrzymania „sugestii” o spodziewanych, przyszłych zakupach. Tego typu, wygenerowane modele zachowań klientów można w przyszłości łatwo modyfikować i wdrażać kilkoma kliknięciami myszki (np. wykorzystując platformę klient-serwer STATISTICA Enterprise Server).

modele zachowań klientów

 

Krótko, w punktach: unikalne, zaawansowane cechy programu STATISTICA Sequence, Association and Link Analysis (SAL)

  • Nowy algorytm: Zamiast algorytmu a-priori, program wykorzystuje technikę budowania drzew, do wydobywania z danych reguł sekwencji i asocjacji.
  • Technologia bazodanowa: Modele asocjacji i sekwencji przechowywane są z wykorzystaniem wydajnej technologii lokalnych, relacyjnych baz danych.
  • Obsługa zmiennych: w jednej analizie użyć można zmiennych wielokrotnych odpowiedzi/dychotomii, jak i zmiennych ciągłych.
  • Wielozadaniowość: w jednej analizie, równolegle poszukiwane są reguły sekwencyjne jak i reguły asocjacji.
  • Analiza wielowymiarowa: Reguły sekwencji i asocjacji znajdowane są równocześnie w więcej niż jednym wymiarze.
  • Cechy jakościowe:Na bazie wielowymiarowego poszukiwania reguł sekwencji i asocjacji, oraz możliwości skonkretyzowania badania, program może być użyty do predykcyjnego data mining.
  • Analiza skupień: Moduł może wykonywać analizę typu hierarchicznego grupowania na bazie pojedynczych połączeń, co pozwala wykryć prawdopodobne grupowanie się produktów. Ma to szczególnie praktyczne zastosowania, np. W sprzedaży detalicznej.

Podsumowanie

STATISTICA Sekwencje, asocjacje, skojarzenia (SAL) spełnia oczekiwania analityków zajmujących się sprzedażą, bankowością, ubezpieczeniami itp. dziedzinami aktywności biznesowej, wykorzystując najszybsze ze znanych, skalowalne algorytmy pozwalające w jednej analizie znajdować reguły asocjacji i sekwencji. Program ten, oferujący polskojęzyczne środowisko użytkownika, jest ponadto samodzielną aplikacją, pozwalającą zarówno na budowanie jak i wdrażanie modeli.