Data mining II b – modele i metody


Opis szkolenia: Kurs jest przeznaczony dla wszystkich, którzy chcą bliżej poznać specjalistyczne metody data mining, tak aby móc wydobyć z danych maksymalnie dużo użytecznej wiedzy. W trakcie kursu prezentowane są wybrane techniki data mining (m.in. drzewa klasyfikacyjne i regresyjne, sieci neuronowe). Kurs „Data mining II b  – modele i metody” jest kontynuacją i rozwinięciem kursu „Data mining I – kurs podstawowy”.

Wymagania: umiejętność obsługi komputera w środowisku Windows, znajomość podstaw data mining i systemu Statistica Data Miner. Zalecamy wcześniejszy udział w kursach Data mining – kurs podstawowy oraz Data mining – metody bez nauczyciela.

Kontynuacją mogą być np. szkolenia:Data mining – Statistica Data Miner dla zaawansowanych, Prognozowanie w Statistica Data Miner, Prognozowanie i analiza szeregów czasowych, Analizy wielowymiarowe, Metody statystyczne w marketingu i badaniach rynku, Badanie satysfakcji i wartości klienta, Prognozowanie w przedsiębiorstwie, Statystyka w medycynie – metody zaawansowane, Sieci neuronowe, Automatyzacja analiz i raportowania w STATISTICA, Metodyki data mining, Text mining, Zastosowania data mining w badaniach marketingowych.

Terminy szkoleń:

Program szkolenia

  1. Drzewa klasyfikacyjne i regresyjne
    • Drzewa klasyfikacyjne CART w pakiecie STATISTICA Data Miner
    • Drzewa klasyfikacyjne CHAID w pakiecie STATISTICA Data Miner
      • Rodzina algorytmów drzewkowych z rodziny AID (Automatic Interaction Detection)
      • CHAID w pakiecie STATISTICA Data Miner
    • Drzewa regresyjne w pakiecie STATISTICA Data Miner
      • Regresyjne właściwości algorytmu CART
  2. Sieci neuronowe
    • Wprowadzenie w problematykę sieci neuronowych
      • Funkcjonowanie neuronu
      • Budowa i funkcjonowanie sztucznych sieci neuronowych
      • Rodzaje sztucznych sieci neuronowych
      • Klasyfikacja problemów rozwiązywanych za pomocą modeli neuronowych
    • Neuronowe metody rozwiązywania problemów regresyjnych
      • Charakterystyka przykładowego problemu
      • Tworzenie modelu regresyjnego wykorzystującego sieć perceptronową
      • Tworzenie modelu regresyjnego wykorzystującego sieć o radialnych funkcjach bazowych (sieć RBF)
      • Tworzenie modelu regresyjnego wykorzystującego liniową sieć neuronową
      • Metody uruchamiania modeli regresyjnych
      • Łączne wykorzystanie modeli (zespoły modeli)
      • Poszukiwanie najlepszego modelu regresyjnego
    • Rozwiązywanie problemów z zakresu klasyfikacji wzorcowej
      • Charakterystyka przykładowego problemu
      • Definicja modelu opartego na sieci MLP
      • Ocena jakości modelu klasyfikacyjnego
  3. MARSplines
    • Wprowadzenie
    • Koncepcja metody
    • Krzywe sklejane (splines)
    • Algorytm
  4. Moduł Inne Metody Uczenia Maszyn oraz zespoły modeli
    • Metoda wektorów wspierających (Support Vector Machines – SVM)
      • Idea SVM
      • SVM dla zadań regresyjnych
      • Metoda SVM w systemie STATISTICA Data Miner
    • Naiwny klasyfikator Bayesa
      • Opis metody
      • Naiwny klasyfikator Bayesa w STATISTICA Data Miner
    • Metoda k najbliższych sąsiadów
    • Zespoły modeli
      • Ogólne wprowadzenie
      • Bagging i Losowy las (Random Forest)
      • Drzewa ze wzmacnianiem (Boosted Trees)