Data mining – metody predykcyjne

online 2 dni

W trakcie kursu zostaną zaprezentowane wybrane techniki data mining i uczenia maszynowego (machine learning) m.in. drzewa klasyfikacyjne i regresyjne, drzewa wzmacniane (boosted trees), losowy las (random forest) i maszyny wektorów nośnych (support vector machines).

Kurs „Data mining – metody predykcyjne” jest kontynuacją i rozwinięciem kursu „Data mining – kurs podstawowy”.

Dla kogo?

  • wszystkich, którzy chcą bliżej poznać specjalistyczne metody data mining, tak aby móc wydobyć z danych maksymalnie dużo użytecznej wiedzy

Co zyskasz?

  • dowiesz się, jak budować modele predykcyjne i opisowe za pomocą drzew klasyfikacyjnych i regresyjnych
  • nauczysz się modelować skomplikowane nieliniowe zależności za pomocą silnych metod uczenia maszynowego takich jak drzewa wzmacniane i losowy las 
  • dowiesz się, jak dobierać i stroić różne metody uczenia maszynowego

  • Program
  • Prowadzący
  • Informacje organizacyjne
  • Ceny

Program szkolenia:

  1. Drzewa klasyfikacyjne i regresyjne
    • Drzewa klasyfikacyjne CART w pakiecie Statistica Data Miner
    • Drzewa klasyfikacyjne CHAID w pakiecie Statistica Data Miner
      • Rodzina algorytmów drzewkowych z rodziny AID (Automatic Interaction Detection)
      • CHAID w pakiecie Statistica Data Miner
    • Drzewa regresyjne w pakiecie Statistica Data Miner
      • Regresyjne właściwości algorytmu CART
  2. MARSplines
    • Wprowadzenie
    • Koncepcja metody
    • Krzywe sklejane (splines)
    • Algorytm
  3. Moduł Inne Metody Uczenia Maszyn oraz zespoły modeli
    • Metoda wektorów wspierających (Support Vector Machines – SVM)
      • Idea SVM
      • SVM dla zadań regresyjnych
      • Metoda SVM w systemie Statistica Data Miner
    • Naiwny klasyfikator Bayesa
      • Opis metody
      • Naiwny klasyfikator Bayesa w Statistica Data Miner
    • Metoda k najbliższych sąsiadów
    • Zespoły modeli
      • Ogólne wprowadzenie
      • Bagging i Losowy las (Random Forest)
      • Drzewa ze wzmacnianiem (Boosted Trees)

Polecamy inne szkolenia:                                             

  • Prognozowanie i analiza szeregów czasowych
  • Analizy wielowymiarowe
  • Metody statystyczne w marketingu i badaniach rynku
  • Badanie satysfakcji i wartości klienta
  • Prognozowanie w przedsiębiorstwie
  • Statystyka w medycynie – metody zaawansowane
  • Sieci neuronowe
  • Automatyzacja analiz i raportowania w Statistica
  • Metodyki data mining
  • Automatyczna analiza dokumentów tekstowych

Podobne szkolenia

Modele klasyfikacyjne w nauce – budowa, interpretacja i ocena

Zagadnienie klasyfikacji obiektów jest jednym z powszechniej definiowanych zadań analitycznych w obrębie szeroko rozumianych badań naukowych, począwszy od badań społecznych a skończywszy na badaniach przyrodniczych. […]

Dowiedz się więcej

Analizy wielowymiarowe w Python

Podczas kursu zaprezentowane zostaną najpopularniejsze metody wielowymiarowe, które znajdują zastosowanie w analizie zjawisk złożonych, opisanych za pomocą dużej liczby zmiennych. Uczestnicy poznają […]

Dowiedz się więcej

Wizualizacja danych w R z wykorzystaniem pakietu ggplot2

Środowisko R jest przeznaczone nie tylko do analizy danych i skomplikowanych obliczeń statystycznych, ale także umożliwia tworzenie różnorodnych wizualizacji. Najczęściej wykorzystywany do tego celu jest pakiet ggplot2 – […]

Dowiedz się więcej

Masz pytania?

Porozmawiaj z nami!

Jesteśmy tutaj, aby pomóc i rozwiać wszystkie Twoje wątpliwości. Wypełnij formularz, napisz do nas maila lub zadzwoń – odpowiemy najszybciej, jak to możliwe!

    Przejdź do treści