Kursy
 Nasze kursy
 Terminarz
 Programy kursów
 Cykle szkoleniowe
 Informacje organizacyjne
 Zgłoszenie
 Broszura w pdf
Inne usługi
 Kursy na zamówienie
 Usługi konsultingowe
 Usługi implementacyjne
 Statystyka w badaniach
naukowych

 Seminaria
 Studia podyplomowe
 Opinie o kursach




Data mining I - kurs podstawowy

Opis kursu: Celem kursu jest zapoznanie jego uczestników z podstawowymi ideami i zasadami data mining (zgłębiania danych), tak aby mogli samodzielnie realizować projekty data mining. Na kursie omówione zostaną: dostęp do baz danych, przygotowanie danych do analiz, dobór odpowiedniej metody analitycznej, ocena uzyskanego modelu oraz wykonywanie analiz i stosowanie uzyskanych modeli (deployment).

Wymagania: umiejętność obsługi komputera w środowisku Windows, znajomość podstaw analizy danych. Zalecamy wcześniejszy udział w kursie STATISTICA kurs podstawowy lub Statystyka dla niestatystyków.

Kontynuacją mogą być np. kursy: Data mining II a - metody bez nauczyciela, Data mining II b - modele i metody, Data mining III - STATISTICA Data Miner dla zaawansowanych, Metodyki data mining, Prognozowanie w STATISTICA Data Miner

Terminy: 8-9.03.2012


Program kursu

  • Podstawowe idee data mining
    • Modele data mining
    • Rodzaje zadań data mining
    • Przeuczenie i podział na próby
  • Środowisko STATISTICA Data Miner
    • Wprowadzenie
    • Dane wejściowe: lokalne pliki danych i zdalne źródła danych
    • Przeglądarka węzłów
    • Przykład prostej analizy w systemie STATISTICA Data Miner
  • Dane zewnętrzne
    • STATISTICA Query
    • IDP - In-place Database Processing
  • Specjalistyczne moduły systemu STATISTICA Data Miner (przegląd)
    • Wstępne przetwarzanie danych
    • Metody predykcyjnego data mining (uczenie z nauczycielem)
    • Odkrywanie wiedzy (uczenie bez nauczyciela)
    • Moduły stosowane po uzyskaniu modelu
  • Wstępna obróbka danych - czyszczenie i przekształcenia
    • Ogólne informacje
    • Czyszczenie danych
    • Niezgodności danych z rzeczywistością
    • Postępowanie z brakami danych
    • Dane nietypowe (odstające) i zaszumione
    • Przekształcenia danych
    • Redukcja danych
    • Zmniejszenie liczby wymiarów
    • Zamiana zmiennej ciągłej na skategoryzowaną (kategoryzacja)
    • Łączenie klas zmiennej skategoryzowanej
    • Losowe próbkowanie
    • Dane anachroniczne
  • Wprowadzenie do wybranych metod data mining
    • Regresja logistyczna
    • Drzewa klasyfikacyjne i regresyjne
  • Przykłady analiz w systemie STATISTICA Data Miner
    • Problem klasyfikacyjny - modelowanie zdolności kredytowej
    • Czyszczenie danych i zadanie regresyjne
    • Przewidywanie odpowiedzi na ofertę za pomocą Przepisu Data Miner
    • Analiza skupień (segmentacja)