Przygotowanie danych na potrzeby analiz i raportowania

online 2 dni

Czyszczenie i przygotowanie danych zajmuje do 80% czasu pracy analityka. Jest to proces żmudny i czasochłonny. Znajomość metod i dobrych praktyk przygotowania danych pomoże skrócić ten proces, a tym samym szybciej skupić się na tym co najważniejsze, czyli analizie i interpretacji wyników. Celem kursu jest przekazanie praktycznej wiedzy i umiejętności w dziedzinie przygotowania danych na potrzeby analiz statystycznych, data mining i raportowania.

Dla kogo?

  • analityków oraz innych osób zajmujących się raportowaniem i tworzeniem modeli predykcyjnych
  • osób pracujących z rzeczywistymi danymi i przygotowujących je do pogłębionych analiz
  • osób pragnących poznać narzędzia przygotowania i czyszczenia danych dostępne w Statistica

Co zyskasz?

  • znajomość zadań, jakie można realizować w ramach przygotowania danych
  • przekonasz się, jak istotną rolę w całym procesie analizy odgrywa przygotowanie danych
  • dowiesz się, w jaki sposób przekształcać dane do postaci ułatwiającej uzyskanie pożądanych wyników analiz, np. trafnego modelu lub segmentacji

  • Program
  • Prowadzący
  • Informacje organizacyjne
  • Ceny

Program szkolenia:

  1. Import danych, typ zmiennych, optymalizacja wielkości arkusza
    • Przykład importu z bazy danych
    • Przykład importu z pliku tekstowego
  2. Czyszczenie danych
    • Wstępne badanie danych
    • Sprawdzanie reguł poprawności danych
    • Analityczne i graficzne wykrywanie obserwacji odstających
      • Polecenie Zamień odstające
      • Wykresy jako narzędzie wykrywania obserwacji odstających
    • Obsługa i zastępowanie braków danych
    • Wykrywanie i przetwarzanie powtórzonych rekordów
  3. Przekształcenia zmiennych
    • Obliczanie zmiennych pochodnych
    • Formuły arytmetyczne i logiczne
    • Funkcje statystyczne
    • Operacje na datach
    • Specjalne techniki odwoływania się do wierszy i kolumn
    • Zamiana przypisania kategorii (przekodowania)
    • Dyskretyzacja zmiennych
    • Przypisywanie rang
    • Standaryzacja
    • Operacje na wartościach tekstowych
  4. Zmiana układu danych
    • Scalanie plików
    • Przekształcenia Ułóż w stertę i Rozrzuć po zmiennych (operacje na danych typu LIMS)
    • Transponowanie arkusza i bloku
    • Tworzenie podzbioru, autofiltr i losowanie

Polecamy inne szkolenia:                                         

  • Z cyklu Statystyczna analiza danych
  • Z cyklu Data mining
  • Z cyklu Prognozowanie
  • Z cyklu Marketing i badania rynku

Podobne szkolenia

Podstawy analizy danych w środowisku R

W trakcie szkolenia zostaną omówione zasady pracy w środowisku R, rodzaje najczęściej wykorzystywanych obiektów oraz przykłady ilustrujące pracę z tym pakietem. Podczas kursu wykorzystywać […]

Dowiedz się więcej

Praktyczne zastosowania technik regresyjnych w Statistica

Jednym z głównych celów badań jest ilościowy opis powiązań pomiędzy zjawiskami i wywołującymi je czynnikami. Szkolenie jest poświęcone omówieniu statystycznych metod modelowania tego […]

Dowiedz się więcej

Data mining – kurs podstawowy

Data mining (inaczej uczenie maszynowe, ang. machine learning) jest działem sztucznej inteligencji, coraz częściej stosowanym w nauce, badaniach innowacyjnych i rozmaitych zastosowaniach komercyjnych. Dzięki […]

Dowiedz się więcej

Masz pytania?

Porozmawiaj z nami!

Jesteśmy tutaj, aby pomóc i rozwiać wszystkie Twoje wątpliwości. Wypełnij formularz, napisz do nas maila lub zadzwoń – odpowiemy najszybciej, jak to możliwe!

    Przejdź do treści