Przygotowanie danych na potrzeby analiz i raportowania

online 2 dni

Czyszczenie i przygotowanie danych zajmuje do 80% czasu pracy analityka. Jest to proces żmudny i czasochłonny. Znajomość metod i dobrych praktyk przygotowania danych pomoże skrócić ten proces, a tym samym szybciej skupić się na tym co najważniejsze, czyli analizie i interpretacji wyników. Celem kursu jest przekazanie praktycznej wiedzy i umiejętności w dziedzinie przygotowania danych na potrzeby analiz statystycznych, data mining i raportowania.

Dla kogo?

  • analityków oraz innych osób zajmujących się raportowaniem i tworzeniem modeli predykcyjnych
  • osób pracujących z rzeczywistymi danymi i przygotowujących je do pogłębionych analiz
  • osób pragnących poznać narzędzia przygotowania i czyszczenia danych dostępne w Statistica

Co zyskasz?

  • znajomość zadań, jakie można realizować w ramach przygotowania danych
  • przekonasz się, jak istotną rolę w całym procesie analizy odgrywa przygotowanie danych
  • dowiesz się, w jaki sposób przekształcać dane do postaci ułatwiającej uzyskanie pożądanych wyników analiz, np. trafnego modelu lub segmentacji

  • Program
  • Speaker
  • Organizational information
  • Prices

Program szkolenia:

  1. Import danych, typ zmiennych, optymalizacja wielkości arkusza
    • Przykład importu z bazy danych
    • Przykład importu z pliku tekstowego
  2. Czyszczenie danych
    • Wstępne badanie danych
    • Sprawdzanie reguł poprawności danych
    • Analityczne i graficzne wykrywanie obserwacji odstających
      • Polecenie Zamień odstające
      • Wykresy jako narzędzie wykrywania obserwacji odstających
    • Obsługa i zastępowanie braków danych
    • Wykrywanie i przetwarzanie powtórzonych rekordów
  3. Przekształcenia zmiennych
    • Obliczanie zmiennych pochodnych
    • Formuły arytmetyczne i logiczne
    • Funkcje statystyczne
    • Operacje na datach
    • Specjalne techniki odwoływania się do wierszy i kolumn
    • Zamiana przypisania kategorii (przekodowania)
    • Dyskretyzacja zmiennych
    • Przypisywanie rang
    • Standaryzacja
    • Operacje na wartościach tekstowych
  4. Zmiana układu danych
    • Scalanie plików
    • Przekształcenia Ułóż w stertę i Rozrzuć po zmiennych (operacje na danych typu LIMS)
    • Transponowanie arkusza i bloku
    • Tworzenie podzbioru, autofiltr i losowanie

Polecamy inne szkolenia:                                         

  • Z cyklu Statystyczna analiza danych
  • Z cyklu Data mining
  • Z cyklu Prognozowanie
  • Z cyklu Marketing i badania rynku

Similar courses

Sztuczna inteligencja – podstawy i zastosowania

Szkolenie polecamy wszystkim, którzy chcą poznać podstawy sztucznej inteligencji (AI), nauczyć się efektywnego korzystania z jej narzędzi oraz zrozumieć jej […]

Learn more

Analizy chemometryczne w Statistica – kurs zaawansowany

Po krótkim przypomnieniu najważniejszych zagadnień omawianych na kursie podstawowym zostaną omówione bardziej zaawansowane metody analizy wykorzystywane w chemometrii: analiza czynnikowa […]

Learn more

Analizy wielowymiarowe w Python

Podczas kursu zaprezentowane zostaną najpopularniejsze metody wielowymiarowe, które znajdują zastosowanie w analizie zjawisk złożonych, opisanych za pomocą dużej liczby zmiennych. […]

Learn more

Do you have questions?

Get in Touch!

Our team is ready to help with any questions you might have. Just fill out the form, send us a message, or give us a call, and we’ll get back to you as soon as we can!

    Skip to content