Eksploracja, wizualizacja i przygotowanie danych w Python – szybki start

online 3 dni

Częścią nieomal każdego projektu Data Science jest eksploracja danych w celu zapoznania się z ich strukturą, wykrycia problemów z jakością, a wynikom tabelarycznym zazwyczaj towarzyszą rozmaite wizualizacje. Na szkoleniu przedstawimy zarówno ogólne zasady eksploracji i wizualizacji danych, jak i sposób wykonywania ich w środowisku Python.

Uwaga szkolenie zakłada podstawową znajomość ekosystemu data science Python: zdecydowanie zalecamy wcześniejszy udział w szkoleniu „Data Science w Python – szybki start”

Dla kogo?

  • Osób, które chcą zostać mistrzami danych (data scientistami), a znają już podstawy ekosystemu Data Science Python
  • Badaczy z różnych dziedzin pragnących pogłębić swoją wiedzę w dziedzinie przygotowania danych, wstępnego ich badania i wizualizacji
  • Analityków, chcących wyjść poza podstawowe techniki wizualizacji i podsumowania danych

Co zyskasz?

  • Umiejętność wykrywania problemów z jakością danych i radzenia sobie z nimi
  • Wiedzę jak pokazywać i badać rozmaite aspekty danych za pomocą wykresów
  • Umiejętność przygotowania danych do analiz w środowisku Python

  • Program
  • Prowadzący
  • Informacje organizacyjne
  • Ceny

Program szkolenia:

  1. Biblioteki do eksploracji i wizualizacji danych – przegląd
    • Numpy
    • Pandas
    • Matplotlib i Seaborn
  2. Wczytywanie danych i trwały zapis obiektów
    • Dane tabelaryczne
    • JSON
    • Zapis obiektów Python
  3. Jakość danych – przegląd
  4. Zasady dobrej wizualizacji danych
  5. Podsumowanie rozkładu zmiennych
    • Histogram i KDE
    • Wykres ramka wąsy (ang. box-whiskers plot)i pochodne
  6. Badanie związków miedzy zmiennymi za pomocą wykresów i podsumowań
    • Wykres rozrzutu
    • Wykres macierzowy (pairplot>)
    • Wizualizacja dla zmiennych jakościowych (catplot)
  7. Wykresy przebiegu
  8. Estetyka wykresów
  9. Wykrywanie problemów z jakością danych i usuwanie ich
  10. Łączenie danych z różnych źródeł
  11. Zmiana układu danych
  12. Agregacja danych i analizy w grupach
  13. Inżynieria cech

Polecamy inne szkolenia:

  • Uczenie maszynowe w Python – szybki start
  • Wykrywanie anomalii w procesach z wykorzystaniem uczenia maszyn (machine learning)
  • Prognozowanie metodami uczenia maszynowego w Python
  • Data Scence w Python – szybki start

Podobne szkolenia

Analizy wielowymiarowe

Podczas kursu zaprezentowane zostaną najpopularniejsze metody wielowymiarowe, które znajdują zastosowanie w analizie zjawisk złożonych, opisanych za pomocą dużej liczby zmiennych. Uczestnicy poznają […]

Dowiedz się więcej

Analizy chemometryczne w Statistica – kurs podstawowy

Po wprowadzeniu teoretycznym do zagadnienia analizy danych uczestnicy poznają techniki planowania i wykonania eksperymentu. Zostaną omówione podstawowe techniki analizy chemometrycznej: analiza podobieństwa (analiza […]

Dowiedz się więcej

Sztuczna inteligencja – podstawy i zastosowania

Szkolenie polecamy wszystkim, którzy chcą poznać podstawy sztucznej inteligencji (AI), nauczyć się efektywnego korzystania z jej narzędzi oraz zrozumieć jej zastosowania w życiu codziennym […]

Dowiedz się więcej

Masz pytania?

Porozmawiaj z nami!

Jesteśmy tutaj, aby pomóc i rozwiać wszystkie Twoje wątpliwości. Wypełnij formularz, napisz do nas maila lub zadzwoń – odpowiemy najszybciej, jak to możliwe!

    Przejdź do treści