Eksploracja, wizualizacja i przygotowanie danych w Python – szybki start

online 3 dni

Częścią nieomal każdego projektu Data Science jest eksploracja danych w celu zapoznania się z ich strukturą, wykrycia problemów z jakością, a wynikom tabelarycznym zazwyczaj towarzyszą rozmaite wizualizacje. Na szkoleniu przedstawimy zarówno ogólne zasady eksploracji i wizualizacji danych, jak i sposób wykonywania ich w środowisku Python.

Uwaga szkolenie zakłada podstawową znajomość ekosystemu data science Python: zdecydowanie zalecamy wcześniejszy udział w szkoleniu „Data Science w Python – szybki start”

Dla kogo?

  • Osób, które chcą zostać mistrzami danych (data scientistami), a znają już podstawy ekosystemu Data Science Python
  • Badaczy z różnych dziedzin pragnących pogłębić swoją wiedzę w dziedzinie przygotowania danych, wstępnego ich badania i wizualizacji
  • Analityków, chcących wyjść poza podstawowe techniki wizualizacji i podsumowania danych

Co zyskasz?

  • Umiejętność wykrywania problemów z jakością danych i radzenia sobie z nimi
  • Wiedzę jak pokazywać i badać rozmaite aspekty danych za pomocą wykresów
  • Umiejętność przygotowania danych do analiz w środowisku Python

  • Program
  • Speaker
  • Organizational information
  • Prices

Program szkolenia:

  1. Biblioteki do eksploracji i wizualizacji danych – przegląd
    • Numpy
    • Pandas
    • Matplotlib i Seaborn
  2. Wczytywanie danych i trwały zapis obiektów
    • Dane tabelaryczne
    • JSON
    • Zapis obiektów Python
  3. Jakość danych – przegląd
  4. Zasady dobrej wizualizacji danych
  5. Podsumowanie rozkładu zmiennych
    • Histogram i KDE
    • Wykres ramka wąsy (ang. box-whiskers plot)i pochodne
  6. Badanie związków miedzy zmiennymi za pomocą wykresów i podsumowań
    • Wykres rozrzutu
    • Wykres macierzowy (pairplot>)
    • Wizualizacja dla zmiennych jakościowych (catplot)
  7. Wykresy przebiegu
  8. Estetyka wykresów
  9. Wykrywanie problemów z jakością danych i usuwanie ich
  10. Łączenie danych z różnych źródeł
  11. Zmiana układu danych
  12. Agregacja danych i analizy w grupach
  13. Inżynieria cech

Polecamy inne szkolenia:

  • Uczenie maszynowe w Python – szybki start
  • Wykrywanie anomalii w procesach z wykorzystaniem uczenia maszyn (machine learning)
  • Prognozowanie metodami uczenia maszynowego w Python
  • Data Scence w Python – szybki start

Similar courses

Data mining – metody predykcyjne

W trakcie kursu zostaną zaprezentowane wybrane techniki data mining i uczenia maszynowego (machine learning) m.in. drzewa klasyfikacyjne i regresyjne, drzewa […]

Learn more

Podstawy analizy danych w środowisku R

W trakcie szkolenia zostaną omówione zasady pracy w środowisku R, rodzaje najczęściej wykorzystywanych obiektów oraz przykłady ilustrujące pracę z tym pakietem. Podczas kursu wykorzystywać […]

Learn more

Wizualizacja danych w R z wykorzystaniem pakietu ggplot2

Środowisko R jest przeznaczone nie tylko do analizy danych i skomplikowanych obliczeń statystycznych, ale także umożliwia tworzenie różnorodnych wizualizacji. Najczęściej wykorzystywany do tego celu jest pakiet ggplot2 – […]

Learn more

Do you have questions?

Get in Touch!

Our team is ready to help with any questions you might have. Just fill out the form, send us a message, or give us a call, and we’ll get back to you as soon as we can!

    Skip to content