Uczestnicy szkolenia poznają metody analizy zbioru dokumentów tekstowych wykorzystujące macierz częstości. W trakcie zajęć omówione zostaną metody wyznaczania podobieństwa pomiędzy dokumentami, analiza skupień dokumentów, analiza tematyk występujących w dokumentach, zagadnienie identyfikacji słów i fraz kluczowych oraz analiza wydźwięku dokumentu (ang. sentiment analysis).
Dla kogo?
- Badaczy pragnących wykorzystać w analizach teksty w języku naturalnym
- Osób badających wydźwięk wypowiedzi w mediach społecznościowych, opinii, recenzji itp.
- Każdego, kto chce poznać podstawy analizy tekstów w jeżyku naturalnym
Co zyskasz?
- Zrozumiesz podstawy automatycznego przetwarzania dokumentów.
- Nauczysz się przygotować dokumenty na potrzeby text mining.
- Poznasz metody analizy tematyk w dokumentach tekstowych
- Dowiesz się, jak podzielić zbiór dokumentów na grupy podobnych do siebie obiektów, tzn. wykonywać analizę skupień (ang. cluster analysis).
- Nauczysz się badać wydźwięk wypowiedzi.
- Poznasz narzędzia text mining w środowisku R.