Czyszczenie danych


Reguły poprawności danych

Dzięki tej opcji użytkownik ma możliwość łatwiejszego zdefiniowania reguł poprawności danych. W oknie definiowania reguł można wybrać nazwę zmiennej, wskazać żądane wartości lub odpowiadające im etykiety i połączyć je odpowiednim operatorem. Oprócz prostych reguł logicznych użytkownik ma możliwość wykorzystania zaawansowanej biblioteki funkcji zawartej w STATISTICA. Generowanie reguł ułatwia specjalnie przygotowany kreator. W arkuszu utworzone zostają zmienne wskazujące przypadki poprawne z punktu widzenia określonej reguły. Dodatkowo można utworzyć zmienną sprawdzającą poprawność względem wszystkich podanych reguł. Przygotowane reguły możemy zapisać do pliku konfiguracyjnego i wykorzystywać w innych modułach programu.


Reguły poprawności danych

Analiza brakujących danych

Moduł umożliwia przekodowanie braków danych według wskazanego schematu

  • Bogaty zestaw sposobów imputacji braków danych
    • Średnią, medianą, modalną
    • Średnią bądź medianą w grupach
    • Najbliższymi sąsiadami
    • Podaną wartością
  • Łatwe określanie tej samej akcji dla wielu zmiennych
  • Testowanie losowości braków danych
  • Zapis określonych schematów kodowania do pliku konfiguracji


Analiza brakujących danych

Ważenie przypadków

– moduł realizuje ważenie wieńcowe przypadków (RIM weighting). Moduł obsługuje ważenie względem maksymalnie sześciu wymiarów. Aby wygenerować zestaw wag dla przypadków wystarczy podanie rozkładów brzegowych dla poszczególnych wymiarów.


Ważenie przypadków

 

Przekoduj na zmienne sztuczne

umożliwia zamianę cech jakościowych na odpowiadające im zmienne sztuczne. W programie zaimplementowano cztery schematy kodowania:

  • Kodowanie zero-jedynkowe na n zmiennych (n to liczba poziomów kodowanej cechy),
  • Kodowanie zero-jedynkowe na n-1 zmiennych,
  • Kodowanie z sigma ograniczeniami (quasi-eksperymentalne),
  • Kodowanie ortogonalne.


Przekoduj na zmienne sztuczne

W przypadku wyboru trzech ostatnich schematów mamy możliwość ręcznego wyboru poziomu odniesienia.

Szybkie rekodowanie.

Moduł umożliwia przekodowanie wybranych wartości (dowolna wartość, braki danych, pełne dane, wartość z podanego zakresu) zmiennych do wskazanych nowych wartości. Użytkownik może przekodować jednocześnie wiele zmiennych, a nowe kody mogą zostać wprowadzone do tych samych lub nowych zmiennych.

Przekształcenie zmiennych

Moduł ten umożliwia normalizację danych do skali testów psychologicznych (stenowej, tenowej, staninowej). Dodatkowo moduł umożliwia przekształcenie zmiennych za pomocą operacji soft-max.

Przekształcenia zmiennych

Zliczanie wystąpień

 Moduł umożliwia utworzenie dodatkowej zmiennej, która zawiera informację, ile razy w danym przypadku w określonej liście zmiennych wystąpiła wskazana przez użytkownika wartość (dowolna wartość, braki danych, pełne dane, wartość z podanego zakresu).

Szybkie rekordowanie

Moduł umożliwia przekodowanie wybranych wartości (dowolna wartość, braki danych, pełne dane, wartość z podanego zakresu) zmiennych do wskazanych nowych wartości. Użytkownik może przekodować jednocześnie wiele zmiennych, a nowe kody mogą zostać wprowadzone do tych samych lub nowych zmiennych.

Porządkuj zmienne wielokrotnych odpowiedzi

Moduł umożliwia posortowanie wartości w zmiennych wielokrotnych odpowiedzi zgodnie z kolejnością podaną przez użytkownika.

Przekształcenia zmiennych

Moduł umożliwia normalizację danych do skali testów psychologicznych (stenowej, tenowej, staninowej). Dodatkowo moduł umożliwia przekształcenie zmiennych za pomocą operacji soft-max.