Interactive Visualizations & Dashboards


Statistica Interactive Visualizations & Dashboards jest narzędziem dla analityków biznesowych. Program umożliwia szybkie tworzenie wizualizacji w postaci pulpitów, dzięki którym można od ręki badać złożone zbiory danych i uzyskiwać odpowiedzi na pytania biznesowe. Używając interakcyjnej wizualizacji użytkownik jest w stanie odkryć wzorce i prawidłowości w danych, znaleźć nietypowe przypadki i uzyskać rozmaite wskazówki, a w efekcie szybciej podejmować kluczowe decyzje  biznesowe. Pulpity Statistica Interactive Visualizations & Dashboards umożliwiają drążenie danych, interakcyjne zadawanie filtrów i wizualizację danych strumieniowych w czasie rzeczywistym.

 

Moduł Interactive Visualizations & Dashboards jest zintegrowany z innymi procedurami Statistica. Z punktu widzenia użytkownika w programie pojawia się nowy rodzaj doku­mentu: pulpit Statistica (ang. Statistica Dashboard). Przykładowy pulpit przedstawia rysunek poniżej.


Rys. 1. Przykładowy pulpit Statistica.

Na pulpicie możemy umieszczać wiele różnych wykresów dla różnych zmiennych, rozmaite filtry, obiekty (np. logo) oraz dodatkowe elementy sterujące. Ponadto jeden doku­ment może zawierać wiele kart, przedstawiających różne obrazy. Elementy pulpitu two­rzy­my w bardzo prosty sposób: zakreślając myszą obszar zajmowany przez element i wybie­rając potem rodzaj elementu z palety, która program automatycznie wyświetla na ekranie.

Pulpit działa w jednym z dwóch trybów: edycji i prezentacji. W trybie edycji tworzymy i zmieniamy pulpit: dodajemy nowe wykresy, filtry, elementy sterujące, określamy dane itp. Tryb prezentacji służy do przeglądania pulpitów. Co ważne, również w trybie prezentacji użytkownik może drążyć dane, filtrować, wybierać zmienne pokazywane na wykresach (jeśli takie możliwości przewidziano podczas przygotowania pulpitu) – krótko mówiąc: ma do dyspozycji żywe, interakcyjne narzędzie, a nie statyczny obraz.

Pulpity Statistica wykorzystują jako źródło danych arkusze Statistica, konfiguracje danych Statistica Enterprise oraz wiele innych plików i systemów. Warto zwrócić szczególną uwagę na:

¨       rozwiązania Big Data i NoSQL, w tym Hadoop Hive, Cassandra i MongoDB,

¨       źródła danych strumieniowych, m.in. Apache Active MQ, KDV+ Tick i SAP Sybase ESP[1].

Pulpity Statistica wyposażone są we własne narzędzia przekształcenia, czyszczenia i łą­cze­nia danych z różnych źródeł.

Zasadniczą funkcjonalnością pulpitów Statistica jest przedstawianie rozmaitych, często złożonych i wielowymiarowych danych w postaci obrazów. Użytkownik ma do dyspozycji wiele różnych, często bardzo „sprytnych” wykresów, dzięki którym możliwe jest zrozu­mie­nie skomplikowanych danych i wychwycenie zależności i trendów dotyczących wielu zmiennych. Wykresy te są zoptymalizowane z uwzględnieniem wiedzy o ludzkiej percepcji.

Oczywiście pulpity Statistica umożliwiają tworzenie standardowych wykresów słupko­wych, liniowych i kołowych. Warto jednak zwrócić szczególną uwagę na kilka „spryt­nych” wykresów: omówimy je pokrótce poniżej.

Bullet graph (wykres pociskowy) został opracowany przez Stephena Few. Wykres ten w ergonomiczny sposób przedstawia miary wydajności, jakości względem pewnej wiel­kości referencyjnej. Przykładowo może to być czas pracy maszyn względem założonej nor­my, wydajność względem założonego celu itp. Najważniejsze zalety tego wykresu to oszczędne wykorzystanie miejsca i prostota, pozbawiona zbędnych, a rozpraszających ozdobników.


Rys. 3. Bullet graph.

Standardowo na wykresie bullet graph stosuje się odcienie szarości oznaczające różne poziomy zadowolenia z wartości (zły – dobry – bardzo dobry), wartość miary pokazuje czarny słupek, a wartość referencyjną czarna pionowa linia. Oczywiście wykres ten może­my utworzyć dla grup, w celu ich porównania.

 

Rys. 4. Heat matrix.

Heat matrix to coś w rodzaju graficznej tabeli. Wiersze i kolumny tabeli określają dwie zmienne jakościowe, natomiast kolory komórek określone są przez wartości zmiennej ilościowej. Dodatkowo w każdej komórce można umieścić wartość tej zmiennej jako tekst.

Treemap (mapa drzewa) jest świetnym sposobem przedstawienia danych hierarchicznych, umożliwiającym pokazanie wartości pewnej miary:

¨       dla dużej ilości obiektów o różnej wadze,

¨       dla zbiorowości podzielonej na wiele hierarchicznych grup (np. kontynent, region, państwo lub zakład produkcyjny, linia, maszyna).


Rys. 5. Mapa drzewa.

Na mapie drzewa wartości jednej zmiennej przedstawione są w postaci różnej wielkości prostokątów. Prostokąty te mogą być zagnieżdżone (tzn. prostokąty na najwyższym pozio­mie są podzielone na prostokąty na niższym poziomie itd.), aby pokazać hierarchię grup. Dzięki temu możemy na jednym obrazie zobaczyć np. liczbę ludności na poziomie konty­nentu i państwa. Prostokątom przypisujemy kolor, w celu przedstawienia wartości pewnej zmiennej, a na prostokąty możemy wstawić teksty z wartościami kolejnych zmiennych.

Warto podkreślić, że mapa drzewa w naturalny sposób wspiera drążenie danych: po klik­nięciu danego prostokąta zobaczymy jego wewnętrzną strukturę.

Horizon graph to doskonałe narzędzie do pokazania wielu przebiegów, w szczególności do poszukiwania związków wśród bardzo wielu przebiegów czasowych. Punktem wyjścia dla tego wykresu jest zwykły wykres liniowy. Następnie wykres ten jest kolorowany. Standar­dowo obszary powyżej średniej kolorowane są od bladoniebieskiego koloru do ciemno­nie­bieskiego, a obszary poniżej średniej od jasnoczerwonego do ciemnoczerwonego – im dalej od średniej, tym kolor jest intensywniejszy. Trzeci krok to odbicie obszarów pod linią środkowa względem linii środkowej. Końcowy etap to podział obszaru wykresu na 3 równe części. Wykresy z dwóch odleglejszych od średniej części przenoszone są i nakła­da­ne na obszar najbliżej środka. Będą one widoczne, ponieważ są wykreślane ciemniej­szym kolorem. W wyniku takiego postępowania uzyskujemy wykres zajmujący 1/6 powierzchni zwykłego wykresu liniowego.

Rys. 6. Horizon graph.

Przykładowy wykres powyżej pokazuje 13 miar. Wykres liniowy dla takiej liczby miar bę­dzie nieczytelny, natomiast na powyższym wykresie łatwo jest zauważyć związek miar x02x08. Dosyć podobny wydaje się również przebieg zmiennych x04, x05, x06, x09x10.

Bardzo użyteczna jest również złożona tabela. Pokazuje ona wartości miar w grupach – także uwzględniając hierarchię grup – przy czym może zawierać zarówno wartości liczbowe, jak i wykresy różnego typu oraz ikony wskazujące wartości, na które należy zwrócić szczególną uwagę.

 

 


[1] Dostęp do danych strumieniowych wymaga specjalnej licencji..

Statistica Visulization Server to dodatkowy produkt, który umożliwia udostępnianie pulpitów przez Internet czy intranet. Odbiorcy wizualizacji mogą wtedy otwierać pulpity w standardowej przeglądarce internetowej i pracować z nimi w trybie prezentacji. Tryb prezentacji służy do przeglądania pulpitów udostępnionych z poziomu trybu edycji (tryb edycji jest dostępny w module Statistica Interactive Visualizations & Dashboards).

W trybie prezentacji użytkownik może drążyć dane, filtrować, wybierać zmienne pokazywane na wykresach (jeśli takie możliwości przewidziano podczas przygotowania pulpitu) – krótko mówiąc: ma do dyspozycji żywe, interakcyjne narzędzie, a nie statyczny obraz.



Rys. 1. Przykładowy pulpit Statistica w przeglądarce



Rys. 2. Przykładowy pulpit Statistica w przeglądarce



Rys. 3. Przykładowy pulpit Statistica w przeglądarce