Wprowadzenie (informacje ogólne). WebSTATISTICA Server umożliwia pełne wykorzystanie Internetu podczas pracy z programami z rodziny STATISTICA. W szczególności umożliwia zdalne uruchamianie STATISTICA w oknie przeglądarki internetowej,a także szybki i łatwy dostęp do danych i narzędzi analitycznych z praktycznie każdego komputera połączonego z Internetem. W skład WebSTATISTICA wchodzi zestaw środowisk pracy (bardzo prostych w obsłudze), umożliwiających określenie analizy i przeglądanie wyników za pomocą przeglądarki internetowej. Ponadto system zawiera narzędzia do modyfikowania predefiniowanego środowiska pracy i budowy własnego interfejsu. Przykładem bardzo prostego środowiska mogą być trzy przyciski w oknie przeglądarki: kliknięcie któregoś z nich powoduje wykonanie konkretnych analiz i wyświetlenie wynikowego raportu w oknie przeglądarki. Program WebSTATISTICA dodaje nowy wymiar funkcjonalności do wszystkich programów z rodziny STATISTICA, przeznaczonych do analizy danych, data mining i sterowania jakością.
Wprowadzenie (informacje techniczne). WebSTATISTICA jest w pełni skalowalnym, bazującym na technologii internetowej systemem gromadzenia i analizy danych przeznaczonym dla całych organizacji. System wykorzystuje przetwarzanie rozproszone i wielowarstwową architekturę klient-serwer. WebSTATISTICA dostarcza funkcjonalność narzędzi analitycznych, graficznych oraz narzędzi do budowy zapytań i raportów programu STATISTICA poprzez prosty w użyciu, interaktywny interfejs przeglądarki internetowej. System oferowany jest jako kompletna, gotowa do instalacji aplikacja z interaktywnym, przeglądarkowym interfejsem użytkownika, pozwalającym użytkownikowi, znajdującemu się w dowolnym miejscu na świecie, w sposób interaktywny wykonywać analizy i przeglądać ich wyniki. WebSTATISTICA ma otwartą, zgodną ze standardami architekturę i zawiera narzędzia programistyczne zgodne ze środowiskiem .NET (bazujące na standardach przemysłu informatycznego takich jak VB Script, C++, HTML, XML) umożliwiające pracownikom działu IT dostosowywanie systemu do własnych potrzeb i rozszerzanie go, na przykład poprzez dodanie nowych składników, specjalistycznych metod analitycznych przeznaczonych dla korporacji lub komponentów dostępu do baz danych. System pracuje na wszystkich popularnych serwerach WWW (np. Apache i Microsoft IIS), współpracuje ze środowiskiem Microsoft .NET i Sun/Java. System nie wymaga zmian istniejących systemów bezpieczeństwa.
Szeroki wybór narzędzi analitycznych i konfiguracji
System WebSTATISTICA jest oferowany jako kompletne rozwiązanie, zawierające funkcjonalność analityczną poszczególnych produktów z rodziny STATISTICA lub ich kombinacji, począwszy od STATISTICA Pakiet Podstawowy, a skończywszy na wszystkich systemach korporacyjnych: STATISTICA Enterprise i Data Miner. Minimalna instalacja WebSTATISTICA zawiera narzędzia analityczne z programu STATISTICA Pakiet Podstawowy.
Klienci mogą zamówić określoną wersję WebSTATISTICA Server łącznie z narzędziami analitycznymi koniecznymi do jego funkcjonowania (np. STATISTICA Pakiet Podstawowy dla 10 użytkowników), jak również można dodać funkcjonalność Web Server (jak to opisano w tym rozdziale) do pewnych lub wszystkich aktualnie posiadanych licencji na produkty z rodziny STATISTICA (np., można dodać licencję WWW do 20 spośród 50 istniejących licencji STATISTICA Enterprise).
Funkcjonalność i możliwe zastosowania.
Zalety WebSTATISTICA
System, który czyni STATISTICA "wszechobecną"
Prawdopodobnie najbardziej oczywistą zaletą WebSTATISTICA, jest możliwość korzystania z programów z rodziny STATISTICA z dowolnego komputera na świecie, który jest podłączony do Internetu. W ten sposób system WebSTATISTICA dodaje nowy wymiar funkcjonalności do wszystkich programów z rodziny STATISTICA, przeznaczonych do analizy danych, data mining i sterowania jakością.
Na przykład możemy otrzymać najświeższe dane i raporty (powstałe dla najnowszych danych) - z możliwością dalszego interaktywnego zgłębiania wyników i interaktywnie otrzymywać dodatkowe wyniki analiz. System umożliwia także pracownikom (po uwierzytelnieniu w systemie) dostęp do danych korporacyjnych z dowolnego miejsca na świecie, bez względu na typ komputera, na którym pracują. Wszędzie tam, gdzie jest Internet (czyli praktycznie ...wszędzie), mamy dostęp do zapytań, raportów i narzędzi analitycznych wszechstronnego systemu analizy danych.
W pełni dostosowywalny system business intelligence w skali całej organizacji
Równie ważnym elementem funkcjonalności WebSTATISTICA jest użycie tego systemu jako rdzenia i naturalnego rozszerzenia systemów korporacyjnych STATISTICA.
W szczególności WebSTATISTICA może działać jako podstawa korporacyjnego systemu sieciowego, umożliwiając uczestniczenie w pracy grupowej, współdzielenie wyników (raportów), jak również skryptów do analiz lub zapytań. Za pomocą uprawnień określanych dla grup lub poszczególnych użytkowników administratorzy systemu mogą zarządzać prawami dostępu do danych i raportów. Możliwości zarządzania dostępem poprzez Internet czynią WebSTATISTICA idealnym systemem ułatwiającym wspólne tworzenie projektów przez wielu pracowników pracujących w różnych pomieszczeniach lub rozmieszczonych w różnych filiach korporacji (nawet na różnych kontynentach), lub pracowników znajdujących się w podróży, czy takich, z którymi mamy w danej chwili jedynie łączność telefoniczną.
Zalety przetwarzania rozproszonego i wielowarstwowej architektury klient-serwer.
Niezależnie od tego, gdzie fizycznie znajdują się użytkownicy WebSTATISTICA (np. w tym samym budynku lub na innym kontynencie), czerpią oni korzyści nie tylko z narzędzi do wspólnej pracy, ale również z możliwości przesyłania długotrwałych i wymagających zadań do wykonania na przeznaczonej do tego maszynie (lub maszynach). Są one zazwyczaj wyposażone w wiele wydajnych procesorów, dużo pamięci RAM oraz szybkie i pojemne systemy pamięci masowej. Dzięki temu możliwe jest wykonanie złożonych, wieloetapowych obliczeń dla ogromnych plików danych w rozsądnym czasie, pozostawiając jednocześnie komputer użytkownika do jego dyspozycji. Ponieważ WebSTATISTICA może działać w trybie przetwarzanie rozproszonego, wykorzystuje wiele procesorów lub wiele komputerów do przetwarzania danych. Użytkownicy mogą w pełni wykorzystywać wielowarstwową architekturę klient-serwer, gdzie:
- Warstwa 1 - jest to interfejs użytkownika (UI) na komputerze klienta (zwykła przeglądarka lub klient STATISTICA; patrz Klient STATISTICA niżej),
- Warstwa 2 - jest to oprogramowanie WebSTATISTICA Server i implementacja „business intelligence”, która może zawierać określone zapytania, skrypty własnych analiz itd.),
- Warstwa 3 - warstwę tę stanowią bazy i hurtownie.
Zwykła (lokalna) wersja
STATISTICA wszystkie obliczenia wykonuje lokalnie, a zasoby innych komputerów wykorzystywane są jedynie przy korzystaniu ze zdalnych baz danych przez
In-Place Database Processing (IDP). IDP umożliwia asynchroniczny, bezpośredni dostęp do bazy danych (z możliwością wykorzystania przetwarzania rozproszonego, jeśli oferuje je serwer bazy danych) i pozwala uniknąć zapisywania kopii danych wymaganych do analizy na lokalnym dysku w postaci pliku danych (importowania danych). Gdy korzystamy z
IDP, serwer bazy danych generuje rekordy danych i przesyła je do
STATISTICA Data Miner, który jednocześnie przetwarza dane na stacji roboczej użytkownika.
W przypadku wersji klient-serwer
STATISTICA wszystkie obliczenia odbywają się na serwerze, a stacja robocza użytkownika obsługuje wyłącznie interfejs użytkownika. Architektura klient-serwer daje wyraźne korzyści przy pracy z dużymi projektami, które wymagają złożonych obliczeń dla ogromnych zbiorów danych. Wykonanie takich projektów w skrajnych przypadkach może być realne tylko na specjalnym komputerze, a ponadto przeniesienie długotrwałych zadań na serwer pozwala korzystać z lokalnego komputera w czasie wykonywania zadania.
Klient STATISTICA. Aczkolwiek do pracy w WebSTATISTICA nie są wymagane żadne składniki oprogramowania STATISTICA, jednak zainstalowanie jej daje nowe możliwości. Powstaje pytanie: „Dlaczego mam używać WebSTATISTICA, jeżeli na moim laptopie zainstalowana jest STATISTICA?”. Odpowiedzią jest dostęp do dodatkowych zalet wielowarstwowej architektury klient-serwer i interakcyjnej pracy w STATISTICA z możliwością przesyłania czasochłonnych zadań do wykonania na serwerze oraz wymiany danych i wyników między wszystkimi warstwami sytemu. Z poziomu pracującej na naszym komputerze STATISTICA możemy uruchamiać zadnia w WebSTATISTICA (na serwerze) oraz sterować współpracą tych dwu aplikacji. Dostępnych jest wiele możliwości rozdzielania zadań między komputer użytkownika (stację roboczą) a serwer.
Ponadto, gdy korzystamy ze środowiska użytkownika WebSTATISTICA w przeglądarce internetowej, możemy pobrać uzyskane wyniki (arkusze, wykresy itp.) na stację roboczą, aby otworzyć je w pracującej na stacji roboczej STATISTICA. Z pobranym w ten sposób dokumentami możemy pracować tak jak z utworzonym lokalnie.
Zalety technologii wielowątkowej. WebSTATISTICA wykorzystuje przetwarzanie rozproszone i wielowątkowość, co pozwala optymalnie wykonywać bardzo duże zadania obliczeniowe. Technologia WebSTATISTICA umożliwia szybkie wykonywanie bardzo dużych projektów (takich jak przedstawiony na ilustracji poniżej) z pełnym wykorzystaniem wielu procesorów serwera lub wielu serwerów pracujących równolegle. Na rysunku poniżej przedstawiono wykonywanie pojedynczego projektu STATISTICA Data Miner na czteroprocesorowym serwerze oraz okno Menadżera zadań z informacjami o wykorzystaniu zasobów serwera. Jak widać, w pełni wykorzystywane są wszystkie cztery procesory.
Skalowalność (dzięki technologii przetwarzania równoległego)
unikalnych cech technologii przetwarzanie rozproszonego WebSTATISTICA jest możliwość korzystania nie tylko ze wszystkich procesorów jednego serwera, ale również z wielu serwerów. Wiele procesorów i serwerów może jednocześnie wykonywać wiele zadań zleconych przez różnych użytkowników, ale również jeden projekt data mining zawierający wiele różnych metod analizy danych. Możliwość wykorzystania wielu serwerów jest ważna, ponieważ w pewnych sytuacjach daje duży przyrost wydajności. WebSTATISTICA używa technologii przetwarzania równoległego dla oddzielnych komputerów (podobnie jak robią to niektóre superkomputery), dzięki temu, jeśli dysponujemy na przykład trzema serwerami, z których każdy zawiera 4 procesory, program może wykonywać jeden projekt, używając wszystkich 12 procesorów (jeśli tylko skala projektu daje podstawy do uruchomienia tego trybu przetwarzania).
Interfejs użytkownika WebSTATISTICA
Użytkownik wersji klient-serwer STATISTICA może interakcyjnie pracować z programem działającym na serwerze, korzystając z interfejsu w ramach przeglądarki internetowej uruchomionej na swoim komputerze (kliencie). Dzięki temu z WebSTATISTICA można korzystać na dowolnym komputerze, który ma połączenie z Internetem. Bez względu na to, na jakim komputerze pracuje użytkownik, wszystkie obliczenia wykonywane są na serwerze, który zazwyczaj będzie miał wydajniejsze procesory i więcej zasobów dyskowych.
W istocie środowisko WebSTATISTICA może pracować jednocześnie na wielu komputerach, znajdujących się w dowolnych miejscach na całym świecie (pod warunkiem, że są one połączone z Internetem, nawet niezbyt szybkim łączem). System, działając na serwerze (lub wielu serwerach), wykonuje wszystkie obliczenia przy zachowaniu bezpieczeństwa i kontroli uprawnień dostępu do projektów przez określone grupy użytkowników.
WebSTATISTICA ma prosty interfejs użytkownika dający dostęp do interaktywnych analiz, operacji dotyczących data mining, kart kontrolnych, zarządzania bazą danych, stosowania zapytań do bazy oraz dostosowywania wykresów.
Po uwierzytelnieniu w WebSTATISTICA
użytkownik może wybrać źródło danych (plik lub połączenie z bazą danych),
przeglądać i edytować dane w interaktywnym edytorze arkusza danych,
wykonywać analizy, używając standardowego menu (lub skrótu z zdefiniowanym przez użytkownika My Menu),
wybierać zmienne oraz określić opcjonalne parametry analizy,
oraz w sposób interakcyjny przeglądać wyniki.
Szeroka gama interakcyjnie działających funkcji umożliwiających dokonywanie operacji na bazach danych, używanie kart kontrolnych oraz technik data mining jest dostępna przy użyciu standardowej przeglądarki internetowej
Program WebSTATISTICA umożliwia dodatkowo rozszerzenie funkcji dostępnych poprzez interfejs użytkownika. W skład systemu wchodzi zbiór narzędzi umożliwiających użytkownikowi dostosowanie interfejsu do swoich potrzeb i zamieszczenie w nim zdefiniowanych wcześniej funkcji oraz grupowanie ich według przeznaczenia.
Zgodność ze standardami
Stopień zgodności ze standardami przemysłu informatycznego jest kolejną z listy zalet WebSTATISTICA.
WebSTATISTICA może być instalowana na wszystkich popularnych serwerach WWW (np. Apache lub IIS), i dlatego może być dopasowana do istniejących, lokalnych protokołów zabezpieczeń (firewall), zgodnie z wymogami korporacyjnymi.
WebSTATISTICA Server wykorzystuje zaawansowane, zastrzeżone technologie rozwijane przez StatSoft co gwarantuje wysoką skuteczność i skalowalność systemu (np. w odniesieniu do wielu komputerów, wieloprocesorowych serwerów STATISTICA pracujących w środowisku zarządzania danymi i ich rozpowszechniania). Technologia ta bazuje na wieloletnim doświadczeniu StatSoft w ciągu wielu lat doświadczeń w dostarczaniu wysokowydajnych, skalowalnych systemów dla odbiorców na całym świecie. Jednocześnie system WebSTATISTICA wykorzystuje standardowe protokoły (np. XML), co zapewnia (a) niezależność od platformy serwera, (b) łatwe dostosowanie do nowych technologii, (c) gwarantuje prostotę dostosowania się systemu do potrzeb użytkownika. Elementem wpływającym na elastyczność systemu jest niewątpliwie standard przemysłu informatycznego w postaci skryptów Visual Basic, C++, HTML, XML, które mogą być wykorzystywane w WebSTATISTICA do definiowania operacji analitycznych i dostosowywania wszystkich wyników analiz.
Architektura systemu (uwaga techniczna)
WebSTATISTICA może wykorzystywać jeden komputer do obsługi serwisu WWW (np. wykorzystując oprogramowanie Apache pracujące w systemie UNIX) i co najmniej jedną maszynę, na której pracuje STATISTICA (maszyn takich może być wiele).
W wielu przypadkach, serwer STATISTICA może być instalowany na tym samym komputerze, na którym działa serwer WWW, np. IIS (będący standardowym komponentem systemu Windows).
System umożliwia modyfikację interfejsu użytkownika, w tym celu wykorzystuje się standardowy język skryptowy. Skrypty są przechowywane i wykonywane na serwerze. Serwer WWW odbiera od użytkownika żądania wykonania zadań (wysyłane z okna przeglądarki), przesyła je do serwera STATISTICA. Następnie zbiera wyniki analiz wykonanych przez serwer STATISTICA i wyświetla je w oknie przeglądarki użytkownika.
Komunikacja pomiędzy serwerem WWW i serwerem STATISTICA odbywa się z zastosowaniem technologii opartej na XML. System jest w pełni dostosowywalny do potrzeb użytkowników, którzy chcą go modyfikować lub rozszerzać, oferuje zestaw narzędzi programistycznych umożliwiających modyfikację zarówno skryptów uruchamianych przez STATISTICA (po stronie serwera STATISTICA), jak i wygląd interfejsu po stronie użytkowników końcowych (strony w oknie przeglądarki internetowej). Do rozszerzania systemu i jego dostosowania wykorzystywane są standardowe narzędzia jak Visual Basic lub XML/HTML).
Definicje strony WWW i wykonywane skrypty STATISTICA przechowywane są w dedykowanym repozytorium danych po stronie serwera STATISTICA, przez serwer są one również zarządzane i kolejkowane. System zawiera narzędzie Distributed Processing Manager do zarządzania uruchomionymi procesami, optymalnego zarządzania wątkami STATISTICA i wieloma serwerami STATISTICA.
System WebSTATISTICA zawiera również poszerzony o aspekty WWW STATISTICA Visual Basic. Rozszerzenia te umożliwiają twórcom skryptów zarówno automatycznie wyświetlać wyniki analiz w postaci wykresów i skoroszytów na generowanych w sposób automatyczny stronach WWW albo określać wygląd tych stron poprzez własny kod HTML.
Bezpieczeństwo i uwierzytelnianie jest kluczową cechą systemu WebSTATISTICA. Na początku sesji użytkownik zostanie poproszony o podanie swojej nazwy i hasła. Administratorzy systemu mogą kontrolować prawa dostępu do źródeł danych i skryptów poprzez uprawnienia dla poszczególnych użytkowników lub całych grup użytkowników. Największe uprawnienia mają użytkownicy zaawansowani (lub administratorzy), którzy mogą uruchamiać skrypty sterujące (np. zarządzające systemem lub określające relacje pomiędzy poszczególnymi operacjami). Na tym poziomie wymagane są już wysokie prawa dostępu, spowodowane jest to ogólną naturą i możliwościami języka STATISTICA Visual Basic, co daje dostęp do wszystkich zasobów w sieci (dla użytkowników posiadających odpowiednie uprawnienia).
Warto zauważyć, że system ten może być zintegrowany ze „zwykłą” wersją sieciową STATISTICA lub STATISTICA Enterpirse. Na przykład spośród wszystkich 50 użytkowników systemu korporacyjnego STATISTICA, tylko 20 będzie miało dostęp do WebSTATISTICA.
Przewaga nad produktami konkurencyjnymi
Przewaga WebSTATISTICA nad produktami konkurencyjnymi rozpoczyna się długą listą unikalnych cech tego rozwiązania przedstawionych powyżej. W przeciwieństwie do produktów konkurencyjnych, oferujemy kompletną aplikację (rozwiązanie) z opartym na środowisku przeglądarkowym interfejsem użytkownika, a nie tylko zestaw narzędzi dla programistów (aczkolwiek w skład systemu wchodzą również te narzędzia). System nie wymaga specjalnego, niestandardowego serwera WWW (który może być niezgodny ze standardami danej organizacji). Ostatecznie system kontrolowany jest przez skrypty Visual Basic, C++, HTML oraz XML, będące standardem przemysłu informatycznego, które mogą być modyfikowane przez użytkowników posiadających odpowiednie uprawnienia lub administratorów systemu. Warto też zwrócić uwagę na możliwość stosowania przetwarzania wielowątkowego.
WebSTATISTICA Knowledge Portal jest narzędziem umożliwiającym jej użytkownikom efektywne i bezpiecznie publikowanie dokumentów w sieci Intranet lub Internet. Narzędzie to ułatwia pracę wielu użytkownikom (z których każdy ma inne uprawnienia do danych i wyników). Dokumenty uporządkowane są hierarchicznie, co ułatwia odnajdywanie potrzebnych informacji.
Film prezentujący WebSTATISTICA
Jak w praktyce działa
WebSTATISTICA? Wystarczy kliknąć poniższą ikonę, aby obejrzeć prezentację działania tego potężnego systemu i jego unikalnych właściwości.