Planowanie doświadczeń. STATISTICA Planowanie doświadczeń to
wyczerpujący zestaw procedur planowania i analizy doświadczeń wykorzystywanych
w przemyśle w badaniach rozwojowych i zapewnieniu jakości: plany 2(k-p) z
podziałem na bloki (dla ponad 100 wielkości wejściowych, włączając w to
unikatowe, wysoce efektywne algorytmy poszukiwania planów o najmniejszej
aberracji i maksymalnym nieuwikłaniu, w przypadku których użytkownik może zadać
efekty interakcyjne, które powinny być nieuwikłane) , plany eliminacyjne (dla
ponad 100 wielkości wejściowych, także plany Placketta-Burmana), plany 3(k-p) z
podziałem na bloki (także plany Boxa-Behnkena), plany różnowartościowe, plany
centralne kompozycyjne (powierzchnie odpowiedzi, w tym tzw. małe plany
centralne kompozycyjne), plany kwadratów łacińskich, plany metody Taguchi z
wykorzystaniem tablic ortogonalnych, plany dla przygotowywania mieszanin i
plany dla powierzchni trójkątnych, wierzchołki i środki ciężkości dla
ograniczonych powierzchni i mieszanin, plany
D i
A-optymalne,
także dla powierzchni i mieszanin. Konkretne typy dostępnych planów oraz metody
ich generowania i analizowania są opisane poniżej. Środowisko programu dostępne jest w polskiej wersji językowej.
Analiza doświadczenia: Ogólne możliwości. Opcje służące do analizy
planów doświadczenia, w tym planów dla mieszanin, są ze swej natury ogólne;
mogą posłużyć do analizy planów niezrównoważonych i niekompletnych, dając
użytkownikowi pełną kontrolę nad modelem wybranym w celu dopasowania do danych.
Program oblicza wówczas uogólnioną odwrotność macierzy
X'X (gdzie
X
oznacza macierz planu), aby określić efekty możliwe do estymacji i stwierdzić,
które efekty są zamiennikami pozostałych. Program następnie automatycznie
wyświetli listę zamienników oraz obliczy oceny parametrów, które nie są
redundantne. Można także w łatwy sposób ręcznie "przełączać" poszczególne
efekty wchodzące w skład bieżącego modelu i obserwować wpływ tych zmian na
dopasowanie modelu do danych. Wszystkie analizy mogą być przeprowadzane na
wielkościach unormowanych oraz na wielkościach rzeczywistych, a duża liczba
opcji umożliwia wszechstronne przeglądanie uzyskanych wyników: ocen parametrów,
tablicy analizy wariancji itp. Są liczne dodatkowe opcje przeznaczone do
eksplorowania uzyskanych wartości aproksymowanych, powierzchni itp.; opcje te
są opisane poniżej przy okazji omawiania poszczególnych planów doświadczeń.
Analiza resztowa i przekształcenia. Liczne wykresy i inne formy
prezentacji wyników umożliwiają dalszą analizę wartości resztowych rozważanego
modelu. W szczególności program oblicza wartości aproksymowane i resztowe oraz
ich odchylenia standardowe, przedziały ufności wartości aproksymowanych,
standaryzowane wartości aproksymowane i resztowe, studentyzowane reszty,
wartości wpływu, usunięte wartości resztowe, studentyzowane usunięte reszty,
statystyki Mahalanobisa i Cooka, statystyki DFFIT, standaryzowane
statystyki DFFIT. Wszystkie wymienione statystyki resztowe mogą być
zapisane w celu przeprowadzenia dalszej analizy przy pomocy innych modułów
programu STATISTICA (np. analiza autokorelacji błędów w module
Szeregi czasowe). Statystyki resztowe mogą być przeglądane w
formie uszeregowanej według kolejności układów lub wartości statystyk; w ten
sposób wartości nadmierne w odniesieniu do każdej ze statystyk resztowych mogą
być łatwo zidentyfikowane. Jako dodatkowa pomoc w ocenie dopasowania
rozważanego modelu do danych i w zidentyfikowaniu wartości nadmiernych mogą
służyć histogramy wartości resztowych (usuniętych wartości resztowych) i
wartości aproksymowanych, wykresy rozrzutu wartości resztowych (usuniętych) w
funkcji wartości aproksymowanych, wykresy prawdopodobieństwa normalnego,
połówkowego normalnego i odchyleń od normalności, wykonane dla wartości
resztowych (usuniętych). Sprawdzianem dla występowania seryjnych korelacji
wartości resztowych może być wykres wartości resztowych (usuniętych) w funkcji
kolejności układów. W przypadku wszystkich wykresów, w których występują
pojedyncze pomiary (np. wartości resztowe w funkcji kolejności układów), punkty
wykresu są oznaczane numerami układów lub etykietami, co pozwala na bardzo
łatwe zidentyfikowanie wartości nadmiarowych w zbiorze danych. Na koniec,
program może obliczyć wartości parametru lambda o największej
wiarygodności w celu wykonania przekształcenia Box-Coxa wartości wielkości
wyjściowych; wynikowi temu towarzyszy wykres sum kwadratów resztowych w funkcji
parametru lambda oraz podawany jest przedział ufności dla parametru lambda.
Optymalizacja
pojedynczej lub wielu wielkości wyjściowych: Profil użyteczności odpowiedzi.
Unikatowy zestaw opcji umożliwia użytkownikowi bezpośrednią, interaktywną
optymalizację pojedynczej lub wielu wielkości wyjściowych dla danego
rozważanego modelu. Po pierwsze, w przypadku modeli powierzchni odpowiedzi
drugiego rzędu i modeli dla mieszanin program oblicza wartości wielkości
wejściowych odpowiadające wartościom minimalnym, maksymalnym lub siodłowym
danej powierzchni (tzn. oblicza wartości krytyczne danej powierzchni wraz z
odpowiednimi wartościami własnymi i wektorami własnymi opisując w ten sposób
krzywiznę i orientację powierzchni odpowiedzi). Warto zwrócić uwagę, że w
przypadku planów dla mieszanin opcje profilu użyteczności odpowiedzi nie bazują
na prostym przekształceniu modelu mieszaniny do modelu powierzchni bez warunków
dodatkowych (co mogłoby prowadzić do błędnych wyników, takich jak np. optymalne
wartości wielkości wejściowych, które nie stanowią poprawnej mieszaniny);
zamiast tego wszystkie obliczenia przeprowadzane są bezpośrednio przy pomocy
modelu mieszaniny (wraz z warunkami ograniczającymi). W ten sposób, w trakcie
poszukiwania wartości optymalnych wielkości wejściowych dla zadanej funkcji
użyteczności jednej lub wielu wielkości wyjściowych można mieć pewność, że
przeszukiwany jest tylko ograniczony obszar badań mieszaniny, a uzyskane
wartości wielkości wejściowych spełniają ogólny warunek sumowalności mieszaniny
(sumy całkowitej). Po drugie, kompletny zbiór opcji graficznych umożliwia
prezentację aproksymowanych wartości jednej lub wielu wielkości wyjściowych w
funkcji każdej wielkości wejściowej uwzględnianej w analizie przy jednoczesnym
nadaniu pozostałym wielkościom wejściowym wartości stałych. W szczególności w
przypadku wielu wielkości wyjściowych można zdefiniować funkcje użyteczności,
która odzwierciedla najbardziej pożądane wartości wielkości wyjściowych oraz
wagę każdej z tych wielkości dla całkowitej użyteczności. Można wówczas wykonać
wykresy profili funkcji użyteczności (obliczonej na podstawie wartości
aproksymowanych wielkości wyjściowych) względem określonego przez użytkownika
zestawu wartości każdej wielkości wejściowej.
Niezależnie od tego, indywidualne profile każdej wielkości wyjściowej wraz z
odpowiednimi przedziałami ufności mogą być wyświetlone na tym samym wykresie.
Ponadto funkcja użyteczności może być przedstawiona na wykresie przestrzennym
lub warstwicowym, a użytkownik może zażądać wykonania macierzy takich wykresów
dla wszystkich możliwych par wielkości wejściowych uwzględnianych w analizie.
Wszystkie elementy takie jak siatka wartości wielkości wejściowych lub postać
funkcji użyteczności mogą być łatwo modyfikowane w trakcie interaktywnej
analizy; przykładowo można szybko wyłączyć poszczególne wielkości wyjściowe z
analizy i badać wpływ tego wyłączenia na całkowitą funkcję użyteczności.
Definicje skomplikowanych funkcji użyteczności wielu wielkości wyjściowych mogą
być zapamiętane w pliku, aby móc je później wykorzystać dla potrzeb analizy
innego doświadczenia, w którym występują te same wielkości wyjściowe. Na koniec
należy wspomnieć o opcjach służących do określenia wartości wielkości
wejściowych odpowiadających wartości optymalnej funkcji użyteczności: posłużyć
się można metodą przeszukiwania węzłów siatki wielkości wejściowych w badanym
obszarze lub ogólnym efektywnym algorytmem optymalizacji funkcji (który jest
szczególnie użyteczny przy optymalizacji funkcji użyteczności w przypadku
doświadczenia z wieloma wielkościami wejściowymi). Zauważmy, że opcje
profilowania użyteczności dostępne są też w STATISTICA
Ogólne modele liniowe (GLM), Ogólne
modele regresyjne (GRM) i Ogólne
modele analizy dyskryminacyjnej (GDA) (dla
skategoryzowanych wielkości wyjściowych).
Standardowe plany frakcyjne dwuwartościowe 2(k-p) z podziałem na bloki (plany o
najmniejszej aberracji w sensie Boxa-Huntera-Huntera). Moduł Planowanie
doświadczeń udostępnia kompletny katalog wszystkich standardowych
planów o najmniejszej aberracji (opublikowanych m.in. w powszechnie znanej
pracy Boxa i Drapera, 1987; Boxa, Huntera i Huntera, 1978; Montgomery'ego,
1991). Użytkownik może przeglądać plany wyświetlone w arkuszu, randomizować
układy całościowo lub w obrębie bloków i dodawać w arkuszu puste kolumny.
Dostępne są opcje umożliwiające wprowadzenie wartości zakresów dla
poszczególnych wielkości wejściowych, a plany mogą być prezentowane i
zapisywane przy użyciu wartości unormowanych lub rzeczywistych. Użytkownik może
dodatkowo zażądać powtórzeń układów, dodania układów w centrum planu lub
wykonania złożenia planu (foldover). Przeglądać można generatory planu
frakcyjnego, generatory bloków, macierz zamienników efektów głównych i
interakcji. Moduł Planowanie doświadczeń automatycznie wykonuje
kompletną analizę wariancji (ANOVA) planu. Użytkownik sprawuję pełną kontrolę
nad tym, które efekty i interakcje będą włączone do analizowanego modelu; może
przeglądać korelacje pomiędzy kolumnami macierzy planu (X) i zapoznać
się z odwrotnością macierzy iloczynowej X'X (tzn. udostępniane są
macierze korelacji i kowariancji estymatorów parametrów). W programie obliczane
są estymatory parametrów ANOVA, ich odchylenia standardowe oraz przedziały
ufności, a także współczynniki regresji (odchylenia standardowe, przedziały
ufności) zarówno dla unormowanych (przedział [-1, +1]), jak i
rzeczywistych wielkości wejściowych. Na podstawie wspomnianych estymatorów
program umożliwia obliczenie wartości aproksymowanych (oraz odchyleń
standardowych i przedziałów ufności) dla zadanych przez użytkownika wartości
wielkości wejściowych.
Program oblicza kompletną tablicę ANOVA, bazując na średnim kwadracie reszt
(MS), a w przypadku planu zawierającego choćby częściowe powtórzenia podstawą
obliczeń jest estymator czystego błędu. Jeżeli jest dostępny estymator czystego
błędu, program przeprowadza test całkowitej adekwatności; jeżeli plan zawiera
układy centrum obliczana jest także całkowita krzywizna. Użytkownik może
przeglądać tablice średnich i średnich krańcowych oraz ich przedziały ufności.
Liczne opcje umożliwiają graficzne przedstawienie uzyskanych wyników: wykresy
Pareto efektów, wykresy prawdopodobieństwa normalnego i normalnego połówkowego
efektów, wykresy kwadratowe i sześcienne, wykresy wartości średnich i
interakcji (wraz z przedziałami ufności dla średnich krańcowych), wykresy
przestrzenne i warstwicowe powierzchni odpowiedzi. Wszystkie opisane powyżej
możliwości są także dostępne (pod nagłówkami Planowanie doświadczeń, Analiza
doświadczeń: Ogólne możliwości, Analiza resztowa i przekształcenia,
Optymalizacja jednej lub wielu wielkości wyjściowych) w trakcie
szczegółowej analizy wartości resztowych, oceny dopasowania modelu oraz
poszukiwania optymalnych wartości wielkości wejściowych dla jednej lub wielu
wielkości wyjściowych.
Plany
frakcyjne 2(k-p) o najmniejszej aberracji i maksymalnym nieuwikłaniu z
podziałem na bloki: ogólne poszukiwanie planu. Jako dodatek do
standardowych planów 2(k-p), moduł Planowanie doświadczeń zawiera ogólną
opcję poszukiwania planu polegającą na generowaniu planów frakcyjnych o
najmniejszej aberracji (najmniej uwikłanych) - z podziałem na bloki lub bez
podziału - dla ponad 100 wielkości wejściowych i ponad 2000 układów. Plany te,
o dużej efektywności, zostały ostatnio opracowane i umożliwiają obliczenie
większej liczby (zadanych) interakcji wielkości wejściowych niż standardowe
plany Boxa-Huntera; STATISTICA jest obecnie jedynym programem, który
udostępnia taką możliwość. Mając zadaną rozdzielczość planu można albo
przeprowadzić kompletne przeszukiwanie wszystkich (nieizomorficznych) zbiorów
generatorów, albo wyszczególnić zbiory interakcji, które powinny być
nieuwikłane przy rozważanej rozdzielczości planu. Jako uzupełnienie ogólnego
kryterium poszukiwań "najmniejszej aberracji" można także wybrać kryterium
"maksymalnego nieuwikłania", które prowadzi do uzyskania planów z największą
możliwą liczbą nieuwikłanych efektów (nieuwikłanych z żadnymi innymi efektami
przy danej rozdzielczości planu). Plany te mogą być dalej ulepszane w ten sam
sposób co standardowe plany 2(k-p) opisane w poprzednim akapicie (poprzez
dodanie powtórzeń, układów centrum, składanie itp.). Wszystkie opcje służące do
analizy, opisane w poprzednim akapicie, można zastosować w odniesieniu do
rozważanych tu planów (lub jakichkolwiek planów 2(k-p).
Plany eliminacyjne (Placketta-Burmana). Moduł Planowanie doświadczeń
umożliwia użytkownikowi tworzenie i analizę eliminacyjnych planów doświadczeń (screening
designs) dla dużej liczby wielkości wejściowych. Program generuje plany
Placketta-Burmana (macierze Hadamarda) i nasycone plany frakcyjne dla
maksymalnie 127 wielkości wejściowych. Podobnie, jak w przypadku planów typu
2(k-p), użytkownik może wprowadzić powtórzenia układów w planie, ręcznie dodać
układy, dodać układy centrum oraz wydrukować i zapisać plan. Dla potrzeb
analizy planów eliminacyjnych dostępne są takie same opcje, jak opisane w
przypadku planów typu 2(k-p) (zob. poprzedni akapit).
Plany
frakcyjne trójwartościowe typu 3(k-p) z podziałem na bloki oraz plany
Boxa-Behnkena. Moduł Planowanie doświadczeń zawiera kompletną
implementację standardowych (blokowych) planów typu 3(k-p). Dołączone są także
standardowe plany Boxa-Behnkena. Podobnie, jak w przypadku wszystkich
pozostałych planów doświadczeń, użytkownik może przeglądać i zapisać plan
zachowując standardową lub randomizowaną kolejność układów, wprowadzić
powtórzenia, ręcznie dodać układy, przeglądać generatory planu i generatory
bloków itd. Program przeprowadza kompletną analizę planów doświadczeń typu
3(k-p). Użytkownik zachowuje pełną kontrolę nad tym, które efekty będą włączone
do analizy. Efekty główne są rozdzielane na efekty liniowe i kwadratowe,
natomiast interakcje są rozdzielane na efekty liniowo-liniowe,
liniowo-kwadratowe, kwadratowo-liniowe oraz kwadratowo-kwadratowe. Możliwe jest
przeglądanie macierzy korelacji, macierzy planu (X), podobnie jak i
odwrotności iloczynu X'X. Program oblicza estymatory parametrów ANOVA
(odchylenia standardowe, przedziały ufności, istotność statystyczną itp.),
współczynniki dla unormowanych (-1, 0, +1) wartości wielkości
wejściowych (czynników) oraz współczynniki dla rzeczywistych
(nieprzekształconych) wartości wielkości wejściowych. Na podstawie powyższych
wartości program umożliwia obliczenie (aproksymowanej) wartości wielkości
wyjściowej dla podanych przez użytkownika wartości wielkości wejściowych.
Tablica ANOVA zawiera wyniki testów dla liniowych i kwadratowych składników
każdego efektu. W przypadku, gdy plan zawiera powtórzenia, do przeprowadzenia
testów ANOVA i statystycznej istotności może być użyty estymator czystego błędu
(pure error); w takim przypadku będzie też przeprowadzony test
adekwatności (lack of fit).
W celu ułatwienia interpretacji uzyskanych wyników, obliczana jest tablica
wartości średnich (wraz z przedziałami ufności) oraz tablica średnich
krańcowych (wraz z przedziałami ufności) dla interakcji. Opcje graficzne
pozwalają na wykonanie wykresu wartości średnich, średnich krańcowych (wraz z
przedziałami ufności), wykresu Pareto efektów, wykresu prawdopodobieństwa
normalnego efektów, przestrzennego i warstwicowego wykresu powierzchni
odpowiedzi, wykresu prawdopodobieństwa normalnego wartości resztowych,
histogramu wartości resztowych itp. Wszystkie opisane powyżej możliwości są
także dostępne (pod nagłówkami Planowanie doświadczeń, Analiza doświadczeń:
Ogólne możliwości, Analiza resztowa i przekształcenia, Optymalizacja jednej lub
wielu wielkości wyjściowych) w trakcie szczegółowej analizy wartości
resztowych, oceny dopasowania modelu oraz poszukiwania optymalnych wartości
wielkości wejściowych dla jednej lub wielu wielkości wyjściowych.
Plany dwu- i trójwartościowe. Program umożliwia zastosowanie planów dwu-
i trójwartościowych skatalogowanych dla Narodowego Biura Standardów
Departamentu Handlu U.S.A. (National Bureau of Standards of U.S. Department of
Commerce). Opcje służące do tworzenia i analizy tychże planów są
identyczne, jak opisane w przypadku planów typu 3(k-p) (zob. poprzedni akapit).
Plany
centralne kompozycyjne (powierzchnia odpowiedzi). Użytkownik może
wybrać plan doświadczenia z biblioteki planów standardowych, zawierającej też
tzw. małe plany centralne kompozycyjne (bazujące na planach Placketta-Burmana).
Prócz opcji standardowych (dodawanie układów, randomizacja, powtórzenia itp.;
zob. plany typu 2(k-p) powyżej) dostępnych w przypadku wszystkich planów
doświadczeń, użytkownik otrzymuje możliwość wyboru punktów gwiezdnych,
obliczanych wg kryterium rotalności, ortogonalności lub obu jednocześnie. Opcje
służące do analizy są bardzo podobne do opisanych powyżej w przypadku planów
typu 2(k-p) i 3(k-p). Użytkownik może obliczyć parametry ANOVA, współczynniki
dla unormowanych wartości wielkości wejściowych (czynników) oraz współczynniki
dla rzeczywistych (nieprzekształconych) wartości wielkości wejściowych. Program
umożliwia obliczenie (aproksymowanej) wartości wielkości wyjściowej dla
podanych przez użytkownika wartości wielkości wejściowych. Użytkownik zachowuje
całkowitą kontrolę nad tym, które efekty będą włączone do modelu. Możliwe jest
przeglądanie macierzy korelacji dla macierzy planu (X), a także macierzy
odwrotnej do iloczynu X'X. Jeżeli plan zawiera powtórzenia, to tablica
ANOVA zawiera estymator czystego błędu (pure error) i ogólny test
adekwatności (lack of fit). Standardowe opcje, służące do graficznej
prezentacji wyników obejmują: wykres Pareto efektów, wykres prawdopodobieństwa
normalnego efektów, przestrzenne i warstwicowe wykresy powierzchni odpowiedzi
(w przypadku, gdy są więcej niż dwie wielkości wejściowe wymagane jest
wprowadzenie wartości użytkownika dla pozostałych wielkości wejściowych) oraz
wykresy wartości resztowych. Wszystkie opisane powyżej możliwości są także
dostępne (pod nagłówkami Planowanie doświadczeń, Analiza doświadczeń: Ogólne
możliwości, Analiza resztowa i przekształcenia, Optymalizacja jednej lub wielu
wielkości wyjściowych) w trakcie szczegółowej analizy wartości
resztowych, oceny dopasowania modelu oraz poszukiwania optymalnych wartości
wielkości wejściowych dla jednej lub wielu wielkości wyjściowych.
Plany kwadratów łacińskich. Użytkownik może wybierać plan doświadczenia
spośród różnych planów kwadratów łacińskich, do dziewięciu wartości wielkości
wejściowych włącznie. Program udostępnia także plany kwadratów
grecko-łacińskich i hiper-grecko-łacińskich, o ile jest to możliwe. W
przypadku, gdy dostępnych jest kilka kwadratów łacińskich, program może dokonać
losowego wyboru lub też pozostawić użytkownikowi wybór konkretnego kwadratu.
Plany mogą być przeglądane w arkuszach, randomizowane oraz mogą być uzupełniane
pustymi kolumnami w celu stworzenia wygodnych formularzy do wprowadzania
wyników pomiarów. Uzyskany plan doświadczenia może być zapisany jako
standardowy plik danych programu STATISTICA. Plik ten, po uzupełnieniu
go zebranymi wynikami pomiarów, może być łatwo analizowany. Jako uzupełnienie
pełnej tablicy ANOVA, moduł Planowanie doświadczeń oblicza wartości
średnie dla wszystkich wielkości wejściowych. Wartości te mogą być
przedstawione na wykresie sumarycznym.
Doświadczenia
wg metody Taguchi. Moduł Planowanie doświadczeń umożliwia
generowanie powszechnie używanych tablic ortogonalnych dla maksymalnie 31
wielkości wejściowych; analizowane natomiast mogą być plany doświadczeń dla
maksymalnie 65 wielkości wejściowych. Uzyskany plan doświadczenia może być
przeglądany w arkuszu wyników i - podobnie jak w przypadku innych typów planów
- kolejność układów planu może być randomizowana, a do planu mogą być dodane
puste kolumny w celu stworzenia wygodnych formularzy do wprowadzania wyników
pomiarów. Użytkownik może też przeglądać równoważniki interakcji
dwuczynnikowych. Moduł Planowanie doświadczeń automatycznie oblicza
standardowe współczynniki stosunku sygnału do szumu (S/N) dla problemów
następujących typów: (1) im mniejsze tym lepsze (Smaller-the-better),
(2) najlepsze nominalne (Nominal-the-best), (3) im większe tym lepsze (Larger-the-better),
(4) znakowany cel (Signed target), (5) frakcja wadliwych (Fraction
defective), (6) liczba uszkodzeń w przedziale czasu (analiza
kumulacyjna) (Number defective per interval - accumulation analysis).
Dodatkowo, analizowane mogą być dane nieprzekształcone; w ten sposób użytkownik
może zastosować dowolny typ indywidualnego współczynnika S/N uzyskanego
poprzez użycie przekształceń dostępnych w arkuszu danych lub użycie języka
STATISTICA Visual Basic. Następnie można przeprowadzić normalną
analizę przy użyciu powyższych procedur. Jako uzupełnienie wyczerpujących
statystyk opisowych użytkownik może przeglądać obliczone współczynniki S/N.
W interakcyjnym arkuszu pokazywana jest pełna tablica ANOVA, a użytkownik może
"włączać" lub "wyłączać" poszczególne efekty w obrębie składnika błędu. Podobny
interakcyjny arkusz umożliwia obliczanie wartości Eta (współczynnika S/N)
dla warunków optymalnych, czyli dla optymalnych wartości wielkości wejściowych.
Użytkownik może "włączać" lub "wyłączać" poszczególne efekty w obrębie modelu
oraz specyfikować wartości wielkości wejściowych. Wartości średnie mogą być
pokazane na standardowym wykresie efektów głównych prezentującym wartości Eta
dla poszczególnych wartości wielkości wejściowych. W przypadku przeprowadzania
analizy kumulacyjnej danych jakościowych wyniki mogą być prezentowane w formie
wykresu zwykłego lub słupkowego skumulowanych prawdopodobieństw poszczególnych
kategorii względem wartości wybranych wielkości wejściowych. Należy zwrócić
uwagę, że różne rodzaje funkcji użyteczności odpowiedzi jednej lub wielu
wielkości wyjściowych mogą być optymalizowane przy pomocy profilu
(użyteczności) odpowiedzi opisanego wcześniej, dostępnego w powiązaniu z
planami 2(k-p), 3(k-p), centralnymi kompozycyjnymi itd. (jak również w
GLM, GRM,
GDA).
Plany
dla mieszanin i powierzchni o podstawie trójkątnej. Moduł Planowanie
doświadczeń udostępnia opcje służące do tworzenia standardowych planów
sympleksowo-kratowych (simplex-lattice) i sympleksowo-centroidowych (simplex-centroid)
dla mieszanin. Plany mogą być rozszerzone o dodatkowe punkty (układy)
wewnętrzne i ogólny środek ciężkości. Użytkownik może wprowadzić ograniczenie
dolne dla każdej wielkości wejściowej, a program automatycznie utworzy
odpowiedni plan w podobszarze (sympleksie) zdefiniowanym przez nałożone
ograniczenia. Wielokrotne ograniczenia górne i dolne mogą być uwzględniane przy
pomocy ogólnych technik służących do tworzenia planów doświadczeń dla
ograniczonych obszarów badań (zob. następny akapit). Podobnie, jak w przypadku
wszystkich pozostałych planów doświadczeń, użytkownik może dodać do planu
indywidualne układy, powtórzenia układów, przeglądać plan i zapisać z
uwzględnieniem standardowej lub randomizowanej kolejności układów. Program
oblicza wartości współczynników dla pseudoskładników (jeżeli są zastosowane)
oraz dla rzeczywistych wartości składników, podając też odchylenia standardowe,
przedziały ufności i wyniki testów istotności statystycznej. (Zauważmy, że
moduł STATISTICA Ogólne modele liniowe (GLM)
również zawiera opcje analizy doświadczeń dla mieszanin, szczególnie użyteczne
przy analizowaniu układów złożonych zawierających zarówno mieszaniny jak i inne
zmienne.) Użytkownik ma pełną kontrolę nad tym, które składniki będą włączone
do modelu; w skład modeli standardowych wchodzą modele liniowe, kwadratowe,
specjalne kubiczne i pełne kubiczne. Tablica ANOVA zawiera wyniki testów
przyrostowego dopasowania różnych modeli, a w przypadku, gdy w planie
doświadczenia występują powtórzenia układów, to na podstawie wartości
estymatora czystego błędu (pure error) przeprowadzany jest test
adekwatności (lack of fit). Dostępne są liczne opcje standardowe służące
do opracowania wyników m.in. tablica wartości średnich, korelacje kolumn
macierzy planu (X), odwrotność macierzy X'X (macierz
wariancji/kowariancji estymatorów parametrów), wykres Pareto i wykres
prawdopodobieństwa normalnego estymatorów parametrów, wykres wartości
resztowych itp. Podobnie, jak w przypadku innych typów planów, program
umożliwia obliczenie (aproksymowanej) wartości wielkości wyjściowej dla
podanych przez użytkownika wartości wielkości wejściowych. Dostępne są liczne
opcje służące do graficznej prezentacji wyników doświadczenia dla mieszaniny
m.in. wykresy przekrojowe powierzchni odpowiedzi dla określonych przez
użytkownika mieszanin odniesienia (referencyjnych), przestrzenne i warstwicowe
wykresy trójkątne (triangular plots). Jeżeli w doświadczeniu występują
więcej niż trzy składniki, to dla wykresów przestrzennych i warstwicowych
wymagane jest wprowadzenie wartości użytkownika dla pozostałych składników.
Wszystkie opisane powyżej możliwości są także dostępne (pod nagłówkami Planowanie
doświadczeń, Analiza doświadczeń: Ogólne możliwości, Analiza resztowa i
przekształcenia, Optymalizacja jednej lub wielu wielkości wyjściowych)
w trakcie szczegółowej analizy wartości resztowych, oceny dopasowania modelu
oraz poszukiwania optymalnych wartości wielkości wejściowych dla jednej lub
wielu wielkości wyjściowych. Warto zwrócić uwagę, że w przypadku planów dla
mieszanin opcje profilu użyteczności odpowiedzi nie bazują na prostym
przekształceniu modelu mieszaniny do modelu powierzchni bez warunków
dodatkowych (co mogłoby prowadzić do błędnych wyników, takich jak np. optymalne
wartości wielkości wejściowych, które nie stanowią poprawnej mieszaniny);
zamiast tego wszystkie obliczenia przeprowadzane są bezpośrednio przy pomocy
modelu mieszaniny (wraz z warunkami ograniczającymi). W ten sposób, w trakcie
poszukiwania wartości optymalnych wielkości wejściowych dla zadanej funkcji
użyteczności jednej lub wielu wielkości wyjściowych można mieć pewność, że
przeszukiwany jest tylko ograniczony obszar badań mieszaniny, a uzyskane
wartości wielkości wejściowych spełniają ogólny warunek sumowalności mieszaniny
(sumy całkowitej).
Plany
dla ograniczonych powierzchni i mieszanin. Moduł Planowanie doświadczeń
zawiera procedury służące do obliczania wierzchołków i środków ciężkości dla
ograniczonych powierzchni i mieszanin zdefiniowanych poprzez ograniczenia
(warunki) liniowe. Użytkownik może wprowadzić ograniczenia górne i dolne oraz
nałożyć na wielkości wejściowe dodatkowe ograniczenia liniowe postaci A1*x1
+ ... + An*xn + A0 >= 0. Program następnie
oblicza wierzchołki i - ewentualnie - środki ciężkości dla ograniczonego
obszaru. Ograniczenia są przetwarzane sekwencyjnie, a w trakcie tej operacji
identyfikowane są ograniczenia zbędne. Dostępne są liczne dodatkowe opcje
służące do przeglądania charakterystyk ograniczonego obszaru. W przypadku
mieszanin użytkownik może przeglądać wierzchołki i środki ciężkości na
wykresach punktowych 3W i trójkątnych. Obliczana jest macierz korelacji
pomiędzy kolumnami macierzy planu (X), a także macierz odwrotna do
iloczynu X'X (czyli macierzy wariancji/kowariancji estymatorów
parametrów). Pozwala to na dokonanie oceny charakterystyki planu. Uzyskane
układy planu doświadczenia mogą być następnie wykorzystane w trakcie tworzenia
planu optymalnego, aby uzyskać plan doświadczenia z minimalną liczbą układów.
Plany D i A-optymalne. Program zawiera kilkanaście algorytmów służących
do tworzenia planów optymalnych. Użytkownik może wybrać kryterium optymalności D
(wyznacznik macierzy) lub A (ślad macierzy) oraz podać model dla
powierzchni i mieszanin. Lista punktów (układów) proponowanych do planu
doświadczenia może być wprowadzona ręcznie lub odczytana z pliku danych
programu STATISTICA (np. utworzonego wcześniej przy pomocy opcji
służących do obliczania wierzchołków i środków ciężkości dla ograniczonych
obszarów i mieszanin, zob. poprzedni akapit). Proponowane punkty (układy) mogą
zostać specjalnie zaznaczone w celu wymuszenia włączenia ich do końcowego planu
doświadczenia; w ten sposób użytkownik może ulepszać lub "naprawiać" już
zrealizowane doświadczenia. Program zawiera wszystkie powszechnie używane
algorytmy wyszukiwania zaprojektowane do tworzenia planów D- i A--optymalnych:
metodę sekwencyjną Dykstry, metodę wymiany prostej Wynna-Mitchella, metodę DETMAX
Mitchella (wymiana z wycieczką), metodę równoczesnej wymiany Fedorowa,
zmodyfikowaną metodę równoczesnej wymiany. Dla uzyskanego planu doświadczenia
program oblicza wyznacznik X'X oraz wartości kryteriów optymalności D, A,
oraz G . Użytkownik może przeglądać macierz korelacji pomiędzy kolumnami
macierzy planu (X), a także macierz odwrotną do iloczynu X'X (czyli
macierzy wariancji/kowariancji estymatorów parametrów). Ostateczny plan może
być przeglądany przy użyciu przestrzennych oraz trójkątnych wykresów punktowych
(dla mieszanin).
Alternatywne
procedury analizowania danych doświadczalnych. STATISTICA zawiera
bardzo wielką liczbę metod obliczeniowych do analizowania danych zebranych w
eksperymentach jak i do dopasowywania planów typu ANOVA/ANCOVA do ciągłych i
skategoryzowanych zmiennych. Konkretnie,
STATISTICA zawiera kompletną
implementację:
Ogólnych modeli liniowych (GLM) i
Ogólnych modeli regresji (GRM) (dostępne pod:
STATISTICA Zaawansowane modele liniowe i nieliniowe) z
doskonałymi procedurami budowy modeli (krokowych i najlepszego podzbioru
wielkości wejściowych),
Uogólnione modele liniowe (GLZ) (dostępne
pod: STATISTICA Zaawansowane modele liniowe i nieliniowe),
również zawierające projekty typu ANOVA, krokowe lub najlepszego podzbioru,
stanowiące alternatywę popularnych modeli liniowych najmniejszych kwadratów,
jak logitowy, wielomianowy logitowy, probitowy,
Ogólne modele analizy dyskryminacyjnej (GDA)
(dostępne pod: STATISTICA Wielowymiarowe techniki
eksploracyjne), zawierające projekty klasyfikacyjne typu
ANOVA/ANCOVA, krokowe lub najlepszego podzbioru; są też w GDA profile
użyteczności i metody optymalizacji odpowiedzi, pozwalające znaleźć kombinacje
zmiennych wejściowych, ich poziomów lub wartości, maksymalizujące
prawdopodobieństwa a posteriori zgodnej klasyfikacji, dla jednej lub wielu
kategorii wielkości wyjściowej,
Ogólne modele drzew klasyfikacyjnych i
regresyjnych (dostępne pod: STATISTICA
Data Mining) i Ogólne modele CHAID
(dostępne pod: STATISTICA Data Mining),
pozwalające ocenić efektywność planów typu ANOVA/ANCOVA przy budowie silnie
nieliniowych drzew, hierarchicznych drzew klasyfikacyjnych i regresyjnych.
Tak więc STATISTICA stosowana może być w badaniach projakościowych, w
sposób kreatywny i innowacyjny, nawet tam, gdzie wielkości wyjściowe są z
natury skategoryzowane albo gdzie wpływ wielkości wejściowych jest zdecydowanie
nieliniowy.