© Copyright StatSoft, Inc., 1984-2024
Przeszukaj Internetowy Podręcznik Statystyki
Skalowanie wielowymiarowe


Ogólny cel

Skalowanie wielowymiarowe (SWW) może być rozważane jako alternatywa analizy czynnikowej (patrz Analiza czynnikowa ). Ogólnie, celem tej analizy jest wykrycie sensownych ukrytych wymiarów, które pozwalają badaczowi wyjaśnić obserwowane podobieństwa lub odmienności (odległości) między badanymi obiektami. W analizie czynnikowej podobieństwa między obiektami (np. zmiennymi) są wyrażone w postaci macierzy korelacji. Przy pomocy SWW, oprócz macierzy korelacji, można analizować dowolny rodzaj macierzy podobieństwa lub odmienności.

Logika SWW

Logikę analizy SWW zilustruje następujący przykład. Wyobraźmy sobie, że wzięliśmy macierz odległości między głównymi miastami na mapie USA. Następnie analizujemy tę macierz, zastrzegając, że chcemy odtworzyć odległości w oparciu o dwa wymiary. Jako wynik analizy SWW najprawdopodobniej otrzymalibyśmy dwuwymiarową reprezentację położenia miast, to znaczy otrzymalibyśmy dwuwymiarową mapę.

W ogólności, SWW zmierza do uporządkowania "obiektów" (w naszym przykładzie głównych miast) w przestrzeni o danej liczbie wymiarów (w naszym przykładzie dwuwymiarowej), tak aby odtworzyć zaobserwowane odległości. W wyniku tego możemy "wyjaśnić" odległości w kategoriach ukrytych wymiarów; w naszym przykładzie, mogliśmy wyjaśnić odległości w kategoriach dwóch wymiarów geograficznych: północ/południe i wschód/zachód.

Orientacja osi. Tak jak w analizie czynnikowej, rzeczywista orientacja osi ostatecznego rozwiązania jest arbitralna. Wracając do naszego przykładu, mogliśmy obrócić mapę w dowolny sposób, a odległości między miastami pozostałyby takie same. Zatem ostateczna orientacja osi na płaszczyźnie lub w przestrzeni jest przede wszystkim wynikiem subiektywnej decyzji badacza, który wybierze taką orientację, która może być najłatwiej wyjaśniona. I znów wracając do przykładu, mogliśmy byli wybrać inną orientację osi niż północ/południe i wschód/zachód; jednak taka orientacja jest najbardziej wygodna ponieważ "ma największy sens" (tzn. łatwo poddaje się interpretacji).

Indeks

Podejście obliczeniowe

Skalowanie wielowymiarowe jest nie tyle ścisłą procedurą, ile raczej sposobem "zmiany rozmieszczenia" obiektów w sposób na tyle efektywny, aby otrzymać konfigurację, która jest najlepszym przybliżeniem obserwowanych odległości. Program faktycznie przemieszcza obiekty w przestrzeni zdefiniowanej przez pożądaną liczbę wymiarów i sprawdza, na ile ta nowa konfiguracja odtwarza odległości między obiektami. Mówiąc językiem technicznym, program stosuje algorytm minimalizacji funkcji, który ocenia różne konfiguracje, zmierzając do maksymalizacji dobroci dopasowania (lub minimalizacji "braku dopasowania").

Miary dobroci dopasowania: Stress. Najpowszechniejszą miarą stosowaną do szacowania, na ile dobrze (lub źle) dana konfiguracja odtwarza obserwowaną macierz odległości jest stress. Surową wartość stressu Phi dla danej konfiguracji definiuje się jako:

Phi = [dij - f (ij)]2

We wzorze tym dij oznacza odtworzone odległości przy danej liczbie wymiarów, a ij (deltaij) oznacza dane wejściowe (tzn. odległości obserwowane). Wyrażenie f (ij) wskazuje na niemetryczną transformację monotoniczną obserwowanych danych wejściowych (odległości). Zatem program będzie zmierzał do odtworzenia ogólnego porządku rangowego odległości między analizowanymi obiektami.

Istnieje kilka podobnych pokrewnych miar, które są powszechnie stosowane; jednak większość z nich sprowadza się do obliczenia sumy kwadratów odchyleń obserwowanych odległości (lub pewnej transformacji monotonicznej tych odległości) od odległości odtworzonych. Zatem im mniejsza wartość stressu, tym lepsze dopasowanie macierzy odległości odtworzonych do macierzy odległości obserwowanych.

Diagram Sheparda. Można wykreślić odtworzone odległości dla danej liczby wymiarów względem obserwowanych danych wejściowych (odległości). Taki wykres rozrzutu jest znany jako diagram Sheparda . Wykres ten przedstawia odtworzone odległości wykreślone na osi pionowej (Y) względem pierwotnych podobieństw wykreślonych na osi poziomej (X) (stąd, generalnie ujemne nachylenie). Wykres pokazuje także funkcję krokową. Linia ta przedstawia tak zwane wartości D z daszkiem, to znaczy wynik transformacji monotonicznej f() danych wejściowych. Jeśli wszystkie odtworzone odległości znajdowałyby się na linii krokowej, to porządek rangowy odległości (lub podobieństw) byłby dokładnie odtworzony przez odpowiednie rozwiązanie (model wymiarowy). Odchylenia od linii krokowej wskazują na brak dopasowania.

Indeks

Problem liczby wymiarów

Jeśli użytkownik zna analizę czynnikową, kwestia ta będzie całkiem jasna. Jeśli nie, to może przeczytać rozdział Analiza czynnikowa ; nie jest to jednak konieczne, aby zrozumieć poniższe rozważania. Ogólnie, im więcej wymiarów zastosujemy do odtworzenia macierzy odległości, tym lepsze będzie dopasowanie odtworzonej macierzy do macierzy obserwowanej (tzn. mniejszy będzie stress). Faktycznie, jeśli zastosujemy tyle wymiarów, ile jest zmiennych, to będziemy mogli dokładnie odtworzyć macierz wartości obserwowanych. Oczywiście naszym celem jest redukcja obserwowanej złożoności, to znaczy wyjaśnienie macierzy odległości przy pomocy mniejszej liczby ukrytych wymiarów. Wracając do przykładu odległości między miastami, mając dwuwymiarową mapę łatwiej nam przedstawić położenie i łatwiej poruszać się między miastami, niż gdybyśmy polegali tylko na macierzy odległości.

Źródła niedopasowania. Zastanówmy się przez chwilę, dlaczego mniej czynników może stanowić gorszą reprezentację macierzy odległości niż więcej czynników. Wyobraźmy sobie trzy miasta A, B i C oraz trzy miasta D, E i F; poniżej znajdują się wzajemne odległości tych miast.

 ABC  DEF
A
B
C
0
90
90
 
0
90
 
 
0
D
E
F
0
90
180
 
0
90
 
 
0

W pierwszej macierzy wszystkie miasta znajdują się dokładnie o 90 mil od siebie; w drugiej macierzy miasta D i F znajdują się w odległości 180 mil od siebie. Czy teraz możemy umieścić te trzy miasta (obiekty) w jednym wymiarze (na linii)? Rzeczywiście, możemy uporządkować miasta D, E i F w jednym wymiarze:

D---90 mil---E---90 mil---F

Miasto D znajduje się 90 mil od E, a E znajduje się 90 mil od F; zatem, D znajduje się 90+90=180 mil od F. Jeśli spróbujemy to samo uczynić z miastami A, B i C przekonamy się, że nie ma sposobu na rozmieszczenie tych trzech miast na jednej linii tak, aby odtworzyć odległości. Jednak możemy rozmieścić te miasta w dwóch wymiarach na kształt trójkąta:

A
90 mil 90 mil
B90 milC

Rozmieszczając te trzy miasta w ten sposób możemy dokładnie odtworzyć odległości między nimi. Nie wchodząc w szczegóły, ten krótki przykład ilustruje, w jaki sposób dana macierz odległości implikuje konkretną liczbę wymiarów. Oczywiście, "rzeczywiste" dane nigdy nie są tak "klarowne" i zawierają wiele szumów, to znaczy losowej zmienności, która przyczynia się do powstawania różnic między macierzą odtwarzaną i obserwowaną.

Test osypiska. Prosty sposób rozstrzygnięcia tego, ile zastosować wymiarów polega na wykreśleniu wartości stressu względem różnych liczb wymiarów (wykres osypiska). Test ten został najpierw zaproponowany przez Cattella (1966) w kontekście problemu liczby czynników w analizie czynnikowej (patrz Analiza czynnikowa ); Kruskal i Wish (1978; str. 53-60) rozważali zastosowanie tego wykresu w SWW.

Cattell sugerował znajdywanie na wykresie miejsca, w którym wartości stressów (wartości własne w analizie czynnikowej) przestają wyraźnie maleć i formują linię zbliżoną do poziomej. Na prawo od tego punktu odnajdujemy przypuszczalnie tylko "osypisko czynnikowe" -- "osypisko" jest terminem geograficznym odnoszącym się do gruzu, który zbiera się w dolnej części urwiska skalnego.

Możliwość interpretacji konfiguracji. Drugim kryterium pomagającym zdecydować, ile wymiarów należy poddać interpretacji, jest przejrzystość ostatecznej konfiguracji. Czasami, tak jak w naszym przykładzie, odległości między miastami, otrzymane wymiary są łatwe do interpretacji. Kiedy indziej natomiast, punkty na wykresie tworzą rodzaj "losowej chmury" i nie ma oczywistego i prostego sposobu zinterpretowania wymiarów. W tym drugim przypadku należy uwzględnić więcej lub mniej wymiarów i badać otrzymane końcowe konfiguracje. Często wyłaniają się rozwiązania łatwiejsze do interpretacji. Jeśli jednak punkty danych na wykresie nie formują żadnego czytelnego wzoru, a na wykresie stressu nie widać żadnego czytelnego "załamania", to dane stanowią najprawdopodobniej przypadkowy "szum".

Indeks

Interpretacja wymiarów

Interpretacja wymiarów jest zazwyczaj ostatnim krokiem analizy. Jak wspomniano wcześniej, rzeczywiste orientacje osi w skalowaniu wielowymiarowym są ustalane arbitralnie i mogą być obracane w dowolnym kierunku. Pierwszy etap polega na utworzeniu wykresów rozrzutu obiektów na różnych dwuwymiarowych płaszczyznach.

Trójwymiarowe rozwiązania także mogą zostać przedstawione graficznie, jednak ich interpretacja jest nieco bardziej złożona.

Oprócz "sensownych wymiarów" należy także poszukać skupień punktów lub szczególnych wzorów i konfiguracji (takich jak kółka, rozgałęzienia itd.). Szczegółowe rozważania na temat interpretacji ostatecznych konfiguracji zawierają prace: Borga i Lingoesa (1987), Borga i Shye (w druku) lub Guttmana (1968).

Zastosowanie technik regresji wielokrotnej. Analityczny sposób interpretacji wymiarów (opisany przez Kruskala i Wisha, 1978) polega na zastosowaniu technik regresji wielokrotnej w celu wyliczenia regresji pomiędzy kilkoma znaczącymi zmiennymi a współrzędnymi dla różnych wymiarów. Zauważmy, że można to łatwo zrobić przy pomocy regresji wielorakiej .

Indeks

Zastosowania

Zaleta skalowania wielowymiarowego polega na tym, że możemy analizować dowolny rodzaj macierzy odległości lub podobieństwa. Podobieństwa te mogą reprezentować oceny podobieństwa obiektów dokonane przez respondentów, procentową zgodność między sędziami, liczbę przypadków, gdy badany nie umiał rozróżnić bodźców itd. Na przykład, metody SWW były bardzo popularne w badaniach psychologicznych nad percepcją, gdzie analizowano podobieństwa między deskryptorami cech w celu odkrycia ukrytej wymiarowości percepcji cech (patrz, na przykład Rosenberg, 1977). Są także bardzo popularne w badaniach marketingowych, stosowane w celu wykrycia liczby i natury wymiarów kryjących się za postrzeganiem różnych marek lub produktów (szczegółowe opisy różnych przykładów znajdują się, na przykład, w pracy Greena i Carmone'a, 1970).

Mówiąc ogólnie, metody SWW pozwalają badaczowi zadawać względnie neutralne pytania ("na ile marka A jest podobna do marki B") i wyprowadzać z tych pytań podstawowe wymiary bez zdradzania respondentom rzeczywistych intencji badacza.

Indeks

Skalowanie wielowymiarowe a analiza czynnikowa

Chociaż istnieją podobieństwa w problemach badawczych, do których mogą być stosowane obie te procedury, SWW i analiza czynnikowa to zasadniczo różne metody. Analiza czynnikowa wymaga, aby dane miały wielowymiarowy rozkład normalny, a związki były liniowe. SWW nie narzuca takich ograniczeń. SWW może być stosowane pod warunkiem, że porządek rangowy odległości (lub podobieństw) w macierzy jest sensowny. Mówiąc o różnicach, analiza czynnikowa zmierza do wyodrębnienia większej liczby czynników (wymiarów) niż SWW; SWW często dostarcza bardziej czytelnych, łatwiejszych do interpretacji rozwiązań. Najważniejsze jednak jest to, że SWW może być stosowane do dowolnego typu odległości lub podobieństw, podczas gdy analiza czynnikowa wymaga, abyśmy najpierw obliczyli macierz korelacji. SWW może być oparte na bezpośrednim oszacowaniu przez osobników podobieństw między bodźcami, podczas gdy analiza czynnikowa wymaga, aby osobnicy ocenili te bodźce przy pomocy pewnej listy atrybutów (dla których wykonuje się analizę czynnikową).

Podsumowując, skalowanie wielowymiarowe może być stosowane w przypadku wielu różnych projektów badawczych, ponieważ istnieje wiele sposobów otrzymania miar odległości (inne przykłady znajdziemy na początku rozdziału).

Indeks






© Copyright StatSoft, Inc., 1984-2024
STATISTICA is a trademark of StatSoft, Inc.