Identyfikacja trendu
Analiza wahań sezonowych
Prognoza 1 - model klasyczny
Prognoza 2 - model ze zmiennymi zero - jedynkowymi
Prognoza 3 - model autoregresyjny
Prognoza 4 - trendy jednoimiennnych miesięcy
Podsumowanie prognoz
Przebieg wykresu sugeruje, że tendencja rozwojowa zjawiska może mieć postać liniową lub wielomianu drugiego stopnia. Do pliku danych wprowadzamy dwie nowe zmienne oznaczające czas (numer kolejnego miesiąca okresu obserwacji) T oraz jego kwadrat T2. W module Regresja wieloraka podejmujemy próbę oszacowania trendu o postaci
Otrzymany rysunek po drobnej obróbce redakcyjnej ma postać:
| Powrót do spisu treści |
W badanym okresie najwięcej wyjazdów zanotowano w lipcu i sierpniu 1996 roku. Wielkości te odbiegają od "wzorca" sezonowości zaobserwowanego w trzech poprzednich latach. Ponieważ w kolejnym roku w tych miesiącach poziom wyjazdów był nieco mniejszy, zatem raczej jeszcze nie można sądzić, że obserwowane wahania mają charakter multiplikatywny. Przed analizą wahań sezonowych należy wyeliminować trend. Dokonamy tego na dwa sposoby - poprzez odejmowanie wartości trendu od szeregu empirycznego oraz poprzez wyrażenie w procentach stosunku wartości szeregu do teoretycznej wartości funkcji trendu. Zgodnie z tym utworzyliśmy dwie zmienne: ODCH_ADD (odchylenia od trendu przy założeniu sezonowości addytywnej otrzymane przez odejmowanie) i ODCH_MUL (odchylenia od trendu przy założeniu sezonowości multiplikatywnej otrzymane przez dzielenie).
Teraz zweryfikujemy hipotezę o istotności wahań sezonowych występujących w naszym szeregu czasowym. Zastosujemy w tym celu jednoczynnikową analizę wariancji (ANOVA). Test ten służy do weryfikowania hipotezy o równości wielu wartości przeciętnych. Przy analizie wahań sezonowych taka hipoteza głosi, że odchylenia od trendu są we wszystkich miesiącach, średnio rzecz biorąc, takie same, a hipoteza alternatywna, że przynajmniej jeden miesiąc różni się istotnie od innych. Przy stosowaniu ANOVA potrzebna jest zmienna wskazująca numer miesiąca, pozwalająca programowi znaleźć odchylenia od trendu we wszystkich styczniach, wszystkich lutych itd. Wprowadziliśmy tę zmienną do zbioru danych, nazywając ją NR_MIES.
Test analizy wariancji wymaga spełnienia dwóch założeń: badana zmienna powinna mieć w każdej grupie rozkład normalny, a wariancje w grupach powinny być takie same. Założenie normalności sprawdzimy przy pomocy testu Shapiro-Wilka. Jest on dostępny w module Podstawowe statystyki. W części Statystyki opisowe zaznaczamy opcję Test W Shapiro-Wilka i po naciśnięciu klawisza Tabele liczebności oprócz szeregu rozdzielczego otrzymujemy też wartość prawdopodobieństwa testowego w teście normalności. Wcześniej trzeba zdefiniować testowaną zmienną (ODCH_ADD). Przy pomocy klawisza Select cases ("wybierz przypadki") wybieramy kolejno poszczególne miesiące, wpisując v8=1 dla stycznia, potem v8=2 dla lutego, v8=3 dla marca itd. Wyniki, które otrzymujemy w ten sposób, przedstawia poniższa tabela:
Prawdopodobieństwa testowe w teście Shapiro-Wilka
"Wielkość" wahań sezonowych możemy ocenić przywołując Zestawienie średnich.
W związku z niespełnieniem założenia normalności dla wszystkich miesięcy istotność wahań sezonowych możemy sprawdzić jeszcze przy pomocy nieparametrycznego testu analizy wariancji. W module Stat. Nieparametryczne/Rozkłady mamy Test ANOVA rang Kruskala-Wallisa. Po jego zastosowaniu znajdujemy, że wartość prawdopodobieństwa wynosi tu 0,0000 co kolejny raz potwierdza istotność wahań sezonowych.
| Powrót do spisu treści |
Pierwszą prognozę zbudujemy przy wykorzystaniu modelu klasycznego, który zakłada, że szereg czasowy jest sumą pewnych składników - w naszym przypadku są to: trend, wahania sezonowe oraz wahania przypadkowe. Równanie obejmujące składniki nielosowe ma postać:
| Powrót do spisu treści |
Prognoza 2 - model ze zmiennymi zero-jedynkowymi
W tym podejściu model szeregu czasowego zawiera też trend i wahania sezonowe, lecz tym razem wahania sezonowe reprezentowane są przez zmienne zero-jedynkowe oznaczające poszczególne miesiące. Jeden z miesięcy musi reprezentować tzw. "poziom odniesienia" i powinien to być miesiąc, w którym wartość szeregu zazwyczaj najmniej odbiega od linii trendu. Wybiera się więc taki miesiąc, który ma najmniejszy składnik sezonowości (u nas jest to czerwiec). Zastosowanie procedury regresji krokowej daje możliwość wybrania tylko tych zmiennych zero-jedynkowych, które wskazują miesiące, w których zjawisko istotnie odchyla się od funkcji trendu. Obliczenia wykonujemy w module Regresja wielokrotna. Najpierw definiujemy zmienne. Zmienną zależną jest oczywiście zmienna WYJAZDY, a jako niezależne wprowadzamy dwie zmienne czasowe (T i T2) oraz dziesięć zmiennych zero-jedynkowych odpowiadających kolejnym miesiącom poza czerwcem. Estymujemy model i w Wynikach regresji wielokrotnej naciskamy przycisk Podsumowanie regresji. Otrzymujemy tabelę wartości ocen parametrów modelu i związanych z nimi wielkości. W kolumnie poziom p sprawdzamy, czy wszystkie wartości są mniejsze od przyjętego poziomu istotności α. Jeżeli w kolumnie tej są wartości większe od a, to z modelu usuwamy zmienną, której odpowiada największa wartość p. Procedurę te kontynuujemy, aż do momentu, gdy wszystkie zmienne objaśniające wykazują istotność statystyczną. W naszym przykładzie w ostatecznym modelu pozostała druga potęga zmiennej czasowej oraz zmienne zero-jedynkowe oznaczające styczeń, luty, marzec, kwiecień, lipiec i sierpień. Tworzymy nową zmienną PROGN_2 i otrzymane równanie wpisujemy do rubryki Długa nazwa zmiennej (formuła). Wygląda to następująco:
=2599,055+0,515*t2-649,649*v10-554,753*v11- 352,366*v12-289,448*v13+723,291*v15+ 1008,972*v16
Na wykresie model ten wygląda następująco:
| Powrót do spisu treści |
Prognoza 3 - model autoregresyjny
W modelu autoregresji zakłada się, że realizacje zjawiska zależą od wartości, jakie przyjęło ono w poprzednich okresach. Przy czym nie sięga się do wszystkich tych wartości, tak jak to ma miejsce przy wyrównywaniu wykładniczym, lecz tylko do wybranych momentów z przeszłości. Do oszacowania modelu autoregresyjnego wykorzystamy znów moduł Regresji wielokrotnej. Wcześniej jednak zdefiniujemy tzw. zmienne opóźnione, podające wartości "miesiąc temu", "dwa miesiące temu", "trzy miesiące temu" oraz "przed rokiem". Ta ostatnia zmienna ma być pomocna w uchwyceniu efektu wahań sezonowych. Zmienne te utworzyliśmy przy wykorzystaniu przycisku Zmienne z paska poleceń i opcji Przesuń (opóźnij) i nazwaliśmy je WYJ_1, WYJ_2, WYJ_3, WYJ_12. Wstawiamy je do modelu jako potencjalne zmienne objaśniające i, kolejno eliminując zmienne nieistotne, znajdujemy ostateczny model autoregresyjny, który sięga pamięcią tylko do miesiąca poprzedniego oraz rok wstecz. Model ma postać:
| Powrót do spisu treści |
Prognoza 4 - trendy jednoimiennych miesięcy
Możemy rozsądnie spodziewać się, że jeżeli rozważymy kształtowanie się badanego zjawiska w miesiącach o tej samej nazwie, to przy założeniu sezonowości addytywnej powinniśmy się spodziewać trendu o takiej samej postaci analitycznej, jak w całym szeregu w naszym przykładzie. Powinien to być model zawierający wyraz wolny i składową ze zmienną oznaczającą numer roku, czyli model o postaci:
| Powrót do spisu treści |
Niewątpliwie interesujące jest porównanie czterech prognoz uzyskanych różnymi metodami.