Bez sezonowości, bez trendu. Ten model szeregu czasowego, jest równoważny modelowi prostego wyrównywania wykładniczego. Zauważmy, że domyślnie, pierwsza wyrównana wartość zostanie obliczona w oparciu o początkową wartość S0 równą ogólnej średniej szeregu.
Bez sezonowości, trend gasnący.
W tym modelu szeregu czasowego, prognozy prostego wyrównywania wykładniczego są
"wzmocnione" przez składnik trendu gasnącego (niezależnie wyrównywanego przy pomocy parametrów
dla trendu i
dla efektu
gasnącego). Na przykład załóżmy, że chcielibyśmy prognozować z miesiąca na miesiąc procent gospodarstw domowych, które
posiadają określone urządzenie elektroniczne (np. kamerę wideo). Co roku proporcja gospodarstw domowych posiadających
kamerę rośnie, jednak trend ten będzie wygasał (tzn. trend rosnący będzie wolno zanikał) w czasie w wyniku nasycenia
rynku.
Do obliczenia wyrównanej wartości (prognozy) dla pierwszej obserwacji szeregu, konieczne są obie oceny S0 i T0 (trend początkowy). Domyślnie wartości te obliczane są jako:
T0 = (1/
)*(Xn-X1)/(N-1),
gdzie
N jest liczbą obserwacji w szeregu,
jest parametrem wyrównywania dla trendu gasnącego,
oraz S0 = X1-T0/2.
Bez sezonowości, trend liniowy (Metoda Holta dwóch
parametrów).
W tym modelu szeregu czasowego, prognozy prostego wyrównywania wykładniczego są
"wzmocnione" przez składnik trendu liniowego, który jest wyrównywany niezależnie przy pomocy parametru
(gamma) (zob. rozważania na temat parametrów wyrównywania trendu). Model ten określa się także jako metodę Holta
dwóch parametrów. Model ten mógłby na przykład być odpowiedni, gdy obliczamy prognozy zapasów części zamiennych.
Popyt na określone części zamienne może w czasie wolno rosnąć lub maleć (składnik trendu), a trend ten może się wolno
zmieniać, gdy np. rozmaite urządzenia zestarzeją się lub wyjdą z użytku, co wpłynie na zmianę trendu w popycie na
części zamienne dla tych urządzeń.
Aby obliczyć wyrównaną wartość (prognozę) dla pierwszej obserwacji w szeregu, konieczne są obie oceny S0 i T0 (trend początkowy). Domyślnie, wartości te oblicza się jako:
T0 = (Xn-X1)/(N-1),
gdzie
N jest długością szeregu,
oraz S0 = X1-T0/2
Bez sezonowości, trend wykładniczy.
W tym modelu szeregu czasowego, prognozy prostego wyrównywania wykładniczego są
"wzmocnione" przez składnik trendu wykładniczego (wyrównywany przy pomocy parametru
). Na przykład załóżmy, że chcielibyśmy przewidzieć ogólne miesięczne koszty
napraw urządzenia produkcyjnego. Koszt ten mógłby przejawiać trend wykładniczy, to znaczy z roku na rok koszty napraw
mogłyby rosnąć o określony procent lub czynnik, powodując stopniowy wykładniczy wzrost bezwzględnych kosztów napraw.
Aby obliczyć wyrównaną wartość (prognozę) dla pierwszej obserwacji szeregu, konieczne są obie oceny S0 i T0 (trend początkowy). Domyślnie wartości te oblicza się jako:
T0 = (X2/X1)
oraz
S0 = X1/T01/2.
Bezwładność (w analizie korespondencji). Termin bezwładność w analizie korespondencji jest używany przez analogię do fizycznego pojęcia "momentu bezwładności", czyli sumy mas pomnożonych przez kwadrat odległości od osi obrotu (np. Greenacre, 1984, str. 35). Bezwładność definiuje się tu jako całkowite chi-kwadrat Pearsona dla dwudzielczej tabeli liczności, podzielone przez sumę wszystkich obserwacji w tabeli.
Błąd I rodzaju (alfa). Błąd polegający na odrzuceniu hipotezy zerowej, podczas gdy jest ona w rzeczywistości prawdziwa.
Więcej informacji na ten temat można znaleźć w rozdziale Analiza mocy testów.
Błąd lub trafność klasyfikacji w próbie uczącej i testowej. Miara na ile dobrze uzyskany model odtwarza wartości danych w próbie uczącej i testowej.
Błąd RMS, pierwiastek z błędu średniokwadratowego (RMS - Root Mean Square). Błąd wyznaczany poprzez sumowanie kwadratów błędów indywidualnych, podzielenie uzyskanej sumy przez liczbę uwzględnionych wartości i wyznaczenie pierwiastka kwadratowego z uzyskanego ilorazu. Błąd RMS stanowi pojedynczą wartość opisującą błąd sumaryczny. Zob. Sieci neuronowe.
Błąd standardowy. Błąd standardowy (ang. standard error, termin ten został po raz pierwszy użyty przez Yule'a, 1897) jest odchyleniem standardowym dla rozkładu średniej (lub innej statystyki) z próby. Błąd standardowy jest obliczany ze wzoru:
Błąd standardowy = pierwiastek(s2/n)
gdzie:
s2 oznacza wariancję z próby
n oznacza liczność próby.
Błąd standardowy proporcji (frakcji).
Błąd standardowy proporcji jest odchyleniem standardowym dla rozkładu proporcji (frakcji) z próby. Jeśli proporcja w
populacji wynosi
, a liczność próby N, to błąd standardowy proporcji
wynosi:
sp = (p(1-p)/N)1/2
Więcej informacji znajdziemy w rozdziale Analiza mocy testów.
Błąd standardowy średniej. Błąd standardowy średniej (ang. standard error termin ten został po raz pierwszy użyty przez Yule'a, 1897) jest odchyleniem standardowym dla rozkładu średniej z próby o liczności n wybieranej z populacji. Błąd standardowy średniej zależy od wariancji w populacji (sigma) i liczności próby (n) wg wzoru:
= (
2/n)1/2
gdzie:
2 jest wariancją w populacji
n jest licznością próby.
Ponieważ wariancja w populacji zazwyczaj nie jest znana, najlepszym estymatorem błędu standardowego średniej jest:
= (s2/n)1/2
gdzie
s2 jest wariancją z próby
(wybranym przez nas estymatorem wariancji)
n jest licznością próby.
Patrz także, Statystyki opisowe - Wprowadzenie.
Brak dopasowania. Dla niektórych układów zawierających powtórzenia w obrębie poziomów predyktorów, resztowa suma kwadratów może być podzielona na składniki odnoszące się do testowanych hipotez. Resztowe sumy kwadratów można mianowicie podzielić na składnik braku dopasowania i czysty błąd. Wymaga to określenia pewnej części resztowej sumy kwadratów, która może być prognozowana poprzez włączenie dodatkowych źródeł zmienności dla predyktorów jakościowych występujących w modelu (np. wyrażeń wielomianowych lub interakcji) oraz część sumy kwadratów, której nie można prognozować za pomocą jakichkolwiek dodatkowych źródeł (tzn. sumy kwadratów dla czystego błędu). Następnie można przeprowadzić test braku dopasowania, wykorzystując w charakterze wyrażenia opisującego błąd średni kwadrat dla czystego błędu. Dzięki temu uzyskujemy bardziej wrażliwy test dopasowania modelu, ponieważ z wyrażenia opisującego błąd usuwane są efekty dodatkowych wyrażeń wyższego rzędu.
Więcej informacji można znaleźć także pod hasłami czysty błąd, macierz eksperymentu oraz w sekcjach Ogólne modele liniowe (GLM), Ogólne modele regresji (GRM) lub Planowanie doświadczeń.
Brakujące wartości. Są to nieznane wartości zmiennych w zbiorach danych. Mimo iż przypadki zawierające brakujące dane są niekompletne, to jednak mogą być wykorzystywane w analizie danych. Istnieją różne metody służące do zastępowania brakujących danych (np. zastępowanie średnią, różne rodzaje interpolacji i ekstrapolacji). Można również zastosować usuwanie brakujących danych parami i usuwanie brakujących danych przypadkami). Zestawienie wad i zalet różnych sposobów postępowania z brakującymi danymi, znajduje się w części Usuwanie brakujących danych parami a zastępowanie średnią oraz Usuwanie brakujących danych przypadkami lub parami w rozdziale Statystyki podstawowe.
