Jak pokochać statystykę czyli STATISTICA do poduszki

 

 


Jak pokochać statystykę czyli STATISTICA do poduszkiNakład wyczerpany 

Autor: Tomasz Zieliński
Wydawca: StatSoft Polska
Wydanie: Kraków, 1999
ISBN: 83-904735-7-7
Liczba stron: 256

Wstęp, czyli po co czytać tę książkę

Szanowna Czytelniczko/Szanowny Czytelniku!

Wstęp do każdej książki przedstawia ją czytelnikowi jako lekturę godną czytania i inną (rzecz jasna lepszą) od wszystkich podobnych książek, ponieważ zawiera ona:

  • ujęcie tematu odmienne od prezentowanego gdzie indziej oraz
  • opis wykorzystania niewiarygodnie przyjaznych narzędzi.

Jest rzeczą oczywistą, że w tym wypadku nie są to czcze obietnice, ponieważ sprawy mają się tak właśnie. Przedstawiana Ci dalej praca jest niemal zupełnym novum ze względu na trzy genialnie proste założenia leżące u jej podstaw:

  • nie każdy chce zgłębiać statystykę i poznawać wszystkie jej niuanse metodologiczne,
  • jednakże bardzo wielu chciałoby z niej korzystać,
  • gdyby nie to, że nie bardzo wiedzą, jak to robić.

Wobec tego nasuwa się pytanie, dlaczego nie można stworzyć czegoś dla tej właśnie większości, czegoś co byłoby proste do zrozumienia, a jednocześnie pozwalało wykorzystywać w praktyce bogactwo opracowanych metod statystycznych wielu ludziom – zarówno teoretykom, dla których poprawna analiza posiadanego materiału empirycznego jest najważniejszą częścią pracy, jak i praktykom, wykorzystującym ogromne ilości rozmaitych danych w codziennej działalności. Odpowiedź jest prosta – metody obliczeniowe statystyki są na ogół dość nużące, natomiast interpretacja wyników nastręcza zazwyczaj wielu ludziom takie kłopoty, że całkowicie zniechęca ich to do podejmowania jakichkolwiek kroków na niwie statystycznej. Efekt tego jest jeden: generalny rozbrat ze statystyką i wszystkimi korzyściami, potencjalnie z niej płynącymi. Istniejące w tym zakresie podręczniki nie zaspokajają potrzeb, ponieważ są zwykle zbyt specjalistyczne, skoncentrowane na technikach obliczeniowych i wymagające pewnej wiedzy matematycznej, nie dają też zrozumienia stosowanych metod.

Ponieważ wiesz już, czym prezentowana książka nie jest, przeto łatwo będzie Ci zrozumieć, czym ta książka jest – w zamiarze autora. Ma ona pozwolić zrozumieć statystykę i umożliwić jej wykorzystywanie – w znacznie szerszym zakresie niż tylko policzenie średniej czy też wartości. Chciałbym także pokazać niebezpieczeństwa wynikające ze złego stosowania statystyki oraz sposoby ich unikania. Wreszcie – co nie jest najmniej ważne – zaprezentować prosty sposób przerzucenia wszystkich problemów obliczeniowych na głupie komputery (niech wreszcie robią coś pożytecznego). W ten sposób w jednej pracy rozwiązane zostaną wszystkie trzy problemy, które wstępnie określiłem jako odstraszające od szerszego stosowania statystyki.

Na naturalne (wobec powyższego) pytanie: „O czym więc w istocie jest dzieło, które autor tak rozwlekle zachwala?” odpowiadam: „Jest to przedstawienie podstawowych metod statystyki, sposobów ich wykorzystania oraz pakietu obliczeniowego realizującego wszystkie obliczenia oraz pozwalającego na graficzną prezentację zarówno danych, jak i wyników”. Pakietem tym jest STATISTICA. Wiedza zawarta na dalszych stronach pozwoli Ci w szerokim zakresie korzystać z możliwości pakietu; zobaczysz, że statystyka może być lekka, łatwa i przyjemna. Za jedno tylko nie mogę brać odpowiedzialności – może się zdarzyć, że po zapoznaniu się z treścią książki i wykonaniu kilku testów statystycznych zostaniesz fanatykiem. Wtedy zaproszenie autora na lampkę wina będzie w zupełności wystarczającą rekompensatą za włożony w napisanie tych słów wysiłek.

Zakładam, że potrafisz posługiwać się programem okienkowym, takim jak WINDOWS 3.11 lub WINDOWS 95, to znaczy że pojęcie przycisku, menu rozwijanego, opcji czy wreszcie zasady wykorzystania myszy nie są Ci obce. W przeciwnym wypadku możesz mieć drobne kłopoty z wykorzystaniem programu – natomiast statystyczna część książki jest dla Ciebie w dalszym ciągu dostępna.

Aha, jeśli gdziekolwiek w tekście spotkasz taki zapis będzie to oznaczało fragment odnoszący się bezpośrednio do pracy z pakietem, to znaczy opis czynności koniecznych do uzyskania określonego wyniku w pakiecie STATISTICA. Zatem polecenia zawarte w takich fragmentach wymagają dokładnego wykonania, gdyż prowadzą do rezultatu zgodnego z zamierzeniem autora.
Zalecam wielokrotnie wykonanie tych samych czynności z różnymi opcjami, gdyż zaznajomić się z pakietem można najłatwiej aktywnie sprawdzając rozmaite możliwości. ta książka nie zawiera ani pełnego, ani systematycznego wykładu zasad jego wykorzystania; taki wykład zawiera np. dokumentacja dołączona do systemu. Zawarte dalej treści odpowiadają podstawowym procedurom i mają za zadanie zachęcić Cię do częstego stosowania metod statystycznych w Twojej codziennej działalności. Jeśli kiedyś zdarzy Ci się westchnąć „Żebym to ja znał lepiej statystykę” to uznam, iż moje pisanie miało sens i będę się cieszył z tego. a na razie – do dzieła.

[…]

Tak więc od tej chwili Twoimi towarzyszami stają się statystyka i STATISTICA. Za ewentualne skutki odpowiadasz wyłącznie Ty sam.


Spis treści:

Wstęp, czyli po co czytać tę książkę

Rozdział I. Prawie wszystko, co chciałbyś wiedzieć o statystyce, a o co do tej pory wstydziłeś się zapytać

1. Typy cech stosowanych w statystyce, czyli czym różni się płaca od wykształcenia i płci
I. Próba i populacja (nie mylić)
II. Podstawowe typy cech – podział prosty, acz poręczny
III. Ale my chcemy korzystać z pakietu STATISTICA, czyli witaj w nowym programie

A. Kilka uwag o ekranie – byś później nie tracił czasu na nie

B. Wprowadzanie danych do arkusza

C. Opis zmiennych – tworzenie kulturalnego wyglądu komórek

D. Przypadki – nic nowego pod słońcem

2. Rozkład cechy i jego charakterystyki

I. Podstawowe charakterystyki cech przedziałowych – miłe złego początki

II. Wskaźniki dotyczące cech typu porządkowego i nominalnego – to, czego nie ma

3. po co nam to wszystko?
Rozdział II. Porównywanie cech w populacji i porównywanie populacji, czyli kilka trudniejszych sztuczek

1. Metody stosowane w statystyce – czuj duch, bo idą kłopoty

I. Ocena wartości – estymacja punktowa i przedziałowa

II. Idea stosowania testów statystycznych i ich podstawowe grupy

A. Testy nieparametryczne, bardziej użyteczne, choć mniej dokładne

B. Testy parametryczne – wręcz przeciwnie

2. Błędy w zakresie wnioskowania statystycznego popełniane najczęściej w czasie badań – czego nie należy robić

I. Niewłaściwy dobór próby – i praca idzie na marne

II. Niewłaściwie zastosowane testy – efekt jak wyżej

III. Błędy metodologiczne – tu najłatwiej zbłądzić

3. Rola ilustracji graficznej danych – co należy robić jak najczęściej

4. Dobór próby, czyli najprostsze i najtrudniejsze zarazem

I. Metody doboru próby

A. Losowy dobór próby – tak robi się najczęściej

B. Dobór celowy próby

II. Grupa kontrolna, czyli sprawdzanie wyników

III. Określanie liczebności próby
Rozdział III. Niezależność cech, czyli niebezpieczne związki

1. Porównywanie cech przedziałowych, czyli rzecz dobrze znana

I. Korelacja nasza codzienna, czyli liniowa

II. Regresja – nie myl z regresem

III. Regresja krzywoliniowa – niestety też bywa

IV. Związki między wieloma zmiennymi – korelacja cząstkowa i wieloraka, czyli dodatkowe kłopoty

2. Porównywanie cech porządkowych – już gorzej

I. Porównywanie rang – przypadek rzadszy

II. Porównywanie danych w skategoryzowanych tabelach – przypadek częstszy

3. Porównywanie cech nominalnych – i tu dopiero problemy
Rozdział IV. Analiza zjawisk dynamicznych, czyli kłopoty z upływem czasu

1. Analiza trendu – jak się potoczą sprawy

2. Analiza sezonowości, czyli wszystko się powtarza
Rozdział V. Analiza wariancji – ANOVA jednoczynnikowa

1. Analiza wariancji jako uogólnienie testu różnic między średnimi

2. Analiza wariancji w klasyfikacji pojedynczej, czyli prawie to samo

3. Analiza wariancji w klasyfikacji podwójnej, a więc już coś nowego
Zakończenie
Suplement – opis procedur

1. Estymacja

I. Estymatory punktowe

A. Wartość średnia (Średnia z próby)

B. Mediana

C. Wartość modalna (moda)

D. Odchylenie standardowe

E. Współczynnik skośności

F. Współczynnik korelacji

G. Współczynnik korelacji cząstkowej

H. Współczynnik korelacji wielorakiej

I. Współczynniki regresji liniowej

J. Współczynniki regresji krzywoliniowej

K. Współczynnik korelacji rangowej Spearmana

L. Współczynnik Gamma

Ł. Współczynnik Yatesa

M. Współczynniki: kontyngencji, V Cramera

II. Estymatory przedziałowe

A. Przedział ufności dla średniej

B. Przedział ufności dla odchylenia standardowego

C. Przedział ufności dla współczynników korelacji

D. Przedziały ufności dla współczynników regresji

E. Przedział ufności dla proporcji (frakcji)

2. Testy statystyczne

I. Testy nieparametryczne

A. Test chi-kwadrat zależności dla tablic wielopolowych

B. Test normalności rozkładu

C. Test zgodności rozkładów

D. Test znaków

E. Test serii

F. Test kolejności par Wilcoxona

II. Testy parametryczne

A. Test dla średniej

B. Test dla różnic między średnimi z dwóch prób

C. Test różnicy między średnimi z dwóch prób skorelowanych

D. Test różnic między proporcjami (frakcjami)

Indeks rzeczowy