ANALIZA WYNIKÓW WYBORÓW DO SEJMU dnia 9 PAŹDZIERNIKA 2011 r.

Poniżej prezentujemy analizę wyników ostatnich wyborów do Sejmu wykonaną przy użyciu narzędzi dostępnych w programie STATISTICA. Wszystkie obliczenia przeprowadzono wykorzystując tylko wyniki opublikowane przez Państwową Komisję Wyborczą i dostępne na jej stronie internetowej. Poniżej przedstawiamy fragment pliku danych użytego w analizach.


Tabela danych ma 41 wierszy – tyle, ile było okręgów wyborczych. Kolumny to procent głosów oddanych na dany komitet wyborczy oraz zmienne informujące o frekwencji i procencie głosów nieważnych.

SCENA POLITYCZNA

Do analizy sceny politycznej wykorzystano skalowanie wielowymiarowe. Komitety wyborcze mogą być rozpatrywane jako punkty w przestrzeni okręgów wyborczych lub jako cechy charakteryzujące te okręgi. Pierwszym krokiem analizy jest wyznaczenie macierzy korelacji komitetów.


Współczynniki korelacji mogą być traktowane jako pewnego rodzaju miary podobieństwa między ugrupowaniami – podobieństwa ocenionego przez wyborców. Jest to oczywiście wnioskowanie pośrednie, bo każdy mógł głosować tylko na listę jednego komitetu wyborczego. Metoda skalowania wielowymiarowego w sposób iteracyjny układa punkty-komitety na płaszczyźnie, aby te widoczne odległości jak najlepiej oddawały informacje zawarte w macierzy korelacji, gdzie istotna korelacja ujemna oznacza, że ugrupowania są niepodobne, a dodatnia, że są podobne (bliskie). W przytoczonej tu macierzy korelacji na czerwono zaznaczono współczynniki korelacji liniowej istotne statystycznie na poziomie istotności α=0,05.
Poniżej przedstawiamy diagram rozrzutu otrzymany w wyniku skalowania wielowymiarowego.


Osie na diagramie wyników skalowania wielowymiarowego są niemianowane i nie mają bezpośrednio żadnego związku merytorycznego ze zmiennymi wyznaczającymi oryginalną przestrzeń klasyfikacji. Można zaproponować interpretację tych osi poprzez analizę merytoryczną. Tutaj przedstawiamy układ, który został zaproponowany [1] w analizie wyborów do Sejmu z roku 1993 i sprawdzający się w toku kolejnych wyborów parlamentarnych i prezydenckich. Wedle tej hipotezy o obrazie sceny politycznej kreowanym przez wyborców decydują dwa wymiary: wymiar ideologiczny oraz wymiar miejsca zamieszkania. Zdajemy sobie sprawę z dość umownego schematu Lewica/Prawica, szczególnie w sytuacji, gdy poszczególne partie trudno zakwalifikować jednoznacznie.
Obraz rysujący się na przedstawionym powyżej rysunku jest dość oczywisty i bardzo podobny do diagramu charakteryzującego wybory z 2007 roku. Widać, że Ruch Palikota odebrał głosy głównie SLD. Punkt reprezentujący Ruch Palikota leży niemal dokładnie na prostej łączącej SLD i PO, przy czym Ruchowi Palikota jest dwa razy dalej do PO niż do SLD. Platforma Obywatelska jest tak samo postrzegana jak cztery lata temu. PiS stracił nieco poparcie u elektoratu miejskiego.

GEOGRAFIA WYBORCZA

W analizie przestrzennego zróżnicowania wyników wyborów stosujemy taksonomiczną metodę Warda. Łączy ona kolejno te okręgi, które mają najbardziej podobną strukturę wyników. Te połączenia oznaczane są graficznie i w efekcie powstaje tzw. drzewko połączeń, czyli dendrogram.


Drzewko połączeń ma dwie duże gałęzie. Drzewko to pokazujemy tu w pozycji horyzontalnej, aby lepiej było widać identyfikatory okręgów. Widać, że Polska jest podzielona przede wszystkim na dwie części i jak łatwo się można domyśleć podział ten generowany jest popularnością dwóch czołowych oponentów na scenie politycznej – PO i PiS. Większą grupę okręgów można jeszcze podzielić i otrzymujemy wtedy cztery grupy o następującym składzie (w numeracji idziemy od góry rysunku):

Grupa 1: Legnica, Wałbrzych, Koszalin, Piła, Warszawa I, Gdynia, Gliwice, Poznań.
Grupa 2: Wrocław, Katowice, Kraków II, Bydgoszcz, Zielona Góra, Toruń, Kalisz, Częstochowa, Łódź, Gdańsk, Elbląg.
Grupa 3: Kraków I, Bielsko-Biała, Warszawa II, Rybnik, Szczecin, Opole, Olsztyn, Sosnowiec.
Grupa 4: Lublin, Siedlce, Piotrków Trybunalski, Radom, Tarnów, Chełm, Płock, Nowy Sącz, Krosno, Rzeszów, Sieradz, Białystok, Kielce, Konin.

Średnie (w naszej analizie są to średnie nieważone liczby uprawnionych) w grupach można porównać, stosując jednoczynnikową analizę wariancji.


Tylko cztery ugrupowania decydują o różnicach terytorialnych (Polska Partia Pracy – Sierpień 80 jest bardzo blisko granicy istotności statystycznej). Pewną niespodzianką jest nieobecność w tym gronie SLD.


W tabeli podającej średni procent głosów w wyróżnionych grupach terytorialnych na zielono zaznaczono najwyższy wynik danej partii, a na żółto najniższy. Uwzględniono tylko cztery ugrupowania decydujące o zróżnicowaniu terytorialnym. Trudno wskazać decydującą różnicę pomiędzy grupami 2 i 3. Wydaje się, że mogą to być notowania PJN, dla którego grupa 3 jest grupą najlepszą, a grupa 2 – najgorszą. Relatywnie duża jest też różnica w notowaniach PSL, prawie dwa punkty procentowe. W grupie 1 przewaga PO jest przytłaczająca. Procentowo uzyskała tam ponad dwa razy więcej głosów niż PiS. Przewaga PiSu w grupie 4 to tylko (w tym kontekście) prawie 10 punktów procentowych. Ciekawe jest też spostrzeżenie, że PSL najlepiej radził sobie tam gdzie i PiS.

PO kontra PiS – PiS kontra PO

Przypatrzmy się teraz niektórym analizom porównującym wyniki dwóch najpopularniejszych partii. Najpierw pozostańmy przez chwile przy geografii. Na kolejnym rysunku pokazujemy diagram korelacyjny PiSu i PO z zaznaczonymi punktami-okręgami. Przekątna wykresu to linia równomiernego podziału. Punkty leżące powyżej tej przekątnej to okręgi, gdzie przewagę zdobył PiS, a poniżej te, gdzie przewagę zdobyła PO.


Przy poprzednich wyborach obraz był bardziej zróżnicowany. Teraz jest jedna „chmura” punktów rozcięta na dwie części. Punkty układają się wyraźnie wzdłuż prostej. Uzasadnione jest więc oszacowanie linii regresji.


Stosunkowo bliski jedności współczynnik regresji wskazuje, że z procentowego spadku popularności PiS, to PO „zabierało” aż 0,925. Interpretacja wyrazu wolnego regresji jest z gatunku political fiction – gdyby PiS nie istniał, to Platforma miałaby 66,1% głosów.

FREKWENCJA A WYNIKI

Policzono współczynniki korelacji liniowej pomiędzy wynikami poszczególnych komitetów a frekwencją wyborczą.


Jest dużo korelacji istotnych. Tam, gdzie do urn poszło więcej wyborców, korzystali na tym Nowa Prawica Janusza Korwina-Mikke i w mniejszym (ale istotnym stopniu) PO i PJN. Ciekawy jest brak związku z frekwencją rezultatów PiSu i Ruchu Palikota.

CIEKAWOSTKI

Przypatrzmy się bardziej szczegółowo związkowi wyników Platformy Obywatelskiej z frekwencją wyborczą.


Jeżeli pole diagramu korelacyjnego podzielimy linią oznaczającą 50-procentową frekwencję i drugą linią oznaczającą 40-procentowe poparcie dla Platformy, to w prawym górnym kwadrancie znajdą się duże miasta, którym PO zawdzięcza ogólne zwycięstwo. Nie ma żadnego okręgu o frekwencji ponad 50%, w którym Platforma uzyskała by mniej niż 40% głosów.

Przed wyborami opublikowano mapki, które wskazywały na niepokojącą koncentrację głosów nieważnych w wyniku postawienia dwóch krzyżyków w granicach województwa mazowieckiego (dane na poziomie gmin). Obecnie posiadamy dane dotyczące ogólnego procentu głosów nieważnych (bez rozdziału na przyczyny nieważności) oraz dane na poziomie okręgów wyborczych.


Współczynniki korelacji ugrupowań politycznych z procentem głosów nieważnych uderzająco przypominają korelacje z frekwencją. Zbadajmy więc związek procentu głosów nieważnych z frekwencją.


Wynik jest na pierwszy rzut okna trudny do wytłumaczenia. Im więcej ludzi poszło do wyborów w danym okręgu, tym mniej błędów popełniali. Współczynnik korelacji wynosi tu -0,81 i oczywiście jest istotny statystycznie. Być może mamy tu do czynienia z korelacją pozorną. Może istnieje jakaś zmienna, z którą skorelowane są zarówno frekwencja, jak i procent głosów nieważnych. Taką potencjalną zmienną może być procent ludności miejskiej. Ta hipoteza nie może być na razie zweryfikowana, bo nie dysponujemy danymi o procencie ludności miejskiej w układzie terytorialnym okręgów wyborczych.

LITERATURA

  1.  Pietrzyk-Zieniewicz E., Zieniewicz A., Sokołowski A., „Jak Polak z Polakiem …”, Ciechanów, Krajowy Ośrodek Dokumentacji Regionalnych Towarzystw Kultury, 1999.

 

Warto przeczytać:

Seminaria
Systemy data mining
Kursy i szkolenia
Konsulting
Czytelnia
Broszury
O StatSoft Polska
Analiza I rundy wyborów prezydenckich 2010 i prognoza wyników II rundy
Analiza wyników wyborów w III RP (od 1995 do 2005 roku)
Prognoza wyników II tury wyborów prezydenckich w 2005 roku na podstawie wyników z wyborów parlamentarnych