Ekologická inference umožní dělat sociologická šetření od počítače

Kamil GregorRůzné

Rozhovor průzkumy

Pokročilá statistická metoda ekologické inference umožní výzkumníkům nahradit nákladná sociologická šetření. Mimo jiné umožní zjistit přesuny voličů mezi volbami či jejich věk a vzdělání.

[fb_button]

Kdo jsou voliči naší strany? Tak zní základní otázky politických stran a volebních štábů. Bez detailních informací o sociodemografickém složení voličů v dnešní době prakticky nelze vést úspěšnou kampaň.

Tím nejlepším způsobem, jak informace o voličích zjistit, je v 21. století ještě stále klasické sociologické šetření. Konkrétně v případě voleb jsou to tzv. exit polly, při kterých stojí tazatelé před volebními místnostmi a respondenty se stávají lidé, kteří právě přicházejí od voleb.

Tazatelé obvykle zjišťují koho daný člověk volil, koho volil v posledních volbách, jak je respondent starý, vzdělaný, či jestli žije v manželství. Z těchto informací je pak možno zjistit, jak vypadá složení voličů jednotlivých stran a také, jak se voliči přesouvali mezi volbami – tedy od kterých stran se odvrátili a ke kterým se přiklonili.

Jenže jako vždy je tu i pár ale. Tak především – exit polly jsou nesmírně drahé. Počet respondentů se obvykle pohybuje nad 20 000 a to znamená stovky lidí v terénu i za počítačem a tisíce člověkohodin. Exit polly jsou tak drahé, že od nich upouští i Česká televize. Poslední šetření dělala agentura SC&C v roce 2010 a již ve volbách 2013 proběhlo „jen“ telefonické dotazování.

Poté je tu další důležitý aspekt – lidé záměrně či nezáměrně neříkají pravdu. Je zcela běžné, že ze sociologických šetření, které se ptají na předchozí volby, není možno sestavit reálné volební výsledky voleb. Lidé také častěji reportují, že volili strany, které obvykle volí lépe situovaní lidé a naopak zamlčují volbu např. KSČM.

A pak je tu ten největší problém – pokud šetření nezorganizujete dostatečně dopředu a ono neproběhne v den voleb, informace je již navždy ztracená. Těžko tak zjistíme, jak vypadal voličský profil stran jen několik let zpátky, natož za první republiky.

Exit polly od počítače

Na rozdíl od exit pollů agregovaná data jsou poměrně dobře dostupná. Co tedy můžeme udělat, když máme volební výsledky a sociodemografická data zvlášť?

V současnosti běžně využívané metody pro statistickou analýzu volebních výsledků a sociodemografických dat mají řadu děr. Třeba korelace vám nanejvýš řekne, jestli spolu dva jevy souvisí. Například jestli souvisí volba levicových stran a úroveň nezaměstnanosti.

Regrese zase prozradí, o kolik % vzroste straně podpora, pakliže se v dané obci zvýší počet nezaměstnaných. Můžete se tak dozvědět, že s každým procentem podnikatelů v obci vzroste podpora ODS o 0,1 % a zároveň také, že s každým procentem Romů vzroste podpora DSSS o 0,3 %. Interpretace je jasná – ODS volí podnikatelé, podle stejné logiky volí DSSS Romové. Skutečně?

Interpretace je jasná – ODS volí podnikatelé, podle stejné logiky volí DSSS Romové.

Všichni samozřejmě víme, že tomu tak není. Výše zmíněné nedostatky se snaží řešit pokročilá statistická metoda nazvaná ekologická inference.  Je to statistická metoda, která určuje nejpravděpodobnější strukturu voličských přesunů na základě rozptylu počtu hlasů pro jednotlivé strany či kandidáty ve velkém množství geografických jednotek, např. v obcích nebo volebních okrscích.

Na rozdíl od drahého a komplikovaného sbírání dat přímo v terénu si výzkumník vystačí s počítačem. Metoda je velmi náročná na přípravu a zpracování dat stejně jako na výpočetní výkon počítače – na běžných strojích trvá výpočet v řádu desítek hodin. Nicméně celou analýzu zajistí jeden specialista nebo malý tým.

Velmi zjednodušeně řečeno, metoda umožňuje doplnit libovolnou tabulku, u které znáte pouze hodnoty v záhlaví (např. počet lidí ve věku 18-24 let) a hodnoty v prvním sloupci (počet voličů Zemana).

Nejstarší voliče měl Diesntbier

Výsledkem je úplná informace o libovolném zkoumaném jevu – můžeme zjistit, jak se přesouvali voliči mezi libovolnými volbami (dvěma po sobě jdoucími parlamentními, dvěma koly prezidentské volby, souběžně konanými krajskými a komunálními), nebo jaké bylo složení voličů jednotlivých stran z pohledu věku, ekonomické aktivity, národnosti, rodinného stavu či vzdělání.

[message_box title=“Grafy“ color=“blue“]Následující grafy slouží pouze pro demonstrační účely. Některá data v nich chybí nebo nejsou zobrazena.[/message_box]

Elektorát jednotlivých prezidentských kandidátů dle věku

složení elektorátuJak je patrné z ukázky, nejstarší elektorát získal Jiří Dienstbier, u kterého převážnou část voličů tvoří lidé starší 55 let. Výraznější podporu mladých voličů získal Franz, naopak Roithová oslovovala zejména starší ročníky.

Zde musíme poznamenat, že graf je samozřejmě roztažený do 100 %, 10 % voličů Fischerové je tak výrazně jiný počet lidí než 10 % voličů Zemana. Korektnější by bylo zobrazovat graf dle reálných volebních výsledků, nicméně poté by byla většina kategorií neúspěšných kandidátů nečitelná.

Koho volily jednotlivé věkové skupiny

složení voličů

Celou situaci samozřejmě můžeme také otočit. Pak zjistíme, že nejvíce lidí mezi 55 a 69 lety volilo Jiřího Dienstbiera. V ostatních kategoriích převažoval Karel Schwarzenberg, Miloš Zeman nebo Jan Fischer.

Elektorát jednotlivých prezidentských kandidátů podle vzdělání

složení voličů

Obdobným způsobem lze zjistit například vzdělání voličů jednotlivých kandidátů. Relativně vysoký podíl voličů bez maturity měl Dienstbier. Ze zobrazených kandidátů měli nejvyšší podíl voličů s VOŠ a nebo vysokou školou Sobotka a Fischerová, téměř jejich 80 % voličů mělo maturitu.

 Voličské přesuny mezi prezidentskými volbami a Sněmovními volbami 2013

voličské přesuny

Jak je patrné z grafu, voliči stranických kandidátů se rekrutovali zejména z voličů domovských stran. Nejvíce je to patrné u Zuzany Roithové a Přemysla Sobotky, ale i u Jiřího Dienstbiera. Naopak u ostatních se jednalo o pestrý mix voličů. U Bobošíkové je patrný relativně vysoký podíl budoucích voličů Úsvitu a KSČM, u Franze a Fischerové dominovali budoucí voliči ANO.

Revoluce v sociologických šetřeních?

Klasické sbírání dat v terénu objevem ekologické inference samozřejmě nekončí. Metoda ale přináší zajímavou alternativu, zejména z pohledu finanční úspory.

Důležitá je jistě i informace, že v českých podmínkách vykazuje metoda cca 90 % spolehlivost, tedy že přes 90 % lidí rozřadí do správných polí tabulky. Tento údaj vychází z porovnání reálných exit pollů a počítačových modelů volebních přesunů.

Nicméně reálně může být přesnost metody ještě vyšší. Na rozdíl od klasických šetření totiž netrpí problémy jako je reportování nepravdivých údajů a odlišnost od reálných šetření tak může být způsobena tím, že model je ve skutečnosti přesnější než exit poll.

[fb_button]