Szerző: Bojár Ábel (kutatási igazgató, Europion)
Tényleg 70 százalékon áll a Tisza és 20 százalékon a Fidesz? A korábbi ellenzéki (és azóta kormánypárti) politikafalók körében szinte megkérdőjelezhetetlen tényként terjed, hogy a Fidesz-tábor szétesőben van, a Tisza támogatottsága pedig az 1989-90-es rendszerváltás óta nem mért magaslatokban jár. Ezt a vélekedést számos közvéleménykutatási adat alátámasztja.
A Medián kétszer is tett közzé pártpreferencia kutatást a választások óta, 70 százalék közeli támogatottságot mérve a Tiszának, míg a 21 Kutatóközpont és a Publicus ennél is nagyobb Tisza-fölényről számoltak be. A Medián a választások utáni hetekben közzétett kutatásának fontos adaléka volt az aktuális pártpreferencia adatokon túl, hogy a Fidesz támogatottsága nem csak, hogy csökkent a választások óta, de már sokkal kevesebben is emlékeznek úgy, hogy a Fideszre szavaztak, mint ahányan valójában szavaztak a volt kormánypártra. Ugyanez természetesen igaz a Tiszára leadott szavazat-visszaemlékezésekre is, csak fordított előjellel.
Elkerülők
Annak a jelenségnek, hogy egy kutatási adatfelvétel során kevesebben emlékeznek úgy, hogy a vesztes pártra szavaztak, mint valójában, számos forrása lehet. A szakirodalom bandwagon-jelenségként utal arra a tendenciára, hogy a politikai meggyőződésében ingatagabb szavazók hajlamosak utólag úgy válaszolni, hogy a győztes pártra szavaztak, hiszen a győztes táborhoz tartozás egy fajta biztonság érzetet ad és a többségi társadalom (vélt) elvárásainak jobban megfelel (social desirability bias). Ettől elkülönülő jelenség az utólagos igazodás a változó preferenciáinkhoz (reconciliation effect).
Ebben a hatásmechanizmusban a választó változó pártpreferenciáját az időben visszatekintve is igazítja, divatos kifejezéssel élve egy fajta kognitív disszonancia redukció formájában. Mindkét mechanizmus hatása ugyanabba az irányba mutat és mindkettő a téves visszaemlékezések (false recall) jelenségét töltik meg tartalommal. A mintába bekerülő korábban még Fidesz-szimpatizáns, de azóta a volt kormánypárttól már eltávolodott választó utólag már más pártot jelöl meg a „mely pártra szavazott áprilisban” kérdésre, mint a valóság.
Eddig a pontig ez inkább csak egy érdekes jelenség a politikai pszichológiában, mint a közvélemény-kutatási gyakorlat szempontjából releváns módszertani kihívás. A problémák ott kezdődnek, amikor egyéb mechanizmusok magyarázzák, hogy miért választják a Fideszt kevesebben a szavazat-visszaemlékezésre vonatkozó kérdésre válaszolva, mint az a valós választási eredményekből következne. A választási kudarcra adott pszichológiai reakcióknak van ugyanis egy alternatív formája, miszerint a vesztes táborba tartozó válaszadó nem a pártpreferenciáját változtatja meg, hanem egyszerűen elkerüli a válaszadást. A szakirodalom tanulságai alapján különösen akkor jellemző a vesztesek táborában ez a magatartás, amikor a választási kudarc meglepetés erejével bír.
Annak fényében, hogy a kormánypárti közvélemény-kutatók mindent megtettek annak érdekében, hogy elrejtsék a valós erőviszonyokat a kormánypárti szimpatizánsoktól, a fölényes Tisza győzelem a kormánypárti táborban vélhetően igazi hideg zuhanyként hatott. Egy ilyen politikai kontextus tökéletes táptalaja lehet a tömeges válaszmegtagadásnak (volt) kormánypárti oldalon.
Súlyozott emlékezet
A megkérdezettek többsége (több, mint 90 százaléka) természetesen alapjáraton sem válaszol közvélemény-kutatók telefonhívásaira, de csak akkor válik ez igazán akut problémává, amikor a válaszmegtagadók aránya asszimetrikussá válik a politikai táborok között. Az angol nyelvű szakirodalom partisan non-response bias (továbbiakban NRB) kifejezéssel utal erre a jelenségre, amivel sokan a 2016-os amerikai elnökválasztás előrejelzési hibáit is magyarázták. Az utólagos értelmezések szerint az alapvető társadalmi elidegenedésükből és bizalmatlanságból fakadóan a Trump-szimpatizánsok egyszerűen kevésbé voltak hajlandóak válaszolni a kutatók megkereséseire, mint az amúgy a demográfiai összetételükből következne. Ez az utóbbi kitétel kulcsfontosságú: ha csak arról lenne ugyanis szó, hogy a különböző politikai táborok szimpatizánsai más szociodemográfiai csoportokban koncentrálódnak és ezen csoportok között van eltérő válaszadási hajlandóság, akkor ezt a közvélemény-kutatási minta demográfiai kvótázása vagy súlyozása könnyen korrigálná.
A probléma akkor jelentkezik, ha a szociodemográfiai profilokon túlmutatóan nyílik szélesebbre az olló a válaszadási hajlandóságban a táborok között. Tehát nem attól válaszol alacsonyabb valószínűséggel egy átlagos Trump-szimpatizáns, mert alacsonyabban iskolázott és/vagy kistelepülésen él, hanem attól, hogy Trump-szimpatizáns.
Erre az eshetőségre alkalmazott korrekció, amit világszerte egyre több kutatóintézet alkalmaz (Nagy-Britanniában a YouGov, az USA-ban a Pew, Spanyolországban a CIS, Magyarországon pedig az Europion) a szavazat-visszaemlékezés beemelése azon súlyozási eljárásba, amit a minta demográfiai összetétele és a teljes felnőtt lakosság összetétele közötti különbség korrekciójához alapjáraton alkalmazunk. Ebben a megközelítésben a szavazat-visszaemlékezést is úgy kezeljük, mint bármely más demográfiai változót: tudjuk, hogy mennyi volt Fidesz-szavazó van a mintában – pontosabban mennyien állítják, hogy a Fideszre szavaztak – tudjuk, hogy mennyinek kéne lennie és ezt a különbséget ugyanúgy a súlyozási eljárás korrigálja, ahogyan azt teszi például alacsonyan iskolázottak vagy adatfelvétel típusától függően egyes korcsoportok alul, vagy felülreprezentációja esetén.
A megközelítés kritikusai szerint azonban a korrekció többet árthat, mint használ. Ha egy mintába kerülő (volt) fideszesek alulreprezentációja téves visszaemlékezésből és nem NRB-ből származik, akkor a súlyozási eljárás úgy fogja megnövelni a fideszesek súlyát a mintában, hogy erre semmi szükség nem lenne és ez a Fidesz támogotttságának felülméréséhez vezet. Ha azonban negligáljuk a szavazat-visszaemlékezésre való súlyozást és az NRB dominál az adatfelvétel folyamatában, akkor a fordított problémával állunk szemben: a mintába kerülő nem megfelelő számú Fidesz-szavazó nem kapja meg a megfelelő mértékű súlyt és ez a Fidesz támogatottságának alulbecsléséhez vezet. A statisztikai inferencia alapjaiból ismerősen csengő egyes és kettes típusú hibák (hamis pozitív vs. hamis negatív) dilemmájával analóg problémával állunk tehát szemben.
Hogy melyik problémát tartjuk súlyosabbnak és fontosabbnak az végsősoron egy elméleti döntés, ami nagyban függ az adatfelvétel módjától. Telefonos adatfelvételben — ahol egy időben kérdezünk jelenlegi és visszatekintő pártpreferenciát/szavazatot — különösen nagy lehet a megfelelési kényszer és igazodási igény a jelenlegi preferenciákhoz. Online panelek esetében ellenben lehetőség van a választások után rögtön visszatekintő szavazatra rákérdezni, amikor a téves visszaemlékezéshez vezető mechanizmusok még kevésbé érvényesülnek. Továbbá attól sem kell igazán tartani, hogy a hetekkel, akár hónapokkal korábban megkérdezett visszaemlékezés és a jelenlegi pártpreferencia egymáshoz igazítása miatt szenvedne csorbát a megadott válaszok validitása.
Buborék-szimuláció
Az elméleti megfontolásokon túlmutatóan és a döntést megkönnyítendő elvégeztünk egy olyan szimulációt, amit egy konkrét és szükségszerűen bonyolult választási helyzethez képest egy leegyszerűsített, stilizált helyzetben mutatja be a döntés (súlyozzunk-e szavazat-visszaemlékezésre, vagy ne) hatását. A példában egy hipotetikus kétpártrendszert modellezünk, ahol egy döntetlen-közeli eredmény (50-50 százalék) születik két párt között a választásokon. Az egyszerűség kedvéért kötelező a választás és ezért nincsenek bizonytalanok, pártnélküliek, nem szavazók stb. a mintában. A döntetlen közeli helyzetből azonban az egyik párt végül győztesként kerül ki és a választásokat követő időszakban elindul a győzteshez húzás. Ennek hatására a vesztes párt szavazóinak 20 százaléka megváltoztatja a pártpreferenciáját és jelenleg már a győztes pártra szavazna. Fordított arányú hatással is számolunk, de sokkal csekélyebbel: a győztes párt szavazóinak 5 százalék vált csak pártpreferenciát. Az aktuális pártpreferencia arányok a két hatás eredőjeként 57,5-42,5 százalékra módosulnak a győztes párt javára.
A változó politikai hangulatban a két hatás (NRB és téves visszaemlékezések) egyszerre jelenik meg, különböző mértékben. A szimuláció feltételezi, hogy a telefonos adatfelvételeknek megfelelően 0 és 10 százalék körül alakul a válaszadási arány, egyszerűség kedvéért a győztes párt szavazóinak válaszadási hajlandóságát 5 százalékban fixáljuk. Ehhez képes a vesztes párt szavazóinak válaszadási hajlandóságának relatív elmaradását (tehát az 5 százalék osztóját) véletlenszerűen variáljuk 1 és 2 között. Tehát a győztesekkel megegyező válaszadási hajlandóságtól a fele akkora választási hajlandóságig variáljuk az arányokat, véletlenszerűen. Ezzel párhuzamosan az “átállt” vesztesek egy részében a téves szavazat-visszaemlékezés is megjelenik, szintén különböző mértékben. Ezt a szimuláció 0 és 50 százalék között variálja, szintén véletlenszerűen. 100 ilyen iterációt végzünk, minden egyes iteráció egy véletlenszerűen előállított NRB-téves visszaemlékezés aránypárt jelenít meg. Minden egyes iterációban kiszámoljuk a szavazat-visszaemlékezésre való súlyozással és a súlyozás nélkül számolt jelenlegi pártpreferencia-eloszlásokat. A szimuláció feltételezi továbbá, hogy a minta minősége (demográfiai összetétele) “tökéletes”, azaz a súlyozási eljárást csak a szavazatvisszaemlékezések (pontosabban azok eltérése a valós választási eredménytől) alakítják.
Az alábbi ábra mutatja be a becslési hibák mértékét a valós pártpreferencia-eloszláshoz (57,5-42 százalék) viszonyítva. Piros buborékok jelzik azokat az interációkat, ahol a súlyozott eredmény és kékek azokat, ahol a súlyozatlan eredmények pontosabbak. A buborékok mérete jelzi a becslési hibák abszolút értékei közötti különbség mértékét. Ahol nagy piros buborékot látunk, ott a súlyozott becslés sokkal, ahol kisebb piros buborékot, ott a súlyozott becslés kicsivel pontosabbnak bizonyult a súlyozatlannál. Vica-verza: a nagyobb méretű kék buborékok ott láthatók, ahol a súlyozatlan eredmények sokkal pontosabbnak bizonyultak a súlyozott eredményeknél.

A szimulációból viszonylag egyértelmű kép bontakozik ki annak tekintetében, hogy melyik megoldás eredményez pontosabb becsléseket. A 100 iterációból 92 esetben „nyer” a súlyozott és csak 8 esetben a súlyozás nélküli eredmény. Csak egészen alacsony NRB-k és viszonylag magas téves visszaemlékezési arányok esetén árt a súlyozás többet, mint használ. Magas NRB-k és alacsony téves visszaemlékezési arányoknál pedig kifejezetten jelentős – hibakülönbségben kifejezve akár 10 százalékpontos – előnyt élvez az a megoldás, ha a visszaemlékezésre való súlyozást alkalmazzuk.
Tanulság?
A valóság ennél persze bonyolultabb, több okból is. Nem csak két párt versenyez, nem kötelező közvélemény-kutatásokban pártot választani (sem a jelenlegi pártpreferenciát tekintve, sem a visszaemlékezésekben), így mind a téves visszaemlékezések, mind a pártpreferencia változások több irányúak. A szimulációs gyakorlat ugyan igyekezett reális paraméter-sávokkal operálni mind az NRB, mind a téves visszaemlékezések, mind a pártváltók arányát tekintve, a pontos értékekről nincsenek ismereteink, hiszen ezen értékek ismeretéhez szükségünk lenne a valódi (és nem csak a kutatásokban riportált) visszatekintő pártválasztásra vonatkozó adatokra.
Ezzel együtt a jelenlegi politikai helyzetben a brutális Tisza-vezetést mutató eredmények mögött mindenképp érdemes feltenni azt a kérdést, hogy a valódi választási eredmények és a szavazat-visszaemlékezések közötti jelentős különbségeket hogyan kezelik a kutatók és adott esetben egy fajta jógyakorlatot kialakítani, hogy a különböző intézetek mérései ebből a szempontból is összehasonlíthatók legyenek.