A 2018-as választási közvélemény-kutatásokról fennmaradt szörnyű kudarc emlékét egyáltalán nem támasztja alá az adatok korrekt elemzése

Jó éve volt 2018-ban a választási közvélemény-kutatásoknak abban a tekintetben, hogy a különböző intézetek utolsó méréseinek az átlaga igen jól eltalálta a tényleges választási eredményt (ld. táblázatom), és néhány intézet adatsora a nemzetközi gyakorlatban megszokott pontosságot ért el (erre majd lásd a 2018-as, 2019-es és 2022-es előrejelzéseket értékelő posztsorozatom zárófejezetét). Azonban a szélesebb közönségben és a szakmai szereplők között is egy sokkal negatívabb benyomás fennmaradásával találkozhatunk mind a mai napig.

A lesújtó emlékek fő forrása valószínűleg pár intézet emlékezetes melléfogásaiban, illetve a „szakértői becslésen” nyugvó mandátumbecslések kudarcaiban keresendő. Utóbbiak zöme erősen alákorrigálta a közvélemény-kutatások által mutatott fideszes szavazatarányt és elég érthetetlen módon jóval kisebb Fidesz többség lehetőségére következtetett, mint amekkorára a közvélemény-kutatási adatok és a 2014-es szavazatföldrajz alapján ténylegesen számítani lehetett volna. Illetve ahogy azt a Political Capital mandátumkalkulátorával bárki kisakkozhatta akkor is (legalább egy esetben az ellenzéki pártok közti taktikai átszavazás mértékének mértéktelen túlbecslése okozta a fő gondot). Így csak a Medián egy számítása látta előre a kétharmadot (amiben közrejátszott az is, hogy az ellenzéki pártok közti taktikai átszavazás hatását ők meg alábecsülték).

Ráadásul az is igaz, hogy a már a 2010-es és a 2014-es választások előtt is publikáló öt intézet utolsó becsléseinek átlaga valóban pont olyan masszívan túlbecsülte a Fidesz, és alálőtte a Jobbik támogatottságát, mint a megelőző országgyűlési választások alkalmából (lásd az 5. és 6. ábrát és a kapcsolódó szöveget itt). A választások utáni értékelések közül pedig az, amelyiket számtalan hírportál ismertetett az MTI nyomán, itt-ott pontatlanságokba keveredett. Az meg ugyan nem volt hiba, hogy a szakértői becslések és a közvélemény-kutatási adatok elemzését egymás mellé tette, de a felületes olvasók memóriája számára ez is nehezen kezelhetőnek bizonyult. Mindennek nyomán aztán a mai napig is elhangzik tekintélyes elemzőktől is olyan komolynak tűnő elemzés, miszerint nagyon alábecsülték a 2018-as kutatások a Fidesz támogatottságát.

Egy szó, mint száz, maradt itt egy csomó zűrzavar az emlékekben, amelyeket érdemes most helyre tenni egy alapos áttekintéssel. A (nem csak közvélemény-kutatók által készített) szakértői becslések, és ezen belül az egyéni választókerületek miatt egy egészen más műfajba tartozó mandátumbecslések értékelését egy más alkalomra hagyom. A közvélemény-kutatók teljesítményét érdemes inkább a méréseik előrejelző értéke alapján osztályozni, ami teljesen bevett és magától értetődő szakmai gyakorlat világszerte. Annak ellenére, hogy a hazai közvélemény-kutatók időnként tiltakoznak az ellen, hogy a „mérések” előrejelzések lennének. Ám ha nem az előrejelzés – természetesen bizonytalan sikerű – segédeszközeit látnánk bennük, akkor ugyan miért lenne rájuk bárki is kíváncsi? Tekintsük hát őket annak, ami miatt olvassuk őket.

Táblázatom első oszlopa a közvélemény-kutató intézet nevét és az adatfelvétel időpontját mutatja. A második oszlopban láthatjuk, hogy az „összes pártválasztóra” vagy a „biztos szavazó pártválasztókra” vonatkozik egy-egy adatsor. Megoszlanak a kutatók véleményei arról, hogy a kettő közül melyik ad jobb előrejelzést. Ezért ha valaki mind a kettőt közölte, akkor itt mind a kettőt megmutatom.

A pártokra vonatkozó oszlopok összege minden sorban 100 százalék (esetleges kerekítési hibákat leszámítva), hogy összehasonlíthassuk a „nem tudom, nem szavaznék” jellegű válaszok nélkül kapott megoszlásokat a választási eredményekkel.

A táblázatban az előrejelzések hibáját az utolsó két oszlop mutatja. Az utolsó oszlop egyszerűen az összegét mutatja az eredmény és a kutatási számok közötti pártonkénti abszolút eltéréseknek. Tehát ha egy kutató kettő kivételével minden számot pontosan eltalált, és csak egy pártot becsült túl mondjuk három százalékkal, egyet meg felül ugyanannyival, akkor az ő abszolút hibáinak összege hat. (Az egyéb pártokra vonatkozó oszlopot a hibák számolgatásából kihagyom.) Eggyel beljebb ugyanezen különbségek négyzetösszegét látjuk, ami a talán leginkább bevett szakmai mutatója a választási előrejelzések pontosságának annak ellenére, hogy laikusoknak nehéz interpretálniuk a számszerű értékét (ami az iménti fiktív példában (-3)2+32=18 lenne). Láthatólag nagyjából mindegy, a két eszköz közül melyiket használjuk, mert mind a kettő hasonló sorrendet mutat (táblázatom a négyzetösszegek szerint számított sorrendben sorolja fel az egyes kutatásokat).

További részletes magyarázatokat a tábla tartalmáról a poszt végén talál. Most csak az eredményre fókuszáljunk – ha jobban szeretné látni a részleteket, akkor érdemes inkább itt megnézni a számokat. Az első sor mutatja a levélszavazatok nélkül számított listás választási eredményt. A másodikban az összes kutatások átlagát látjuk. Na meg azt, hogy ez nagyon brutálisan pontosan telibe találta a Fidesz tényleges szavazatarányát, és a többi pártnál is csak piciket hibázott. Egyetlen kutatás, a Závecz RI március eleji vizsgálata adott még a kutatások átlagolásánál is jobb előrejelzést. Illetve volt még egy adatsora a Mediánnak, amelyik még táblázatom bajnokánál is egy hajszállal pontosabb volt, ám azt annak idején „szakértői becslésnek” könyvelte el a kozvelemenykutatok.hu oldal, és annak nyomán nagyjából mindenki, ezért most én se vettem be ebbe a táblázatba (ld. erre alább a forráskritikai megjegyzéseket).

Ha tehát a Medián telitalálatos „szakértői becslésétől” eltekintünk, akkor az intézetek versenyében a második helyet a Republikonnak adhatjuk, hiszen a Medián többi adatsora közül csak az egyik, és már csak a választás napján publikált darab, volt pontosabb a Republikonénál. (Utóbbit akkoriban még, úgy tudom, a komoly nemzetközi rangú Kantar-Hoffmann cég gyűjtötte, személyes kérdezéssel, ezért ez a siker sajnos csak annyit jelent a Republikon későbbi munkáinak referenciájaként, hogy 2018-ban jól választották meg az alvállalkozójukat.) A 2019-es előrejelzésekben legjobban teljesítő Századvég és Nézőpont adatsorai – egy közepes pontosságú kivételével – 2018-ban a legrosszabbak közé kerültek, a 2019-ben sem remeklő Publicus, Iránytű és IDEA egy-egy adatsora mellé (utóbbiak azóta is saját maguk gyűjtik adataikat).

Az talán különösebb magyarázat nélkül is látható, hogy teljesen vegyes a kép abban, hogy az „összes pártválasztó” vagy a „biztos szavazók” adatai alapján kalkulált előrejelzések voltak-e jobbak. Némelyik intézetnek az egyik, másoknak a másik jött be jobban. Részben ezért is olyan jó az összes adatsorok átlagolása, mert helyes arányban keveri a két különböző perspektíva által adott összképet.

A 2019-es előrejelzéseket értékelő posztom itt olvasható.

A 2022-es előrejelzésekről szóló poszt meg itt, egy korábbi elemzésem a teljesebb politikai kontextussal pedig itt.

Hogy pedig a fentiek fényében szerintem miként kell olvasnunk a 2024-es kutatásokat, azt a sorozat záró részében mondom majd el, de az aktuális kutatásokról, trendekről, várható mandátummegoszlásokról tájékoztató és folyamatosan frissülő posztom (lásd itt) olvasóit nem fogja nagy meglepetés érni.

FORRÁSKRITIKAI MAGYARÁZATOK A TÁBLA TARTALMÁRÓL

Táblázatom minden közvéleménykutatótól az utolsó, a 2018-as választás előtt készült és akkortájt nyilvánosságra került felmérést mutatja be legjobb tudásom szerint. Két intézet esetében két-két kutatást is feltüntetek, ugyanazért, ami miatt a 2019-es előrejelzések között a Nézőponttól kettőt is figyelembe vettem. Némi kétértelműség van ugyanis abban, hogy mi volt az adott intézetek utolsó nyilvános mérése. A Medián már a választások napján hozott nyilvánosságra egy az utolsó pillanatban készült adatsort (egy nappal korábban pedig részeredményeket mutatott be, amivel itt nem foglalkozom), ezért amellett az eggyel korábbit is figyelembe veszem. A Závecz RI-nek pedig egy röviddel a választás előtt készült vizsgálatából az index.hu-n (és az alapján több más online portálon) hiányos információkkal jelent meg egy „az elmúlt héten készült” adatsora. Én ezt bevettem a táblámba, de a korábbi többé vagy kevésbé körültekintő kísérletek a 2018-as választási előrejelzések értékelésére nem foglalkoztak vele, és a Závecz RI saját weboldalán meg a Nézőpont Intézet munkatársai által egykor működtetett közvélemény-kutatás figyelő oldal, a kozvelemenykutatok.hu adatbázisában sem jelent meg. Ezért a Závecztől az eggyel megelőző (a korábbi elemzések által érvényesnek tekintett) kutatást is feltüntetem a táblában.

Forrásaim szinte mindig az adatok eredeti megjelenései az online nyilvánosságban, és itt, egy Excel file-ban találja meg őket, együtt a kutatásra vonatkozó egyéb releváns információkkal, így a százalékokkal is úgy, ahogy ott megjelentek. Ennek a posztnak a táblázatában viszont a „nem tudom, nem válaszol” stb. jellegű válaszok kihagyásával újraszámoltam a százalékokat, ahol erre szükség volt.

Az alábbiakban nem azért tekintek el a szakértői becslések elemzésétől, mintha feleslegesek lennének, vagy ne lett volna olyan, amelyik tényleg pontosabbnak is bizonyult az adott kutató puszta méréseinél a választási eredmények előrejelzésében. Azért nem foglalkozom velük, mert olyan nehezen rekonstruálható szubjektív elemeket tartalmaznak, amelyek a tudomány-közeli eszközöket használó vizsgálódás helyett inkább a fogadási piacok trendjeiből kibontakozó becslésekkel rokonítják őket. Az ilyen becslések informatívak a maguk módján, de sikereik, ha vannak, nem utolsósorban annak köszönhetők, hogy a közvélemény-kutatások ismeretében alakítják a szakértői (és fogadói) várakozásokat. Ráadásul nem csak közvélemény-kutatók posztolnak szakértői becsléseket (2018-as példákra lásd pl. az index.hu és a taktikaiszavazas.hu próbálkozásait itt meg itt), és magam is érintett vagyok ebben a műfajban legalább 1998 óta.

Hogy pontosan hol a határ egy „mérés” és egy „szakértői becslés” között, az elég bizonytalan. A Nézőpont a nem sokkal a választás előtt megjelenő közvélemény-kutatási adataiban 2018-ban is megsaccolta a pártpreferencia kérdésre nem válaszoló, de a választáson valószínű résztvevőnek tűnő megkérdezettek várható szavazatát más kérdésekre adott válaszaik alapján. Ám amikor a Medián tette ugyanezt (részletesebben elmagyarázva ezt, és az egész kutatásban való részvételt elutasító emberek szavazási szándékára irányuló részleges információkat is felhasználva), akkor azt utóbb a Nézőpont Intézet „kozvelemenykutatok.hu” oldalának utólagos értékelése és ennek nyomán a sajtó is a „szakértői becslések” közé sorolta. Olyan becslések mellé, amelyek ezzel ellentétben eredetileg is „szakértői becslésként jelentek meg, viszont nem sok magyarázatot tartalmaztak arra, hogy mi alapján készültek, csak felsorolták mindazokat a nehézségeit az előrejelzéseknek (részvételi arány és levélszavazatok becslése, részvétel hatása az eredményre, az utolsó pillanat hangulatváltozása vagy a mozgósítás, taktikai szavazás, stb.), amelyek nehéz feladványt jelentenek a közvélemény-kutatók számára, és ezért inkább feltevésekkel, mintsem pontosan rekonstruálható mérési eljárásokkal saccoltak meg. Mivel ez sokat nem oszt-szoroz, és nem szeretnék Medián-párti elfogultság hírébe kerülni, ezért én itt követtem a konvenciót, és „szakértői becslésként” kihagytam a jelen elemzésből a szóban forgó számsort (ami egyébként az év legpontosabb választási előrejelzésének bizonyult a szavazatarányok tekintetében is).