Mit kezdjünk a közvélemény-kutatásokkal, ha tényleg ennyire rosszak (még Amerikában is)?

Tóka Gábor

Ez a 2020. november 17-i írás egy korábban angolul megjelent blogposzt frissített és kicsit kibővített változata. A szélesebb közönség számára átdolgozott magyar változata itt jelent meg Miklósi Gábor átdolgozásában: https://444.hu/2020/11/26/lehet-e-meg-hinni-a-kozvelemeny-kutatoknak

Most abból az alkalomból teszem közé a saját tudálékosabb változatomat (a november 17-i szöveggel, de a választási eredmények tekintetében ismét felfrissített ábrákkal), hogy egyrészt a Washington Post Monkey Cage blogján is elkezdtek megjelenni a tudós reflexiók (és szerintem ezt a hasznos, bár szerecsenmosdató posztot leszámítva elég tartalom-soványak a posztomhoz képest), másrészt meg a Századvég egyik vezető közvélemény-kutatója is publikált egy hasonló témájú, ám részben ellentétes következtetésekre jutó reflexiót az Origón. Velem ellentétes következtetése, hogy nem kéne olyan sok közvélemény-kutatás alapú választasi előrejelzés, és egyszerűen tudomásul kell venni, hogy bizony ilyen sokat hibáznak. Ugyanakkor alábbi szövegemmel egyetértésben – bár a 2019-es magyar önkormányzati valasztasi eredmények előrejelzésével kapcsolatos kritikai megjegyzéseimre tévedésből mint ezzel szembenálló véleményre hivatkozva – azt fejtegeti, hogy politikai stratégiák megalapozásához továbbra is szükség lesz közvélemény-kutatásokra (valójában ezek kívánatos finanszírozási módjával kapcsolatban van nézeteltérésünk).. Szerintem ennél radikálisabb következtetések indokoltak: végre el kell kezdeni realisztikus hibahatárokat számítani és közölni azok helyett a tarthatatlan becslések helyett, amelyeket a közvélemény-kutatói beszámolók rutinszerűen tartalmaznak, ezeket tükröznie kell az elemzések narratívájának is, és az adatgyűjtő közvélemény-kutatók mellett azoktól független adatösszegzésekre van szükség ahhoz, hogy érdemi és az elvárható megbizhatósági elvárásoknak megfelelő információk jussanak el a közönséghez és a politikusokhoz is.

2020. nov. 17.

Joe Biden vártnál nehezebb győzelme az amerikai elnökválasztáson kiélezett egy korábban is nyugtalanító kérdést. Miként az addig kvótás mintavételre támaszkodó közvélemény-kutatások leszereplése az 1948-as elnökválasztáson, azonképpen az idei hibák is kételyt ébreszthetnek egy csomó fontos társadalomtudományi kutatás megbízhatóságával kapcsolatban. Alább bemutatom, hogy mekkorát is tévedtek a közvélemény-kutatások az idei elnökválasztáson, és hogy a hibák meghökkentően hasonlóak (ám nagyobbak és szisztematikusabbak) voltak, mint a megelőző 2016-os választáson. Aztán bemutatok néhány hihető magyarázatot a hibák ismétlődésére, és átfogóbban is megvizsgálom, hogy mi is a baj a kortárs választási közvélemény-kutatásokkal, és mit kezdhetünk ezzel a jelenséggel.

Vörös délibáb vagy közvélemény-kutatói kudarc?

A közvélemény-kutatók kiátkozása november 4-én reggel elsietett volt. Érthető hát, hogy számos utólagos szakértői elemzés a hibák „átlagosságára” helyezte a hangsúlyt (ld. pl. itt meg itt). Alig vált ugyanis világossá Donald Trump floridai győzelme a választások éjszakáján, rögvest megtelt a világsajtó a közvélemény-kutatásokat eltemető véleményekkel. Az csak még tovább erősítette őket, amikor Biden végül felülkerekedett: jó-jó, a lényeget eltalálták, de a wisconsini eredmény sokkal szorosabb, mint amit a közvélemény-kutatások mutattak! (Ami igaz is, de a közvélemény-kutatók meg éppen a „hol a sapkád, nyuszi?” vicc feltámadásán zsörtölődtek, hiszen 2016-hiába adták minden idők egyik legjobb becslését az országos szavazatarányokra, akkor az Electoral College-beli győztes eltévesztése miatt lettek elpáholva.) Szakemberek sokkoló becsléseket tweeteltek a hibák várható nagyságáról, hitelesnek látszó politikatudósok kezdték téves vádakkal bírálni Nate Silver idei előrejelzését és közben dicsérni a már többször cáfolt “szégyenlős Trump szavazók” elméletet. Még Magyarországhoz hasonló távoli országokban is azonnali magyarázatot kért a média a hibákra. Az amerikai közvélemény-kutatók szervezete közben elzárkózott a válaszadástól, mondván nem ismerjük még a végleges eredményt.

Valóban, több államban is napokkal a választás napja után volt a levélszavazatok beérkezésének törvényes határideje, Kalifornia pedig 2016-ban is már olyan sok hétig számolgatta tetemes – és többnyire a Demokratákat támogató – levélszavazatát, hogy a világ nagy része észre sem vette, végül milyen kövérre duzzadt Hillary Clinton előnye az összes szavazatokban. A 2020-as közvélemény-kutatók is igen helyesen jelezték előre, hogy a szavazás másnapján egy Trump győzelem vörös délibábja rajzolódhat ki, amit majd csak lassanként mos el a soha nem látott tömegű levélszavazat kék tengere. A tudományos kutatások is meggyőzően jelezték már hetekkel korábban, hogy nagyon sok levélszavazat és korán leadott szavazat lesz idén, és az utóbbiak között sokkal több lesz a Demokrata párti szavazat, mint a választás napján leadott, és a legtöbb helyen elsőként megszámolt szavazatok között.

Most már azonban eleget tudunk a választási eredményekről ahhoz, hogy ítélkezzünk az elnökválasztási előrejelzésekről. Az amerikai közvélemény-kutatások leghíresebb összegzője arra számít, hogy – tekintetbe véve a még megszámolásra váró szavazatok számát és az adott környék már megszámolt levél- és személyes szavazatainak megoszlását – Joe Biden országosan kb. 4,3%-kal fog többet kapni a kb. 160 millió szavazatból, mint Donald Trump. Ez megdöbbentően közel van az egyik olyan előrejelzéshez, ami a közvélemény-kutatási adatokat szisztematikusan korrigálta más információk alapján. Viszont 3-4%-kal eltér attól a 7,2%-os Biden előnytől, amelyiket az egyik, és attól a 8,4%-tól, amit a másik legtekintélyesebb közvélemény-kutatási összefoglaló jelzett a választás előtti napon. Ez egy elég nagy hiba, akkora vagy még nagyobb, mint 2016-ban a 3,1%-os torzítás a Demokrata, vagy 2012-ben és 2000-ben a 2,5 illetve 2,6%-os torzítás a Republikánus jelölt javára, jócskán az 1,1%-os 2004-es és 2008-as torzítás felett. („Torzításon” itt a tényleges választási eredmény és a közvélemény-kutatások átlaga közti különbséget értem.)

Van olyan vélemény, hogy ez nem is olyan nagy torzítás, hiszen Biden szavazatarányának a sajtóban jelzett hibahatára átlagosan 2,1% volt a fivethirtyeight.com által figyelembe vett utolsó 21 országos kutatásban. De az átlagos hibahatár nagyon más, mint a 21 kutatás átlagának hibahatára: utóbbi csak fél százalék a Biden szavazatarány, és 0,76% a Biden-Trump különbség tekintetében (részletek a cikk végén*). Ehhez képest pedig már igencsak masszív az a 3-4%!

Persze nagy eltérések vannak az egyes államok közt. Minden választáson van pár állam az 50 közt, ahol halálpontosak a közvélemény-kutatások, a legdurvább hibák pedig általában ott adódnak, ahol csak kisebb számú és olcsóra szabott kutatás készült, mert eleve lefutottnak látszott a helyi meccs. 2016-ban (és 2018-ban) például Tennessee-ben tért el legjobban a választási eredmény – mintegy 13%-kal – a közvélemény-kutatások átlagában látott Clinton-Trump különbségtől. Idén is alighanem egy kevéssé izgalmas állam, most talán Észak-Dakota, vizsgálatai lesznek a fekete bárányok. Ám hiába koncentráljuk figyelmünket a csatatér-államokra, ott is szembeszökők a komoly hibák. Wisconsin esete látszik a legdurvábbnak: Biden valószínűleg egy százaléknál kisebb előnnyel fog végezni, míg a RealClearPolitics és a fivethirtyeight némileg másképpen képzett utolsó közvélemény-kutatási átlagai 6,7 illetve 8,3 százalékos előnyt mutattak.

Hadd ne soroljak számokat: a Wisconsinban és több más csatatérállamban látott torzítások sokkal nagyobbak, mint amire a sajtóban megjelent hibahatárok alapján várhatnánk sok kutatás átlagától. Az alábbi ábra például a választások előtt publikált átlagokat hasonlítja össze azzal, ahogy a szavazatszámlálás november 17-én este áll. Csak azzal a 14 állammal foglalkozom, amelyeket 2016-ban és 2020-ban is az Electoral College-beli többség eldöntése tekintetében legbefolyásosabbnak várt (népességmérete és a verseny szorossága alapján) a fivethirtyeight.com. Az ábra Biden százalékos előnyét mutatja Trump előtt. Negatív számok jelzik, ha Trump volt előnyben.

Már csak Pennsylvaniában és Észak-Karolinában változhat egy picit a szavazatarány az ábrához képest (ugyanis december 5-én felfrissítettem), de ez már nem változtatja meg az összképet: Trump hátrányát szinte minden csatatéren túlbecsülték. Csak Kolorádóban és néhány, az ábrán nem szereplő, mert nem túl kompetitív államban (pl. Kalifornia) becsülték alul Bident. A közvélemény-kutatások átlaga és a választási eredmény szorosan korrelál az ábrában (r=0.92), tehát helyesen mutatták a pollok, hogy hol állt viszonylag jobban Biden. De abban – jól láthatóan a pártok saját méréseihez hasonlóan – félrevezették mindkét kampány irányítóit, hogy hova érdemes koncentrálniuk a legnagyobb erőfeszítéseket a kampány végén. Mi több, a legnagyobb hibák mintha pont ott (Ohio, Michigan, Wisconsin) keletkeztek volna, ahol már 2016-ban is! Pont ez az, ami miatt a kritikusok azt is kétségbe vonták, hogy a már ismert hibákat kijavították-e, egyáltalán, ki tudják-e javítani a közvélemény-kutatások?

Hogy lehet kétszer ugyanabba a folyóba belelépni?

Mert lehet, amint a következő ábra mutatja. Megint csak a 14 fő csatateret nézem, ezúttal a közvélemény-kutatási átlagok szisztematikus hibája szempontjából. A függőleges tengely mutatja a 2020-as várható hibát az előző ábra előzetes adatai alapján. A vízszintes tengelyen a 2016-os tényleges hibát látjuk. Pozitív értéket kap egy állam, ha ott felülbecsülték Hillary Clinton illetve Joe Biden előnyét Donald Trump előtt, negatív értékek meg a fordítottját. New Hampshire például az ábra közepén kap helyet, mert ott mindkét évben három százaléknál egy picit többel becsülték túl a Demokrata jelölt százalékos előnyét.

Az államok elhelyezkedése a két tengelyen közepesen erősen korrelál (r=0.60). Pennsylvania, Észak-Karolina, Georgia, és Kolorádó az átló szaggatott vonala alá esik, ami azt jelenti, hogy a 14 államból ebben a négyben kevesebbet tévedtek a Demokrata jelölt javára 2020-ban, mint 2016-ban. Jókorát nőtt viszont a Demokraták túlbecslése Florida, Nevada, Arizona, és Új-Mexikó államokban, ahol – az egy Florida kivételével – még éppen Trump javára tévedtek egy kicsit 2016-ban. Ha ettől a négy, jelentős spanyolajkú népességgel rendelkező államtól eltekintünk, akkor a 2016 és 2020 közötti változások szerények, és nem mutatnak világos tendenciát.

Bolondság lenne az egyelőre hiányos adatok felületes böngészésétől és az első spekulációktól várni a választ arra, hogy mi volt a hibák oka. Az alapos elemzéshez a nem-nyilvános módszertani információkat is hónapokig szokta vizsgálni egy szakmai bizottság, és egy-két évig is eltart, míg a szaktudós lektorok szűrőjén is átmegy egy jelentés (a napokban jelent meg például a 2019-es ausztrál választásokról készült, egyébként nagyon kemény hangú beszámoló egyelőre még lektorálatlan változata). De nagyon csábító az ötlet, hogy a Florida-Nevada-Arizona-Új-Mexikó négyes rendhagyó viselkedésének oka a spanyolajkúak között idén váratlanul megugrott republikánus szavazatarány és hagyományosan gyengébb válaszadási hajlandóság az oka. A korábbi években ez a csoport nagyobbrészt a Demokratákra szavazott, és viszonylagos hiánya a megkérdezetteket angolul megkereső amerikai közvélemény-kutatásokban egy időről-időre felemlegetett oka volt annak, hogy Nevadában meg Kaliforniában miért tévedtek a közvélemény-kutatások többnyire a Demokrata jelöltek rovására. Sőt, az idei választás előtt is volt elemző, aki pont emiatt meg a 2016-os hibák várható fennmaradása miatt várta jó pár államban azt, hogy a pollok alábecsülik majd Donald Trumpot. A tényleges szavazatmegoszlás 2016 és 2020 közötti változását mutató térképek pedig erősen arra utalnak, hogy valóban pont a spanyolajkú szavazók között volt egy az országos trendekkel szembemenő fordulat Trump irányába. Az alábbi térképen a vörös nyilak sokasága Florida, Texas, Arizona és Kalifornia déli részén, valamint Új-Mexikó egészében és Nevada egyes részein pont ezt a fordulatot jelzi, és egyben meg is magyarázhatja az ottani közvélemény-kutatások szisztematikus hibájában egyidejűleg bekövetkezett változásokat.

Na de mit gondoljunk a többi csatatérállam (mínusz az egy Kolorádó) 2016-ban és 2020-ban is a kék (Demokrata) színekben induló jelölteknek kedvező torzításáról? Az Amerikai Közvélemény-kutatók Egyesülete (AAPOR) által 2017-ben felkért független vizsgálóbizottság minden fontosabb magyarázat-kísérletet alaposan egybevetett a hozzáférhető adatokkal, és számos ajánlást fogalmazott meg 2020-ra nézve. Ennek nyomán az iparágban szinte mindenki bevezette a válaszoknak az iskolázottság inverzével való súlyozását.

A súlyozás maga nem újdonság. A közvélemény-kutatók szinte soha nem számolnak minden választ egyformán. Némelyiket 2-3 válasz reprezentánsaként vesznek figyelembe, másokat meg csak egy fél személy válaszaként, és így érik ez azt, hogy a (súlyozott) mintán belül a vizsgált népességre jellemző nemi, életkori, stb. arányok mind pontosan előállnak. Hogy milyen kritériumok szerint súlyoznak az inkább megérzés, tapasztalat, lehetőség, és vakszerencse, mint tudományos igazságok kérdése. A közvélemény-kutatói gyakorlat attól függően változik, hogy éppen mi az, ami legjobban beválik egy-egy gyakorlati alkalmazás – mint például a választási eredmények pontos előrejelzése – tekintetében.

Annak oka, hogy 2016 után pont az iskolázottság szerinti súlyozás vált sürgetővé az az volt, hogy az AAPOR vizsgálat úgy találta, hogy Donald Trump színrelépésével egy jelentős, addig nem igazán érzékelhető különbség alakult ki, mindenekelőtt a közép-nyugati államokban, a jobban és a kevésbé iskolázott fehér szavazók pártválasztásai között. Ezek után pedig már lényeges lett, hogy a választási közvélemény-kutatásokban addig is jelentősen alulreprezentált iskolázatlanabb szavazók arányát helyére tegyék egy súlyozással. Ezzel szemben például a „szégyenlős Trump szavazókról” szóló elmélet (eszerint a Trump szavazók nem merik bevallani, hogy ki a kedvencük) mellett semmilyen bizonyítékot nem találtak sem akkor, sem azóta, sőt, az idei kampányban is ellentmondtak neki az adatok. A politikai szégyenlőségre ezért aligha érdemes súlyozni.

Ám még ha a 2016-os hibákat kis is javították – amivel kapcsolatban maradt azért kétely a New York Times meg a Real Clear Politics szerzői között is –, simán felmerülhettek olyan új nehézségek, amik ugyanolyan tévedésekhez vezettek, mint a 2016-os hibák. A még tapasztalatlan levélszavazók számának hirtelen növekedése miatt nőhetett az érvénytelen levélszavazatok aránya, és ez a Demokraták szavazatarányát csökkentheti a várakozásokhoz képest.

Az is lehet, hogy Donald Trump főleg a társadalmi és politikai életben passzívabb, vagy a médiában kevésbé bízó szavazók közt nyert új híveket, ők pedig szintén jól ismerten és jócskán alulreprezentáltak a kérdőíves vizsgálatok mintáiban, bár nem azért, mintha szégyellnének valamit.

Az sem elképzelhetetlen, hogy volt egy Trumpnak kedvező elmozdulás a kampány vége felé, csak a közvélemény-kutatások nem vettek észre. A járványhelyzet miatt ugyanis a Demokrata Párt már hetekkel korábban úgy döntött, hogy idén nem fognak ajtóról ajtóra kopogtatva mozgósítani a csatatérállamokban. A Republikánusok viszont nem mondtak le erről az elvben hatásos fegyverről. És valóban, láttak is egy Trump erősödést a valódi élő kérdezők által végzett telefonos kutatások, mint például Ann Selzer legendás iowai pollja, amelyik egy hét százalékos elmozdulást talált Trump irányában az utolsó hetekben, és ezzel telibe is találta az állam választási eredményét. A poll-ok 80 százaléka azonban most már élő kérdezőt mellőző (és ezért is nagyon olcsó) online vizsgálat, ezekben pedig nem vettek észre ilyen trendet a kampány végén, és ez döntően befolyásolta a közvélemény-kutatások átlagát.

Miért ilyen nagyok a hibák?

Bármit is mondjanak majd az utólagos elemzések a hibák igazi okairól, három rossz hírt biztosan meg kell emészteniük a közvélemény-kutatóknak és mindannyiunknak. Először is, a hibák túl nagyok ahhoz, hogy a közvélemény-kutatásokat névértéken vegyük figyelembe a jövőben. Másodszor, a hibák nagyobbak, mint amire a közvélemény-kutatók felkészítik a közönséget. Harmadszor, sehova nem vezet, ha azzal védik a mundért, hogy a szondák csak egy pillanatfelvételt adnak, nem pedig előrejelzést. Kezdjük a kifejtést az utolsó ponttal.

A közönség azért néz rá a közvélemény-kutatásokra, mert a jövőbe akar látni. Ha a kutatók nem teszik hozzá a számaikhoz, hogy mit mondanak a jövőről, vagy azt mondják, hogy semmit, akkor az olvasók vagy nem fognak figyelni rájuk, vagy a saját interpretációjukat olvassák bele a számokba, és azok megvalósulását kérik számon a közvélemény-kutatóktól. A legjobb esetben a közvélemény-kutatók helyett az olyan közvélemény-kutatás összegzőket és választás-modellezőket kezdik majd el olvasni, mint Nate Silver, a RealClearPolitics, az Economist választási kalauza mögött álló tudóscsapat, a New York Times Upshot rovata, és így tovább. A modellezők összegzik a különböző kutatásokat, számba veszik lehetséges hiányosságaikat, és kialakítják a saját értelmezésüket arról, hogy vajon mi fog történni, miben és mennyit tévedhetnek a közvélemény-kutatások, és mindez mit jelent a választási esélyek szempontjából. A közönség olyan előrejelzésekhez is fordulhat, amelyek a kérdőíves vizsgálatok mellett vagy helyett más információk alapján igyekeznek megjósolni választási eredményeket. Ezek között volt ez meg az, amik nagyon pontosnak bizonyultak 2020-ban, de pl. a közösségi médiás vagy közgazdasági adatokkal dolgozó modellek között bőven akadtak olyanok, amelyek komoly megalapozottságuk ellenére is még nagyobbat tévedtek idén, mint a közvélemény-kutatások, és a fogadási piacok sem öregbítették a hatékonyságukba vetett hitet.

Az egyes poll-okról szóló beszámolók azért sem jó információforrások, mert indokolatlanul szűk hibahatárokat adnak meg. Egy kétszereplős versenyben az olvasó és a sajtó szeme természetszerűleg a két jelölt szavazataránya közti különbségre irányul. A közvélemény-kutatók dolga lenne elmagyarázni azt, hogy e különbség hibahatára másfél-kétszer olyan tág, mint az egy-egy jelölt szavazatarányára vonatkozó hibahatár. Ehelyett még az utóbbit is sokkal kisebbnek mondják, mint a valóságos érték. A sokszor emlegetett „ha 1000 fős a minta, akkor max. ±3.5% a hibahatár” mantra egyszerűen nem igaz: a statisztikai elmélet és a tényleges választási közvélemény-kutatások empirikus elemzései is nagyjából kétszer ekkora hibát valószínűsítenek. A duplázódás oka az, hogy már régóta nem egyszerű véletlen mintákkal van dolgunk, hanem egyre inkább a kvótás mintavételre hajazó komplex konstrukciókkal, amik egyre összetettebb súlyozási eljárásokkal próbálják kikeverni a különböző csoportok helyesnek feltételezett arányát a valószínű szavazók vagy az elvben szavazni tudó megkérdezettek között. Évről évre folyamatosan változik, hogy pontosan kik vannak alulreprezentálva a mintákban, hiszen az elvben megcélzott válaszolóknak csak egy töredékét tudják meginterjúvolni a közvélemény-kutatások (Amerikában jellemzően már csak 1 vagy 2, és a legjobb kutatásokban is csak 6%-át). Mi kiált új súlyokért, és mi nem, szintén állandóan változik, ahogy a politika világa új választóvonalakat teremt, másokat meg betemet a társadalomban. A közvélemény-kutatásoknak csak az a szerencséje, hogy a változások elég lassúak ahhoz, hogy némi késéssel le lehessen követni őket. De a késés extra hibákkal jár, amelyek messze túllépnek a szokvány mintavételi hiba keretein.

Legfőképpen pedig az a baj, hogy a közvélemény-kutatások szakmai szempontból érthető és szinte elkerülhetetlen hibái egyszerűen túl nagyok ahhoz, hogy a közönség által elvált precizitású információval szolgáljon a műfaj. Tegyük fel, hogy van egy nagyjából ezer fős mintánk, amiben a Biden-szavazók arányának tényleges statisztikai hibahatára ±6%. Ha nincsenek egyéb releváns jelöltek, akkor Biden előnyét Trump előtt ±12%-os hibával mutatja a kutatásunk. Mivel a demokráciák jó szokása az, hogy versengő választásokat hoznak, ezért ez a hiba egyszerűen túl nagy, kutatásunk csak annyi információt adott a verseny állásáról, mint a szélben feldobott homokszem.

Sok kutatás átlagolásával elfogadható szintre csökkenthetjük a véletlen kilengéseket, és mélyebb felbontású képet kapunk az időbeli folyamatokról, meg egy valóban megbízható becslést kaphatunk arról, hogy miként néz majd ki a választás napján a … nos, nem a választási eredmény, hanem a közvélemény-kutatások átlaga. A közvélemény-kutatások átlaga ugyanis szinte soha nem azonos a választási eredménnyel. Választási kutatások ezreinek és választások százainak vizsgálata mutatta meg az Egyesült Államokban és globális összehasonlításban is, hogy a közvélemény-kutatások átlagának nem jelentéktelen a hibája. A méret függ a választás típusától, de pl. egy amerikai elnökválasztáson 2 százalék körül van.

A hibás átlagérték az alacsony válaszadási arányok és komplex mintavételi eljárások elkerülhetetlen következménye. Ha valami nagy változás van a részvételi arányban, a párttáborokat megosztó társadalmi vagy lélektani választóvonalakban, vagy mondjuk sok szavazó vált át a személyesről a postai szavazásra, akkor 2%-nál alighanem nagyobb lesz a hiba. Mindez annyira magától értetődő, hogy a 2016-os amerikai elnökválasztási bakit is két évvel előtte megjósolták pontosan ennek a gondolatmenetnek az alapján.

A jó hír az, hogy a hiba iránya megjósolhatatlan egy-egy választás előtt (ha biztonsággal lehetne tudni előre, hogy akkor éppen a Republikánusok vagy a Demokraták javára téved majd az átlag, akkor még időben lehetne korrekciókat alkalmazni a közvélemény-kutatásokban). Mi több, a közvélemény-kutatások éppolyan jó (vagy éppoly rossz, ha így jobban tetszik) előrejelzést adnak ma, mint bármikor korábban, mert a módszertani fejlődés eddig még valahogy lépést tartott a csökkenő válaszadási arányok okozta nehézségekkel. A kérdőíves kutatások (egyelőre) nem nélkülözhetők annak feltárásában, hogy milyen jelölteket, programokat, jelszavakat, probléma-keretezéseket szeretnek az emberek jobban meg kevésbé. A kampányoknak tehát továbbra is szükségük lesz rájuk, mint ahogy az előrejelzéseknek is. Az interpretáció viszont annyival nehezebb és bizonytalanabb annál, mint amit a közönségnek évtizedek óta ígértek, hogy nem lehet egyedül a közvélemény-kutatókra hagyni. Ám ha valaki visszamegy és elolvassa ezt vagy ezt az előrejelzést az idei amerikai elnökválasztásról – és itt most a lehető legtekintélyesebb főáramú forrásokra hivatkozok, nem valami kis garázsban hatalmasat újító, ám még ismeretlen zsenire –, akkor egyszerre láthatja azt, hogy a közvélemény-kutatások még mindig segítik az előrejelzést, meg azt, hogy megelőzhetjük azt, hogy túlzottan félrevezessenek bennünket, ha jól választjuk meg információ forrásainkat és figyelmesen olvassunk.

*: A szövegben említett hibahatár-átlagok és az átlag-közvélemény-kutatás hibahatára saját számításaim a fivethirtyeight oldalán publikált és október 28-november 1 közt gyűjtött adatok illetve az ott bemutatott adatok eredeti megjelenési helyén alkalmazott – véletlen mintát feltételező – hibahatár-számítási módszerek alapján. A Biden-Trump különbség hibája itt azért nem kétszerese a Biden százalék hibájának, mert a fivethirtyeight.com az egyéb jelöltek szavazatarányát is figyelembe vevő bázist használ. Ők egyébként nem közlik az általuk egy jóval bonyolultabb eljárással becsült közvélemény-kutatási átlag hibáját.

Mit kezdjünk a közvélemény-kutatásokkal, ha tényleg ennyire rosszak (még Amerikában is)?

4 Comments

Hozzászólás Kilépés a válaszból

Megosztom a posztot:

Kapcsolódó bejegyzések

4 Comments

Hozzászólás Kilépés a válaszból