Pirx pilóta és a parlamenti pártok kalandjai a mérési hibával

Nyelv és politika Természettudomány Nyelvtudomány Oktatás LEITERJAKAB

Cikkfolyam

Kövessen, kérem!

Nem lát minket a Facebookon?

Kenyérpirítón szeretné?

Legutolsó hozzászólások

Sándorné Szatmári: Szerintem beszűkül a gondolkozás féleségek korábbi sokasága, míg a tere, ahol keresgélni l...
2024. 03. 25, 09:02 Hogyan alakul át az olvasás?
Sándorné Szatmári: Ezek a modellek tehát (micsoda véletlen) fékezik a "féknyúz" terjedését ..? :)
2024. 03. 12, 18:39 Álhírek felsimerése nyelvi modellek...
Sándorné Szatmári: @cikk: Véleményem eltekintve a konkrét (pl. összeesküvés) példától: -Működő nyelvelméleti ...
2024. 03. 10, 09:31 Titkos víziók vagy vizionált titkok?...
Sándorné Szatmári: A cikk szerint a nyelv fontos jellemzője, hogy a szavak jelentése kommunikációs helyzeteke...
2024. 03. 01, 09:37 Diszkriminált állatok
Sándorné Szatmári: @szigetva: Amit írsz, nyilván én is észre veszem.. A jelentés és tartalom ugyanakkor rávil...
2024. 02. 23, 21:02 Nyelvek születése és terjedése

Összes hozzászólás >>

A nyelvész majd megmondja

Kálmán László nyelvész, a nyest szerkesztőségének alapembere, a hazai nyelvtudomány és nyelvi ismeretterjesztés legendás alakjának rovata volt ez.

Kálmán László korábbi cikkeit itt találja.

A legnépszerűbb anyagok

Nyelvek születése és terjedése Hogyan hivatkozzunk internetes forrásokra? Titkos víziók vagy vizionált titkok?
Összeesküvés-elméletek az interneten Elhunyt Kálmán László, a Nyelvész, aki megmondja Álhírek felsimerése nyelvi modellek segítségével

Írjon! Nekünk!

nyest.hu

Ha legutóbb kimaradt, most itt az új lehetőség!

Őrizze meg Ön is agylátását!

Ha csak egyetlen cikket töltesz fel az Academia.edu-ra a plágiumról, akkor az mindenképp plagizált cikk legyen!

Ha ma csak egyetlen nyelvészeti kísérletben vesz részt, mindenképp ez legyen az!

Finnugor nyelvrokonság: hazugság

Hunok legyünk vagy magyarok?

A határozott névelő, ami azt jelenti, hogy ‘te’

*kota a Bölcsész Napokon

MTA: elítéljük a listákat

Az oroszok már a fejünkön vannak!

egueguegueguegu-eguegueguegueguegu...

Már baklövést is lehet véteni

Kutatásmódszertan 9.

Pirx pilóta és a parlamenti pártok kalandjai a mérési hibával

A napisajtóban gyakran emlegetik a mérés hibahatárát, ha közvélemény-kutatásokról van szó, de néha mégis félreértik ezt a fogalmat. Lehet, hogy szándékosan magyarázzák félre, hogy így csalhassanak a statisztikával? Hogyan értelmezzük mi magunk a közvélemény-kutatásokat?

Takács Boglárka | 2011. december 21.

A cikk a hirdetés után folytatódik

Korábban már többször írtunk arról, hogyan lehet trükközni a grafikonokkal, számokkal, és milyen módokon lehet még félrevezetni az embereket a statisztika rafinált felhasználásával. Most egy olyan témáról lesz szó, ami első pillantásra kicsit technikaibbnak tűnhet, de valójában az újsághírekben is gyakran előkerül...

2010-es kampányplakátok. Miért nehéz megmondani, ki jut be a parlamentbe?
(Forrás: Wikimedia Commons / Czank Máté)

Beismeri a hibáját?

Mindenféle mérésnek van hibája is. Ez természetes, nem kell tőle megijedni! Nem arról van szó, mint amit a hétköznapi életben értünk hiba alatt, tehát hogy valamit elrontottunk. Ha egy tudós mérési hibáról beszél, az nem feltétlenül azt jelenti, hogy a mérés úgy rossz, ahogy van, és lehet az elejéről kezdeni az egészet. De akkor mit jelent?

A kutatók többféle hibát különböztetnek meg. A két legnagyobb csoport a rendszeres és a véletlen hibák csoportja. Ha fogunk egy szobamérleget és ráteszünk egy ötkilós követ, akkor bárki áll rá, a mérleg következetesen öt kilóval nagyobbnak fogja mutatni a testtömegét – az ilyen és hasonló, minden mérést egy irányba torzító tényezők okozta hibákat hívják rendszeres hibának. (A hétköznapi nyelvben valami ilyesmit szokás a 'mérési hiba' megfogalmazás mögé odaképzelni.) De ha a rendszeres hibáktól többé-kevésbé megszabadultunk, még mindig ott a véletlen hiba: ez sok kis különböző, összevissza ható tényező eredménye, és nem lehet teljesen kiküszöbölni.

Az oldal az ajánló után folytatódik...

Ha valamit többször egymás után lemérünk, nem pontosan ugyanazt az eredményt kapjuk – ha nem hisszük, próbáljunk meg ötször egymás után ráállni a szobamérlegre! Lehet, hogy egyszer hatvan kilót mutat, majd ötvenkilencet, majd megint hatvanat, és így tovább. Ez az ingadozás, a véletlen hiba független attól, hogy észrevettük-e és levettük-e a mérlegről az előző használó által gondosan odakészített ötkilós követ... A véletlen hiba teljesen természetes dolog, és a statisztikusok tudnak vele bánni. Lássuk, hogyan! (A következőkben, ha csak külön nem említjük, mindig a véletlen hibáról lesz szó.)

Súly ékírásos felirattal. Már az ókorban is...
(Forrás: Wikimedia Commons / Rama / CC BY-SA 2.0)

Illeg-billeg

A hiba azt mutatja, mekkora a bizonytalanság a kapott eredményekben. Ha például rendre 60; 64; 56; 60; 61 kilóra adódott a testtömegünk, akkor a hiba nagyobb, mint ha mondjuk a 60; 61; 60; 59; 61 kilókat kapnánk: az értékek jobban eltérnek egymástól. (A két sorozat átlaga megegyezik.)

A gyakorlatban a közvéleménykutatások néhány százas vagy ezres mintával dolgoznak. Néhány újabb példa különböző sajtótermékekből: 500 osztrákot kérdeztek meg arról, hogyan viszonyulnak az EU-integrációhoz; 1581 republikánust kérdeztek arról, támogatnák-e Herman Cain elnökjelöltségét (ez még azelőtt volt, hogy visszalépett volna); 1000 magyart pedig arról faggattak, együttműködik-e az MSZP és a Demokratikus Koalíció.

Minél többet mérünk, annál kisebb a véletlen hiba – a számos apró, más-más irányba mutató különbség kiegyenlíti egymást. Arról már korábban írtunk, hogy a nagy mintaelemszám önmagában nem jelent semmit, és sokkal fontosabb a reprezentativitás. Emlékeztetőül: hiába töltetünk ki egy szekérderéknyi kérdőívet a barátainkkal, az nem biztos, hogy bármit is mond a magyar lakosságról. De ha a mintánk a lehetőségekhez képest reprezentatív, akkor igenis számít az elemszám. Lehet egy tíz fős minta is reprezentatív, meg egy tízezres is, de az utóbbinak kisebb lesz a hibája.

Sávom, sávom, mondd meg nékem

A hibahatár mutatja meg, mekkora eltérés lehet a valódi és a mért érték között. A mindennapokban ez az, ami igazán fontos, hiszen az, hogy „az átlag standard hibája 3,562”, legfeljebb egy szakmabelinek mond valamit. A hibahatár viszont előtanulmányok nélkül értelmezhető: azt mondja ki, hogy a legvalószínűbben milyen sávon belül esnek az eredmények (ez a hibasáv). Hogy megfoghatóbb legyen ez az absztrakt fogalom, lássunk egy szemléletes kitalált példát!

A Bergengóc Népi-Nemzeti Közvéleménykutató Intézet mérése azt mutatja, hogy a bergengócnyelv-tanárok 48%-a szerint igen elavult a bergengóc nyelv helyesírási szabályzata. (Nincsenek vele egyedül.) A hibahatár plusz-mínusz 4%, tehát ez azt jelenti, hogy a valóságban a tanárok 44-52%-a vélekedik így. Lehet, hogy csak 45%-uk, de az is lehet, hogy 52%-uk. Az viszont a mérés fényében nagyon valószínűtlen és nyugodtan elvethető, hogy a tanárok 20%-a vagy 75%-a képviseli ezt az álláspontot.

Helyesírás-oktatás Angliában, 1912
(Forrás: Wikimedia Commons)

Mindig fennáll annak az esélye, hogy a hibahatáron kívül esik a valódi érték. Például ha Magyarországon tíz olyan ember van, aki harminc nyelvet beszél, és tíz fős reprezentatív mintával vizsgáljuk a magyarok nyelvtudását, akkor nagyon pici eséllyel ugyan, de lehet, hogy pont ezt a tíz embert választjuk ki véletlenszerűen... és aztán megállapítjuk, hogy az átlag magyar harminc nyelven beszél. A hibasáv lényege épp az, hogy nagy valószínűséggel belekerül a valódi érték, de a nagy valószínűség nem jelent teljes bizonyosságot.

Pirx pilóta kalandjai

Sok újság megírja a közvéleménykutatások hibahatárát – a fenti oldaldoboz osztrák, amerikai és magyar példái mind tartalmazzák ezt az adatot is. De milyen hibahatár számít jónak? A bevett módszerekkel végzett közvéleménykutatások hibahatára plusz-mínusz 3-5% körüli szokott lenni. Ha nagyon titkolják a hibahatárt, az valószínűleg azért van, mert túl magas! A plusz-mínusz (±) jelet pedig olykor bevallottan elfelejtik kitenni...

Ha nem közvéleménykutatásról van szó, arra érdemes gondolni, mekkora bizonyosságra van szükség a konkrét esetben. Stanisław Lem klasszikus sci-fi elbeszélése, A teszt épp erre mutat rá:

De a pálya kis híján érinti a Holdat. Nem tudni, hogy átsiklik-e az űrhajó a Hold fölött, vagy belefúródik. A trajektométer hibahatára hét-nyolc kilométer – lehet a görbe alsó pontja három kilométerrel a sziklák fölött, vagy ugyanannyival alattuk.

Ha Pirx pilóta jó ezer kilométer távolságban repül a Holdtól, nem nagyon számít neki, hogy 1003 vagy 1004 kilométer messze van az űrhajója az égitesttől, tehát ez a hibahatár teljesen megfelelő számára. De ha épp a Hold közvetlen közelében jár az űrhajójával, mindjárt élet-halál kérdése a három és négy kilométer közötti különbség! (Ha valakit érdekel, mi történik ezután a kétségbeejtő helyzetbe került Pirx pilótával, az interneten fenn van a novella teljes szövege, a Beleolvasok gombra kell kattintani.)

Csalás és ámítás

A tudományos közleményekben sokféle grafikonra szokás hibasávot rakni. A hibasáv terjedelmét többféle módszerrel is ki lehet számolni, ilyenkor – jobb esetben – a cikk szövegéből kiderül, milyen módszert használtak a kutatók. A napisajtóban ellenben hibasávot szinte sosem látni, még akkor sem, amikor a cikk szövege említi a hibahatárt. Ha olvasóink találkoznak vadon élő hibasávval, küldjék be a képet, hadd örüljünk neki együtt!

Mutatunk egy valódi vizsgálatból származó példát. Ez az ábra egy olyan vizsgálatból származik, amelyben azt hasonlították össze, mennyire jól tudnak tájékozódni különböző szerkezetű weblapokon a fiatalok és az idősek. Egy hierarchikus szerkezetű és egy címkéket használó weblapon kellett előre megadott kérdésekre választ keresni. Az ábrán bal oldalt a hierarchikus, jobb oldalt a címkéket használó weblapon elért eredmények láthatóak. A piros színű oszlopok az idősek, a kékek a fiatalok teljesítményét mutatják. A függőleges pöckök jelölik a hibasávokat – a szakasz két végpontja (a pöckök feje) mutatja a sáv egyik és másik végét a függőleges tengelyen.

A bal szélső oszlop esetében körülbelül -0,6-tól -0,4-ig terjed a hibasáv.
(Forrás: Pak R, Price MM, Thatcher J / CC BY 2.0)

A bal oldalon, azaz a hierarchikus weblap esetében nagy különbség van a fiatalok és az idősek között. (Kicsit szokatlan módon az Y tengelyen a nagyobb értékek rosszabb teljesítményt jelölnek, de erre az Y tengely
angol nyelvű felirata felhívja a figyelmet. Tehát a fiatalok teljesítménye
jobb.) A hibasávok között nincs átfedés, látványosan elkülönülnek
egymástól – a mért különbség valószínűleg valós.

Viszont a címkéket használó weblap esetében a fiatalok és az idősek között ugyan mértek egy kis különbséget, de a hibasávok nagy mértékben átfedik egymást, így lehet, hogy valójában nincs is a két csoport között eltérés. (A cikkben részletesen kifejtett statisztikai számítások tényleg azt mutatták, hogy a címkés weblap használata során a fiatalok és az idősek között nincsen szignifikáns teljesítménykülönbség.) Láthatjuk, hogy még egy egyszerű oszlopdiagramnál is hasznos információt nyújt a hibasávok feltüntetése!

Miért lehet baj, ha nincs a grafikonokon hibasáv? Azért, mert a lelkes olvasó azt gondolhatja, az eredmény jobb, mint valójában. Ha az ábrán nem találunk a grafikonnal való csalásokról szóló cikkünkben bemutatott durva félrevezetéseket, örömmel állapíthatjuk meg, hogy minden szép és jó. De a valóságban lehet, hogy az eredmények körüli bizonytalanság olyan nagy, hogy az ábrából igazából semmilyen következtetést nem lehetne levonni... Ha a hibasávok szerepelnének a képen, akkor ezt rögtön lehetne látni, míg a számadatok fölött reggelizés közben elsiklik az ember szeme.

A leggyakoribb statisztikai csalás, amikor a hibahatáron belüli eltéréseknek jelentést adnak. Ha egy párt támogatottsága 1%-kal nőtt, de a mérés hibahatára 3% (mint egy tipikus közvéleménykutatásnál), akkor az is lehet, hogy a párt támogatottsága egyáltalán nem változott. Mégis láttunk már törtszázalékos növekedést is valós különbségként feltüntetve. Ugyanezen okból nagyon nehéz előre megmondani, kik jutnak be a parlamentbe! Ha a mérés szerint egy pártra 4% szavazna, akkor a közvéleménykutatások megszokott hibahatára mellett lehet, hogy a párt pont az 5%-os parlamenti küszöb alá kerül, de az is, hogy fölé.

További olvasnivalók

Hibasávok típusai, hibasáv felhelyezése táblázatkezelőkkel

Muszáj volt ráraknod a hibasávokat? (karikatúra)

Nézettségmérések és a hibahatár (itt még ritkábban kerül elő, mint a politikai cikkekben...)

Két szakmaibb cikk haladóknak: Error bars in experimental biology / The link between error bars and statistical significance

Hirdetés

Címkék: Társadalom, Hazugság, Kutatásmódszertan, Statisztika, Szociológia

Követem a cikkhozzászólásokat (RSS)

Hozzászóláshoz lépjen be vagy regisztráljon.

Még nincs hozzászólás, legyen Ön az első!

Hirdetés