nyest.hu
Kövessen, kérem!
Legutolsó hozzászólások
A nyelvész majd megmondja
A legnépszerűbb anyagok
Írjon! Nekünk!
nyest.hu
nyest.hu
 
Adatújságírás 3.
Higgyünk-e az adatújságíróknak?

Számokkal sokféleképpen lehet hazudni, de vannak olyan torzítások, amelyekhez még tényleges hazugságra sincsen szükség. Elég, ha csak nem közöljük az unalmas eredményeket... Márpedig a napisajtó erre igencsak hajlamos! Kikben bízzunk jobban, a tudósokban vagy az újságírókban?

Takács Boglárka | 2013. szeptember 5.
|  

Cikksorozatunk első két részében bemutattuk, mi is pontosan az adatújságírás, és hogyan vehet gyakorlatilag bárki részt az adatújságírás forradalmában. Azonban nem minden móka és kacagás. Most az új trendek árnyoldalairól is szólunk...

Furcsa dolgok a fiókban
Furcsa dolgok a fiókban
(Forrás: Wikimedia Commons)

Érdektelen részletek

Az adatújságírók rengeteg információból szűrik le a lényeget, és ebből látványos szemléltetéseket készítenek. De ennek a módszernek megvan a maga hátránya: a legtöbbször nem maga a teljes elemzés terjed szét a neten, hanem csak egy-egy lényegretörő diagramot vagy infografikát mutogatnak egymásnak az olvasók. Ez azonban visszaélésekre adhat lehetőséget.

Arról már korábban részletesen írtunk, hogyan lehet hazudni grafikonokkal és számadatokkal. Azt szerencsére ezidáig elmondhatjuk, hogy az adatújságírók nem szoktak efféle trükkökhöz folyamodni, de maga a lehetőség fennáll. Amivel vissza lehet élni, azzal előbb-utóbb valaki vissza is fog élni!

A számok meggyőző ereje

Ha valaki arra hivatkozik, hogy egy nagy adatbázison elvégzett elemzések alapján jutott valamire, azt tapasztalhatja, hogy az olvasók gyakorlatilag bármit elhisznek neki. Pete Warden maga is átélte mindezt, amikor nekiállt elemezgetni a Facebookon nyilvános profilokat. Blogposztját, amiben arról írt, az amerikaiaknak hol vannak barátaik, csak apró érdekességnek szánta, habár 220 millió profil adataiből készült.

A Facebook standja egy reklámipari szakkiállításon. Mindent tudnak?
A Facebook standja egy reklámipari szakkiállításon. Mindent tudnak?
(Forrás: Wikimedia Commons / Derzsi Elekes Andor / CC BY-SA 3.0)

Habár az adatbázis teljesen valódi volt, Warden meglehetősen lazán vette az elemzést. Azzal a módszerrel definiálta a hasonló érdeklődésű amerikaiakat tartalmazó földrajzi területeket, hogy megnézte a térképen a barátokat összekapcsoló vonalakat, majd csak úgy érzésre körberajzolta őket. Hogy látni lehessen, ez nem egy véresen komoly vizsgálat, Warden olyan vicces neveket adott a földrajzi területeknek, mint a főleg Kaliforniát lefedő „Szocialisztán” vagy a Utah állam középpontú „Mormonia”. De az emberek rávetették magukat az eredményekre... Ahogy az elemző írja:

Azt gondoltam, hogy bemutatok néhány szórakoztató dolgot az általam kinyert adatokkal kapcsolatban, de mindenki úgy kezelte [a cikkemet], mint egy tudományos kutatást.

Mit is csináltak?

Szintén nagy probléma, hogy a teljes elemzés gyakran nem hozzáférhető, vagy nehezen reprodukálható, mert a felhasznált módszert nem, vagy csak nagy vonalakban ismertetik. (Mi például ennek az általunk korábban bemutatott vizsgálatnak a részleteit is szeretnénk megismerni...) Ilyen esetben gyakorlatilag csak a közlő sajtótermék tekintélyében bízhatunk – igaz, ez a hagyományos, nem adatorientált újságírás esetében is így van.

Az internet azonban lehetőséget ad arra, hogy a felhasznált adatbázisok, statisztikai módszerek mind-mind közzétehetőek legyenek anélkül, hogy ez más fontos hírek elől venné el a helyet. Sok adatújságíró él ezzel a lehetőséggel: a The Guardian adatújságírás-műhelye például rendre közzéteszi nyers adatait is. A lap munkatársai már több száz, a cikkeknek alapul szolgáló adatbázist tettek elérhetővé, igen változatos témákban. A brit vasútállomások kihasználtságától kezdve a Doctor Who sci-fi tévésorozatban feltűnő ellenségek és gonoszok listájáig igen sokféle adatbázist tölthetünk le saját használatra. (Ez utóbbi többek között az ellenségek motivációit is tartalmazza – gyakori például a „hatalomvágy” és a „főgonoszok szolgálata”.) De ez a gyakorlat messze nem általános, a felhasznált adatok sokszor nem hozzáférhetőek.

Brit vasútállomás egykoron
Brit vasútállomás egykoron
(Forrás: Wikimedia Commons / michaelday_bath / CC BY 2.0)

Már csak azért is érdemes az adatokat nyilvánosságra hozni, mert hátha épp egy olvasó fog előállni a következő nagy felfedezéssel, szemkápráztató szemléltetéssel. Sorozatunkban erre már mutattunk példát – egy brit oknyomozó újságírókból álló csoportosulás amerikai dróntámadásokkal kapcsolatos adataiból mások is készítettek rendkívül hatásos grafikonokat.

Kettős mérce?

Felmerülhet bennünk a kérdés, nem vagyunk-e túl szigorúak az adatújságírókkal szemben. Elvégre a hagyományos tudományban sem igazán szokás mindent közzétenni! Ez azonban változóban van. Már olyan kezdeményezések is megjelentek, amelyek egyenesen köteleznék a tudósokat arra, hogy hozzanak nyilvánosságra mindent. A kimondottan az orvostudományra összpontosító AllTrials például arra törekszik, hogy „minden korábbi és mai klinikai vizsgálatot regisztrálni kelljen, és a teljes módszertani részt és az eredményeket hozzák nyilvánosságra”.

Alapanyagok készítése klinikai vizsgálatokhoz a nyolcvanas években
Alapanyagok készítése klinikai vizsgálatokhoz a nyolcvanas években
(Forrás: Wikimedia Commons / Linda Bartlett)

De miért olyan fontos mindez? – Leginkább azért, mert igencsak torzíthatja a kutatók által levont következtetéseket, ha nem minden vizsgálat eredményei hozzáférhetőek.

Elsuvasztják?

A kutatásmódszertanban fiókproblémának nevezik azt a torzítást, amikor csak a hipotézist megerősítő eredmények látnak napvilágot, a többi „fiókban marad”. A fiókproblémát számos tényező idézheti elő – ilyen például az, hogy a negatív eredmények kevésbé érdekesek, a szakfolyóiratok kevésbé hajlamosak leközölni őket. De az is elősegítheti ennek a torzításnak a megjelenését, hogy a legtöbb kutató nem szereti beismerni, hogy nem arra jutott, amire szeretett volna. Így valósnak tűnhetnek olyan eredmények is, amelyek csak a véletlennek köszönhetően álltak elő, mert a többi, unalmasabb eredményt sosem publikálják.

Másfajta fiókprobléma
Másfajta fiókprobléma
(Forrás: Wikimedia Commons / Maryanne Rodriguez / CC BY 2.0)

Az adatújságírásnak is van fiókproblémája, ráadásul talán még súlyosabb, mint a fentebbi példában szereplő orvostudománynak. A napisajtó sokkal inkább a szenzációkból él, mint a tudományos folyóiratok; ki tudja, mennyi elemzés születik, amit sosem közölnek le. Érdekelne bárkit is, hogy X. Y. politikus nem lop, csal és hazudik? Egy klinikai vizsgálatnak megvan a maga bonyolult procedúrája, nem lehet csak úgy a sufniban nekiállni. Így könnyen lehet mondani azt, hogy minden klinikai vizsgálat kerüljön be egy központi adatbázisba. De ma már az internet tele van nagy adatbázisokkal, egy kis technikai tudással pedig akárki nekiállhat elemezni őket – legközelebb arról is írunk, hogyan...

További olvasnivaló, felhasznált irodalom

Why you should never trust a data scientist
(Not) trusting data

AllTrials
The Guardian: All our datasets

Követem a cikkhozzászólásokat (RSS)
Hozzászóláshoz lépjen be vagy regisztráljon.
Még nincs hozzászólás, legyen Ön az első!
Információ
X