nyest.hu
Kövessen, kérem!
Legutolsó hozzászólások
A nyelvész majd megmondja
A legnépszerűbb anyagok
Írjon! Nekünk!
nyest.hu
nyest.hu
 
Mindennapi előítéleteink
Minden nőre legalább két férfi jut a Budapest-Moszkva-Strasbourg háromszögben

Vajon férfi vagy női neveket említenek gyakrabban az internetes magyar sajtóban? Melyik magyar település szerepel legtöbbször az online térben? A világ mely részeiről kapunk híreket? És mindez miért fontos egyáltalán? Több mint százezer cikket vizsgáltunk meg alaposan, hogy ezekre a kérdésekre kimerítő választ tudjunk adni.

Putz Orsolya, Varjú Zoltán | 2019. szeptember 4.
|  

A hazai média hírei alapján úgy tűnik, hogy mindent a férfiak irányítanak. De vajon mit mondanak az adatok? A Crow Intelligence kutatói egy több mit százezer cikkből álló, a jelen sajtó nyelvének állapotát jól tükröző korpuszt, vagyis szövegállományt hoztak létre. Ennek vizsgálata után elmondható, hogy a megérzéseink bizony nem csalnak.

Az adatok ugyanis egyrészt azt sugallják, hogy a magyar online médiában minden említésre méltó esemény az északi félgömbön történik. A jelek szerint nem sok információ juthatott el hozzánk arról, hogy Afrikában, Ázsiában, vagy Dél-Amerikában mi történt az elmúlt időszakban, Óceánia pedig teljesen kimarad a világról szóló hírekből. A hazai tudósításokból továbbá valóban az olvasható ki, hogy nálunk mindent a férfiak mozgatnak. De nézzük meg a számokat kicsit közelebbről.

Közismert férfiak, kevésbé ismert szakácsnők

A cikkekben több mint kétszer annyiszor olvashatunk a férfiakról szóló híreket, mint a nőkről. A korpuszban ugyanis 52.836 alkalommal említenek női nevet, míg 126.475 alkalommal férfit. Ahogyan számítottunk is rá, a férfiak esetében legtöbbször politikusok, közszereplők kerülnek a figyelem középpontjába. 

A férfiak körében Orbán Viktor elsősége megkérdőjelezhetetlen, hiszen az általunk vizsgált időszakban végig igen aktív politikus volt. Simicska Lajos második helyezése annál furcsább. A híres G-nap (2015. február 6.) előtt összesen 734 említést számolhatunk a 3519-ből,  a maradék csaknem 3000-et az ominózus nap után. Hasonló a helyzet Soros Györggyel, akit 2014 előtt mindössze 301 alkalommal említenek a korpuszban, míg 2014 után 989-szer. Ennek oka lehet az is, hogy a korpusz jelentős része az elmúlt négy évből származik. Összehasonlításképpen megvizsgáltuk Orbán Viktor említéseit, és azt tapasztaltuk, hogy az ő esetében viszonylag egyenletes az eloszlás.

A női neveket vizsgálva meglepetéssel tapasztaltuk, hogy csupa elsőre ismeretlen név tűnt fel listánkon. Ezeket alaposabban tanulmányozva arra jutottunk, hogy viselőik jelentős része a különböző vidéki lapok receptrovatainak aktív beküldői közül kerül ki, ezeket a neveket alábbi listánkon nem szerepeltetjük. Ha bent maradtak volna a lelkes szakácsok, akkor az első ötven női név közé egyedül Kálmán Olga fért volna be a második helyen!

A nők esetében így Kálmán Olga az abszolút listavezető, aki az 1060 említésből kereken 1000 darabot szerzett 2019-ben. Schmidt Mária és Handó Tünde 2012 után tűnt fel a korpuszban, hat év alatt viszont egész szép számú említést sikerült összeszedniük, kétharmad részben az Index, a 444 és a Magyar Narancs oldalain megjelent írásoknak hála. Érdekes, hogy a listán szereplő női politikusok többsége ellenzéki (pl. Szél Bernadett, Dobrev Klára, Demeter Márta, Kunhalmi Ágnes, Lendvai Ildikó), a kormánypárthoz köthető hölgyek inkább közéleti szereplők és politikusok feleségeként, családtagjaként tűnnek fel (pl. Vajna Tímea, Rogán Cecília, Orbán Ráhel). Felkerült a listára Nagy Katalin neve is. Ebben az esetben azonban több személyről van szó, akiket nem tudtunk automatikusan elkülöníteni. Legalább három különböző Nagy Katalint sikerült azonosítanunk: 1) vidéki lapokban megszólaló személy, 2) egy újságíró  és 3) II. Nagy Katalin orosz cárnő viseli ezt a nevet korpuszunkban. És hogy hogyan került Mária Terézia a top 50-be? Említéseinek kétharmada a HVG-nek és a nyestnek köszönhető, és minden esetben egyértelmű a történelmi kontextus. A férfiakkal ellentétben a női listán találhatunk sportolókat, közírókat és celebeket is. Úgy tűnik tehát, hogy bár sokkal kevesebb alkalommal említenek nőket a vizsgált oldalak, sokkal több szerepben láttatják őket.

Európa túlsúlya

A személyek után lássuk, milyen helyekről írnak a leggyakrabban az újságírók. A lokációk gyakorisági listájára pillantva Budapest elsősége egyáltalán nem meglepő eredmény, míg Moszkva és Strasbourg előkelő pozíciója annál inkább. Korpuszunkban kutakodva azt találtuk, hogy az orosz főváros szinte mindennap bekerül a külpolitikai rovatokba. Mivel Strasbourgban székel az Európai Parlament és az Emberi Jogok Európai Bírósága, a város neve kül- és belpolitikai írásokban bukkan fel nagyon gyakran. A ma már Széll Kálmán térnek hívott Moszkva tér negyedik helyezését annak köszönheti, hogy 2011-ben a tér átnevezése kapcsán rengeteg írás született, a Budai vár és a Városliget hasonló okok miatt került az élmezőnybe. Mivel a vizsgált korpuszban a megyei lapok jól reprezentáltak, a nagyobb vidéki városok is belefértek a top ötvenbe, viszont ha csak az országos sajtót vizsgálnánk, akkor csupán Debrecen, Szeged és Miskolc kerülne fel a listára.

Adatvizualizációnkon minden olyan helynév felkerült a földgömbre, amelyet legalább 20-szor említenek a vizsgált szövegekben. Előfordult, hogy a helyszínek olyan közel vannak egymáshoz, hogy egy pontra estek volna. Ezekben az esetekben a vizualizációhoz használt algoritmus random módszerrel széthúzta a pontokat. Látható, hogy kicsiny hazánk kiemelkedik a sokaságból, különösen Budapest és városrészei. Európai viszonylatban főleg Németország és az Egyesült Királyság városai vannak erőteljesen jelen, Afrika két helyszínnel (Tripoli és Nairobi), a Közel-Kelet három (Tel-Aviv, Teherán, Dubaj), a Távol-Kelet nyolc (Mumbai, Bangkok, Hong Kong és Peking, Bali, Hokkaido, Fukuyama és Nakama) helyszínnel szerepel, ebből kettő kínai, három pedig japán város. Dél-Amerikából egyedül Rio de Janeiro került a toplistára. Észak-Amerikából New York említése a legmagasabb, ezt követi Washington és Hollywood. Ausztrália Melbourne, Sydney és Darwin városokkal képviselteti magát, Új-Zélandról csupán Christchurch került a listára, a márciusi terrortámadás miatt.

Meglepő, de a menekültválság kapcsán közel-keleti helynevek nem igazán merültek fel, csak az  országok neve és nemzetiségre utaló melléknevek. Viszont annál népszerűbbek a témához kapcsolódó német és magyar településnevek a cikkekben. Szeged kivételével az összes olyan magyar település, amely Magyarország déli határánál fekszik, kizárólag 2013 és 2015 közötti cikkekben szerepel.

A miértek

Aki kizárólag az elemzett cikkek alapján akarná megtudni, milyen a világ, abban meglehetősen torz kép alakulna ki róla. A fentebb vázolt jelenségek hátterében számos ok húzódhat, melyeken érdemes elgondolkodni, mielőtt az újságírókat önkritikára köteleznénk: Hol tart ma a női egyenjogúság ügye hazánkban? Mennyire vagyunk nyitottak a külvilágra? Lehetséges, hogy a világ iránt érdeklődő hírfogyasztók inkább külföldi oldalakat látogatnak? A kérdéseken elgondolkodva, azok alapján érdemi vitát folytatva talán közelebb juthatunk hazánk aktuális társadalmi kérdéseinek megértéséhez is.

Módszertan és adatok

Hogy képet kapjunk az online sajtó nyelvéről, először meghatároztuk azon oldalak körét, amelyekről adatokat gyűjtünk. Hosszas tanakodás után arra jutottunk, hogy 45 oldalt fogunk vizsgálni, melyek vagy országos és megyei lapok online kiadásai, vagy teljes egészében online kiadványok. A vizsgált oldalak listája ezen a linken érhető el. A gyűjtés során az oldalakon található belső linkeket követtük, azaz nem foglalkoztunk a más oldalakra mutató linkekkel. Ezzel a módszerrel 102240 cikket kaptunk. A gyűjtés 2019.07.02 és 07.03 között zajlott, a legyűjtött cikkek 2003.03.17. és 2019.07.02. között jelentek meg. A legyűjtött tartalom 65%-a 2018.01.01. után keletkezett. További 15% 2015.01.01. és 2017.12.31. között, a maradék 20% 2003.03.17 és 2014.12.31. között.

A hatalmas adatmennyiségben búvárkodva ezúttal nem arra voltunk kíváncsiak, hogy miről szólnak a hírek, hanem arra, hogy kiről. Ehhez először meg kellett találnunk a névelemeket az óriási szövegtengerben. Úgy döntöttünk, hogy annak érdekében, hogy a lehető legtöbb személy- és földrajzi nevet megtaláljuk, saját névelemfelismerőt trénelünk. A férfi és női nevek felismeréséhez az MTA Nyelvtudományi Intézete által anyakönyvi bejegyzésre alkalmasnak minősített utónevek jegyzékét használtuk. Kizárólag a teljes magyar neveket vettük számba, a vezeték- és keresztnév említéseket nem számoltuk. 

Nehezebb feladatnak bizonyult a helynevek automatikus felismerése. Ennél a lépésnél kettős stratégiát alkalmaztunk: egyrészt a saját névelemfelismerőnket vetettük be, másrészt az OpenStreetMap adatbázisában szereplő helynevek előfordulását számoltuk a korpuszban. A problémát az az egyszerűnek tűnő feladat okozta, hogy automatikusan rendeljünk geokoordinátákat egy-egy helynévhez. Mivel Budapest nevű település akad Magyarországon és az Egyesült Államokban is, így gépileg nem egyértelmű a döntés, hogy mikor, melyik Budapestről van szó. Néha még az emberen is kifog ez a feladat. Az ilyen helyzeteket úgy oldottuk meg, hogy a több lokációhoz tartozó helyneveknél minden esetben kijelöltünk egy fő elemet és csak annak koordinátáit rendeltük hozzá a vizualizációhoz. Így esetünkben például Budapest minden esetben a magyar fővárost jelöli. Az országok és földrészek neveivel nem foglalkoztunk, ellenben az települések, településrészek, országrészek (pl. megyék) neveivel igen.


A vizualizáció külön linken itt érhető el.


A cikk szerzői a Crow Intelligence kutatói.

Követem a cikkhozzászólásokat (RSS)
Hozzászóláshoz lépjen be vagy regisztráljon.
1 Sultanus Constantinus 2019. szeptember 4. 17:48

Én még hozzátettem volna azt is, hogy a "déli féltekével" (vagyis pontosabban a latin-amerikai és az egyéb, nem befolyásos országokkal) kapcsolatban is legfőképpen csak a negatív eseményekről írnak, ami még inkább növeli a megvetést az egyébként is előítéletes magyar média és társadalom körében ezekkel az országokkal/népekkel szemben.

Információ
X