-
Sándorné Szatmári: @ganajtúrós bukta: 22 A Google szerint további hasonló kifejezések (nem csak iskolában, bá...2024. 07. 23, 16:23 „Mert nincs rá szó, nincsen rá...
-
ganajtúrós bukta: Régi topik azért válaszolok hátha valaki visszaír... Talán: Szekálás, abuzálás, oltogatás,...2024. 07. 23, 13:34 „Mert nincs rá szó, nincsen rá...
-
Sándorné Szatmári: @Sándorné Szatmári: kiegészítés: A nyelvi bizonytalansági tényezők (amik annál gyakoribbak...2024. 07. 01, 08:12 Fantomok a magyar szavakban
-
Sándorné Szatmári: @szigetva: 117 Valóban.. A "Fedje meg!" parancs hosszú gy-vel--->hatása: "megfedd valak...2024. 06. 29, 12:28 Fantomok a magyar szavakban
-
szigetva: @Sándorné Szatmári: Nyilván a sok ostobaság mennyiségével akarsz dominálni. Annyit azért v...2024. 06. 29, 08:35 Fantomok a magyar szavakban
Kálmán László nyelvész, a nyest szerkesztőségének alapembere, a hazai nyelvtudomány és nyelvi ismeretterjesztés legendás alakjának rovata volt ez.
- Elhunyt Kálmán László, a Nyelvész, aki megmondja
- Így műveld a nyelvedet
- Utoljára a bicigliről
- Start nyelvstratégia!
- Változás és „igénytelenség”
Kálmán László korábbi cikkeit itt találja.
![](/media/news-depesmod.png)
Ha legutóbb kimaradt, most itt az új lehetőség!
Ha ma csak egyetlen nyelvészeti kísérletben vesz részt, mindenképp ez legyen az!
Finnugor nyelvrokonság: hazugság
A határozott névelő, ami azt jelenti, hogy ‘te’
Az oroszok már a fejünkön vannak!
Furcsa jelenségeket produkál a Google Books NGram Viewer: egyes szavak 1820 körül eltűnnek, mások megszaporodnak, megint mások hosszú időre eltűnnek, hogy aztán később ismét igen gyakoriakká váljanak. A nyelvtörténet játszik szeszélyes játékot, vagy másról van szó?
Akik játszani kezdtek a Google Books Ngram Viewerével, bizonyára hamar rákerestek olyan szavakra, melyek általában közérdeklődésre tartanak számot. Ilyen például az f-word, az f betűs szó, melyet beszédben sem illő használni, leírni pedig még nagyobb illetlenség. Ám úgy tűnik, 1800-ban még nem volt az, viszont 1820-ra gyakorlatilag eltűnt. Aztán az 1950-es években megint megjelent, és hirtelen elkezdett szaporodni. A folyamat végét értjük: a nyelvhasználat kötetlenebbé vált, s bár a szó továbbra is durvának számított, a társadalom tűrőképessége megváltozott, a korábban tabunak számító szavak könnyebben bekerültek a könyvekbe is. A folyamat eleje azonban nem világos. A szó korábban nem számított durvának? Vagy korábban kevésbé voltak szemérmesek az írók? A választ akkor kapjuk meg, ha néhány más szó statisztikáját is megvizsgáljuk.
![A cafe és a case gyakorisága](/media/a-cafe-es-a-case-gyakorisaga.png)
Vessük össze a cafe 'kávéház' és a case 'eset' szavakat. Azt várnánk, hogy az utóbbi sokkal gyakoribb, és ez így is van: azonban az ábra azt mutatja, hogy 1800-ban még gyakrabban fordult elő a 'kávéház', mint az 'eset'. Ez azért mégis fura. De vegyünk egy másik példát!
![A fame és a same gyakorisága](/media/a-fame-es-a-same-gyakorisaga.png)
Hasonlót figyelhetünk meg a fame 'hírnév, dicsőség' és a same 'ugyanaz' szavak esetében: bár azt várnánk, hogy az utóbbi sokkal gyakoribb, 1800 előtt sokkal ritkább.
![A lift és a list gyakorisága](/media/a-lift-es-a-list-gyakorisaga.png)
A következő példánk a lift 'felemel' (ill. 'fuvar', 'lift' stb.) és a list 'lista' szó előfordulásait hasonlítja össze. Itt is azt találjuk, hogy a sorrend 1800 körül megfordul.
Mire következtethetünk? Az ábrák egyértelműen azt mutatják, hogy 1800 körül történt valami. Talán megváltozott az angol nyelv? A másik, ami feltűnhet, hogy a vizsgált szópárok mindegyike abban különbözik, hogy az egyikben f van ott, ahol a másikban s. Nem csigázzuk tovább a kedélyeket, és eláruljuk a megoldást.
Az angolban (akárcsak a magyarban) az s betűnek volt egy másik alakváltozata is, az ſ (long s, azaz 'hosszú s'). A 18. századig ezt jóval gyakrabban használták, mint az s-t. 1800 körül azonban egyre gyakrabban használták az s-t, annyira, hogy 1820-ra az ſ gyakorlatilag teljesen eltűnt.
![A hosszú s használati gyakorisága angol angol szövegekben](/media/a-hosszu-s-hasznalati-gyakorisaga-angol-angol-szovegekben.png)
(Forrás: Wikimedia commons)
A szomorú igazság tehát az, hogy a Google Books Ngram Viewer nem minden esetben megbízható. Azt persze eddig is sejthettük, hogy a korpusz nem tökéletes, vannak benne szkennelési és karakterfelismerési hibák, de általában bízhatunk abban, hogy az ilyen hibák véletlenszerűek, és a nagy számok törvénye miatt az eredményt jelentősen nem befolyásolják. Jelen esetben azonban a Google szakemberei nagy hibát követtek el: egyáltalán nem vették figyelembe az ſ betűváltozat létét, és a karakterfelismerő program az összes ilyen betűt s helyett f-ként ismerte fel. Ez azt jelenti, hogy a Google Books Ngram Viewer az s betűt tartalmazó szavak gyakoriságát alulbecsüli, viszont az f betűt tartalmazókét – ha van hasonló szó, melyben s van – felül.
Könnyű azt is kitalálni, hogy a korai adatokban valójában nem az f betűs szó áll, hanem a suck 'szop, szív'. Persze ennek is van kevéssé szalonképes használata, de feltételezhetően nem ezek adják a nagy mennyiséget.
Forrás