nyest.hu
Kövessen, kérem!

Nem lát minket a Facebookon?

Kenyérpirítón szeretné?

Legutolsó hozzászólások
  • mondoga: @bloggerman77: Igen, azt írtam. De mi ebben a baszogatás? Megadtam helyetted egy linket. K...
    2019. 09. 22, 05:41  Hun‒ugor géntangó
  • bloggerman77: @mondoga: "Ha netán blogi elfelejtene válaszolni..." Ezt írtad, nem? Fejesnek írtad, de en...
    2019. 09. 21, 21:27  Hun‒ugor géntangó
  • mondoga: @bloggerman77: Tanulj meg olvasni, mielőtt kötözködni kezdesz! A Fejesnek címzett válaszom...
    2019. 09. 21, 20:19  Hun‒ugor géntangó
  • mondoga: @bloggerman77: Szállj le rólam, Fejes Lászlónak írtam, nem neked. (Pisa-teszt, óh :D)
    2019. 09. 21, 20:09  Hun‒ugor géntangó
  • Roland2: @Kincse Sz. Örs: Elfoglaltságaim miatt csak rövidebben tudok reagálni:az, hogy - nagyon - ...
    2019. 09. 21, 19:08  Anti-PC shaming
A nyelvész majd megmondja
A legnépszerűbb anyagok
Írjon! Nekünk!
nyest.hu
nyest.hu
 
Egyszer fentre, egyszer lentre

Olvasónk kérdése kapcsán leleplezzük a helyesírás-ellenőrzőket. Ezek valójában nem azt ellenőrzik, hogy a leírt szó helyes-e, hanem azt, hogy létezik-e. Tévedni pedig nem gépi dolog, és ezeket a programokat is emberek készítik – arról nem is szólva, hogy a nyelvtanokat is emberek írják.

Fejes László | 2013. augusztus 8.
|  

Olvasónknak, Marcellnek meggyűlt a baja a helyesírás-ellenőrzővel és egy online helyesírási tanácsadóval is. Lássuk beszámolóját küzdelmeiről:

Ma írtam egy levelet az egyik munkaadómnak, amiben éppen a feladatról kérdeztem, elmondtam a véleményemet. Egy kis holnapot programozok neki, már nemsokára el is készül.

A leveleimet mindig átnézem, találok-e benne hibát, meg kijavítom a böngésző által automatikusan aláhúzottakat is. Egy hasonló tartalmú mondatot írtam:

„A képet azért helyeztem lentre, mert szerintem ott jobban mutat, mint a táblázat mellett.”

Ebben a mondatban aláhúzta a „lentre” szót. Néztem, ezzel ugyan mi probléma lehet, mik a javaslatok, miért húzhatja alá. Se a Firefox, se a Chrome nem ismeri ezt a szót, ellenben a „fentre” szóval nincs semmi problémája. Van bármi tippjük, miért felejthették ki ezt a szót a böngészők helyesírási ellenőrzőjéből, vagy én tudom rosszul, és ez a szó tényleg nem helyes? Ha jól sejtem, nem egyesével írták össze a magyar szavak összes toldalékos alakját, hanem valamiféle algoritmussal ellenőrzik az egyes szavakat.

A legfurcsább talán az, hogy az alábbi oldal sem ismeri e „lentre” szót:

http://helyesiras.mta.hu/helyesiras/default/suggest

Itt szintén helyes a „fentre”, de a „lentre” nem.

Olvasónkat nyelvi intuíciója nem hagyta cserben: a lentre éppúgy helyes, mint a fentre. A párhuzamkeresés módszere egyébként általában jól működik, csak időnként hagy minket cserben: a fel és a föl ugyanazt jelenti, és ugyanaz a felett és a fölött jelentése is – a felé és a fölé jelentése azonban már különböző (természetesen a felé lóg ki a sorból), és a felől mellett nincs *fölől (legalábbis az irodalmi nyelvben – ráadásként még a felől a feléhez áll közel jelentésbelileg, így a a felett ~ fölött – fölé sorból hiányzik a honnan? kérdésre válaszoló alak; vessük csak össze az alatt – alá – alól sorral!). Elgondolkozhatunk például azon, hogy a fentre és lentre mellett miért nincs fennre és lennre – aligha tudunk okosabbat mondani, mint hogy csak.

Hogyan működik a helyesírás-ellenőrző?

Amiben Marcell téved, az az, hogy ha a helyesírás-ellenőrző aláhúzza a szót, akkor az azt jelenti, hogy a szó hibás. Valójában  azt jelenti, hogy a szóalakot a helyesírás-ellenőrző nem ismeri. Így például a szerkesztőségben használt helyesírás-ellenőrző nem ismeri a fenti bekezdésben szereplő jelentésbelileg alakot, de nem ismeri a komment, kommentelő főneveket és a kommentel igét sem. De miért?

Ezt látja a cikkíró...
Ezt látja a cikkíró...

Az olyan programokat, melyek kitalálják, hogy egy betűsor melyik szótári szó milyen alakjának felel meg, morfológiai elemzőknek hívjuk. A helyesírás-ellenőrző magja a morfológiai elemző, de ezt más elemek is kiegészíthetik, például a szintaktikai elemzők, melyek a központozás (vesszőhasználat) szabályainak betartására figyelnek, vagy olyan modulok, melyek az egyes szavak esetleg meg írott szövegbe nem illő stílusértékére figyelmeztetnek.

A helyesírás-ellenőrző úgy dolgozik, hogy van egy szótára, melyben a szótöveket tárolja, és van egy nyelvtana, mely tartalmazza a nyelv toldalékait, illetve azokat a szabályokat, melyek alapján ezek a toldalékok a tövekhez kapcsolhatóak. Ez utóbbi határozza meg, hogy a ragozás (vagy szóképzés, esetleg szóösszetétel) során miként változik a szóelemek alakja. (Az is lehetséges megoldás, hogy a nyelvtant nem használjuk folyamatosan, hanem segítségével előre legeneráljuk az összes lehetséges szóalakot. Nyelvtől is függhet, mikor melyik megoldás a leghatékonyabb, legcélszerűbb.) A helyesírás-ellenőrző nem csinál mást, mint az általunk írt szövegben szereplő szóalakokat összeveti a szótárával és nyelvtanával, és amennyiben a szó nem szerepel a szótárban, és az abban szereplő tövekből és a toldalékokból sem tudja összerakni, akkor aláhúzza az alakot. A fenti példák esetében például valószínűleg azért nem ismeri fel az alakokat, mert nem ismeri a -belileg képzőkombinációt, illetve a komment (sem a kommentel, sem a kommentelő) tövet.

Sajnos azonban nem csupán azokat a szóalakokat utasítja el a helyesírás-ellenőrző, melyeket nem ismer, hanem elfogadja azokat is, melyeket ismer, függetlenül attól, hogy az adott helyzetben azok helyesek-e. Például a helység és a helyiség szavak megkülönböztetése a magyar helyesírás érzékeny pontja: sokan szeretnek lecsapni a kettő keverésére (bár ennek gyakorisága éppen azt mutatja, hogy a két szót a nyelvhasználók többsége nem különbözteti meg, akik pedig igen, azok is azért, mert helyesírásból ezt tanították nekik: a két szó a beszédben gyakorlatilag megkülönböztethetetlen). Fontos lenne tehát annak ellenőrzése, hogy a szövegalkotó a megfelelő formát használta-e, de ennek automatizálása gyakorlatilag lehetetlen. A  szövegkörnyezet segítségével a számítógép ugyan megpróbálhatná kitalálni, hogy melyik alak illik az adott helyre, de ez a módszer sem lenne tökéletes. Az egyetlen jó megoldás az lenne, ha a helyesírés-ellenőrző bármelyik alak előfordulása esetén figyelmeztetne minket, hogy a helység alak csak akkor helyes, ha településre gondoltunk,  a helyiség pedig csak akkor, ha egy épület belső, elválasztott részére.

Ez talán praktikus megoldásnak tűnik, de rendkívül munkaigényes, hiszen a fejlesztőnek valamilyen szabályt, tanácsot kell írnia az összes összekeverhető alakkal kapcsolatban: márpedig ezeket még megtalálni is nehéz. Ráadásul képzeljük el, ha – Mártonfi Attila egy példájával élve – a gólya szó leírásakor a gép mindig figyelmeztetne minket, hogy ez csak akkor helyes, ha a madárra gondoltunk: amennyiben valakinek a gó játékára, vagy nem zsidó származású ismerősére, abban az esetben a gója alak a helyes. Valójában tehát az eredmény akkor is inkább bosszantó, mint hasznos lenne, ha a fejlesztő mindenre gondol.

Ezért mondják a szakemberek, hogy a helyesírás-ellenőrző nem is a helyesírás ellenőrzésére, csupán az elgépelések kiszűrésére szolgál. Persze erre sem tökéletes: e sorok írója például gyakran gépeli a lenen betűsort a lenne helyett: mivel azonban a lenen értelmes szóalak (a len ragozott alakja), a helyesírás-ellenőrző nem segít.

Len
Len
(Forrás: Wikimedia Commons / Hans Hillewaert /v CC BY-SA 3.0)

Fentre és lentre

Ha mindezzel tisztában vagyunk, könnyen kitalálhatjuk, mi lehet a Marcell által jelzett probléma oka. Ehhez azonban észre kell vennünk, hogy sajátos esettel van dolgunk. A lentre szó egy tőből és egy esetragból áll: lent + -re. A felsorolt szóalakokat csak metanyelvi használatban ragozzuk így, azaz akkor, amikor magáról a szóról van szó: A szótárból kifelejtették a lentet; A szótár első kötete a lentig tart; A lentben csak egy magánhangzó van stb.Ilyen módon azonban minden, egyébként nem ragozható szó is ragozható (Az isről is beszéltünk), vagy akár ragozott szóalakokhoz, akár igékhez is fűzhetünk esetragokat (A szerző már megint elgépelte a lennét). Csakhogy ehhez a tőhöz a legtöbb esetragot nem tudjuk kapcsolni: nincs *lentet, , *lenten, *lentben, *lentbe, *lentből, *lentnél, *lenthez, *lenttől, *lentig, *lentként stb. Inkább az a kivételes, hogy a szóhoz valamilyen esetrag kapcsolódhat: lentről, lentre. (A szerkesztőségi helyesírás-ellenőrző a lentről alakot ismeri, a lentre alakot nem.)

A hagyományos (iskolai) nyelvtan ezt úgy magyarázza, hogy a lent nem névszó (nem főnév, melléknév vagy számnév, illetve ilyen „természetű” névmás vagy igenév), márpedig esetragok csak névszókhoz járulhatnak. Azt, hogy a lent nem főnév, az is igazolja, hogy ragtalan alakja a mondatban nem alanyként jelenik meg, mint a névszók (főként főnevek) esetében szokás, hanem olyan funkcióban, melyet a főnevek inkább ragos vagy névutós alakjukban szoktak betölteni: A kép lent van (vesd össze: A kép a falon / a házban / az óra alatt van). Éppen ezért a lent szót egy olyan szófajba sorolják, melyet határozószónak neveznek. A határozószó egyik jellemző tulajdonsága, hogy nem ragozható.

A helyesírás-ellenőrzők fejlesztői jobb módszer híján a szótöveket olyasmi kategóriákba sorolják, mint a hagyományos nyelvtan szófajai. Bár a lent szót a helyesírás-ellenőrző (pontosabban a benne levő morfológiai elemző) ismeri, úgy tudja róla, hogy nem ragozható – ezért nem képes rájönni, hogy a lentre szó a lent tőből és a -re toldalékból áll.

De mi a helyzet a fentre esetében? A helyesírás-ellenőrző nyilván ismeri a fent szót, bizonyára határozószónak tartja, hogyan ismeri fel mégis a fentre alakot? Nos, nem látunk bele, de nagyobb összeget tennénk arra, hogy ismeri a fentre határozószót is. Így, önálló határozószóként, semmit nem tudva arról, hogy a fentre szó a fent tőből és a -re toldalékból áll.

Ha ez így is van, olvasóink joggal kérdezhetik: miképp lehetséges, hogy a fentre alak szerepel a helyesírás-ellenőrző szótárában, a lentre viszont nem? Ha a fejlesztőknek eszükbe jutott, hogy az előbbit felvegyék a szótárba, az utóbbit miért nem vették fel? Nos, ismét csak tippelhetünk. A fejlesztők valószínűleg nem úgy dolgoztak, hogy végiggondolták, milyen ragos alakjaik vannak a határozószóknak, hanem nagy mennyiségű szöveget áttekintettek, és azokból kigyűjtötték az olyan szavakat, melyeket az elemző nem tudott megelemezni, de jó szavaknak tűntek. Nos, ebben az anyagban előfordult a fentre, de nem bukkant fel a lentre alak... Ezt a magyarázatot azonban gyengíti, hogy a lentre alak a Google szerint sokkal gyakoribb, mint a fentre és a föntre együtt!

(Nem annyira) független források

Már csak egy kérdést kell tisztáznunk: miként lehetséges, hogy mind a Firefox, mind a Chrome, de még az említett helyesírási tanácsadó portál is pontosan ugyanúgy hibázik. Innen már kézenfekvő a megoldás: gondolhatjuk, hogy nem sok magyar morfológiai elemzőt fejlesztettek eddig magyar nyelvre, és mindegyik alkalmazás hátterében ugyanaz a helyesírás-ellenőrző fut.

Követem a cikkhozzászólásokat (RSS)
Hozzászóláshoz lépjen be vagy regisztráljon.
6 Szalakóta 2013. augusztus 12. 20:02

Egyszer azon vitatkoztunk, hogy a melléknevekhez tett -án, -én, és hasonló végződések ragok, vagy képzők, amelyek a melléknevekből határozószavakat képeznek? Például a gyorsabban, magasabbra, erősebbre szavak szófaját szeretném meghatározni.

5 gorilla 2013. augusztus 9. 14:29

Sőt nem is olyan ritka az a fölül, hiszen a mögül alakot is így képezzük.

fölé - fölött - fölül

mögé - mögött - mögül

felé - felett - felől

megé - megett - megől (nyelvjárási)

OFF: Aztán a névutókon kívül vannak még a sima határozószók, mint a "hátul". Ezek is érdekesek. Az -ul/-ül helyett "elöl" van (nem úgy mint hátul, alul, felül, belül, kívül). Ez szerintem egyébként csak helyesírási dolog, meg akarták különböztetni a "menekül valaki elől"-beli elől-től, pedig valószínűleg ez egy másik nyelvjárásból származik. Például nagymamám alul helyett is "alól"-t mond ("alol"-t?).

4 El Vaquero 2013. augusztus 9. 13:49

@Grant kapitány: pedig szerintem igaza van. Az ilyen gyakran tévesen, felcserélve használt alakoknál szólhatna az ellenőrző, hogy valóban azt akarta-e a felhasználó írni. Legfeljebb akit idegesítene, kikapcsolná a beállításoknál.

3 Grant kapitány 2013. augusztus 9. 13:36

"Az egyetlen jó megoldás az lenne, ha a helyesírés-ellenőrző bármelyik alak előfordulása esetén figyelmeztetne minket, hogy a helység alak csak akkor helyes, ha településre gondoltunk, a helyiség pedig csak akkor, ha egy épület belső, elválasztott részére."

Téged kellett volna figyelmeztetni, hogy a "helyesírés" hibás alak. Másrészt abban nincs igazad, hogy a "helyiség" csak az "épület" belső, elválasztott részét" jelentheti. Ha így lenne, nem lehetne kerthelyiségről beszélni.

2 gorilla 2013. augusztus 9. 12:23

"így a a felett ~ fölött – fölé sorból hiányzik a honnan? kérdésre válaszoló alak"

Nem hiányzik, csak úgy tűnik rendhagyó változás történt és itt az -ül fejezi ki a honnant. Gyors gugli a "fölül"-re:

"Elbontják a házat a feje fölül"

"Felhők fölül jön a Google-internet"

"csak a glória hiányzik a feje fölül"

"Visszafordult egy Air France Airbus az Atlanti-óceán fölül"

1 Sultanus Constantinus 2013. augusztus 8. 19:37

De akkor ugyanez lenne a helyzet az alulra, alulról, felülre~fölülre, felülről~fölülről alakokkal is, mivel ezek is határozószók.

Egyébként nem tudom, hogy a kérdező milyen verziójú programokat használt: a Word 2010 elfogadja a lentre, fentre, lentről, fentről, alulra, alulról, felülre, felülről és fölülről alakokat is, egyedül a fölülre alakot húzza alá, a Firefox 22 ezek közül csak a "lentre" alakot nem ismeri.

"A határozószó egyik jellemző tulajdonsága, hogy nem ragozható."

Ez nagyon nem igaz: itt van pl. a ma, mára, mától, mához, időhatározó, tegnap, tegnapra, tegnaptól, tegnaphoz, itt, innen, innentől, ott, onnan, onnantól stb. stb. És ez nem csak a magyarra igaz, a hasonló jelentésű határozószók más nyelvekben is "ragozhatóak", vagy nevezzük úgy, hogy állhatnak függő esetben. Ha a hivatalos nyelvtan ezt állítja, akkor ez elég nagy baklövés...

Információ
X