-
Sándorné Szatmári: @Sultanus Constantinus: 1 " egy magyar anyanyelvű sosem fog olyat mondani, még véletlenül ...2024. 12. 09, 15:55 Az anyanyelvi beszélő nyomában
-
Sándorné Szatmári: @nasspolya: (Hátha ennyi idő után még elolvasod..) -29-ben ezt írtad: ".... mi a pontos kü...2024. 11. 23, 12:47 A nyitás tárgya
-
szigetva: @Sándorné Szatmári: Kétségtelen, hogy majd ha tudunk valamit a jelenleg ismertnél korábbi ...2024. 11. 22, 14:33 Szótekerészeti agybukfenc
-
Sándorné Szatmári: @szigetva: 14 "..az állítólagos "ősnyelvről" azért könnyű bármit (és annak az ellenkezőjét...2024. 11. 22, 14:17 Szótekerészeti agybukfenc
-
szigetva: @Sándorné Szatmári: Kérlek, fejezd be a hülyeséget. Egyszer-kétszer talán vicces, de most ...2024. 11. 13, 12:05 Szótekerészeti agybukfenc
Kálmán László nyelvész, a nyest szerkesztőségének alapembere, a hazai nyelvtudomány és nyelvi ismeretterjesztés legendás alakjának rovata volt ez.
- Elhunyt Kálmán László, a Nyelvész, aki megmondja
- Így műveld a nyelvedet
- Utoljára a bicigliről
- Start nyelvstratégia!
- Változás és „igénytelenség”
Kálmán László korábbi cikkeit itt találja.
Ha legutóbb kimaradt, most itt az új lehetőség!
Ha ma csak egyetlen nyelvészeti kísérletben vesz részt, mindenképp ez legyen az!
Finnugor nyelvrokonság: hazugság
A határozott névelő, ami azt jelenti, hogy ‘te’
Az oroszok már a fejünkön vannak!
A Massachusetts Institute of Technology két kutatója igen érdekes felfedezést tett, kísérletük eredménye néhány napja kering a Facebookon. De mire mutat rá az eset?
Manapság a fordítóprogramok főként statisztikai alapon működnek: fognak egy nagy szöveggyűjteményt (korpuszt), melyben ugyanazok a szövegek szerepelnek mind a két nyelven. Ezután egy algoritmus megpróbálja „megtanulni”, hogy az egyik nyelv szavainak milyen szó vagy szavak felelnek meg a másik nyelvben, illetve milyen környezetben, alakban stb. Amikor pedig a programmal fordítunk, akkor ami történik, az nem is igazán fordítás, hanem azt kapjuk meg, hogy a gép szerint az általa ismert szövegek alapján mi a legvalószínűbb: egy ember hogyan fordítaná le a szöveget.
Az oldal az ajánló után folytatódik...
Vannak azonban olyan esetek, amikor az emberi fordító nem tudná eldönteni, hogyan is fordítsa az adott szót, mivel a forrásnyelv nem fejez ki egy olyan jelentésbeli vonást, amelyet a célnyelven feltétlenül ki kell fejezni. (Régi nyelvészeti közhely, hogy a nyelvek nem abban különböznek, hogy mit lehet rajtuk kifejezni, hanem hogy mit kell.) Az angolban például van nyelvtani nem, de ezt gyakorlatilag kizárólag az egyes szám harmadik személyű névmással fejezik ki: he ’ő (hímnem)’, she ’ő (nőnem)’, it ’az (semlegesnem)’ (a sorrend nem értékítéletet fejez ki, hanem hagyományosan ebben a sorrendben szokás felsorolni ezeket a szavakat). Ezzel szemben például a héberben a második és harmadik személyű, egyes és többes számú személyes névmások is jelzik a nemet, sőt, a melléknevek és a jelen idejű igék is. Az oroszban az angolhoz hasonlóan csak az egyes szám harmadik személyű névmások különböznek, de a héberhez hasonlóan a melléknevek és bizonyos igealakok (a múlt idejűek) szintén jelölik a nemet (igaz, csak egyes számban).
Mindebből az következik, hogy bizonyos angol mondatokról nem tudhatjuk, hogy azok férfiakra vagy nőkre vonatkoznak-e. Ilyenek például azok a mondatok, melyeknek alanya az I ’én’ személyes névmás. Ha egy tolmácsot kérünk meg ennek lefordítására, többféleképpen viselkedhet: ha tudja, ki a mondat alanya, akkor annak megfelelően fordíthatja, esetleg visszakérdezhet, vagy több megfelelő fordítást is adhat, vagy közölheti, hogy megfelelő információ hiányában nem tud megoldással szolgálni. De az is lehet, hogy óvatlanul a nemekre vonatkozó sztereotípiáit építi be a fordításba: az autószerelésről szóló mondatot önkéntelenül hímnemű alakokkal, a mosogatásról szólót nőnemű alakokkal fordítja. De mit csinál egy fordítóprogram, amelyiktől a felhasználó azonnali, egyféle és határozott megoldást vár?
Hadas Kotek, a Massachusetts Institute of Technology (MIT) harmadéves nyelvészet és filozófia szakos MA-hallgatója a Google fordítóprogramjával kísérletezett. Összeállított néhány mondatpárt, melynek hasonló jelentése van, de amelyekről különböző okokból feltételezhető, hogy egyikük főszereplőjét sztereotipikusan inkább nőnek, másikukat inkább férfinak gondolnánk. Meglepő vagy sem, a fordítóprogram pontosan elvárásaink szerint viselkedett. Hadas Kotek eredetileg az angolról héberre fordítást vizsgálta, az alábbi ábrán az angolról oroszra fordítás eredményét látjuk. A képet David Pesetsky, az MIT nyelvészprofesszora készítette.
Megfürdettem a kutyát. | Megfürdettem a gyerekeket. |
Kitakarítottam a garázst. | Kitakarítottam a házat. |
Hülye voltam. | Csúnya voltam. |
Nevettem. | Kuncogtam. |
A gyárban dolgoztam. | Az iskolában dolgoztam. |
Húst ettem. | Salátát ettem. |
Matematikát tanultam. | Művészetet tanultam. |
Imádtam dolgozni. | Imádtam táncolni. |
Építettem egy házat. | Varrtam egy ruhát. |
A bal oldali oszlopban szereplő mondatokat a Google fordítója következetesen hímnemben, a jobb oldaliakat nőnemben fordítja. Miért? Természetesen statisztikai alapon. A fordítónak ugyanis fogalma sincs olyan grammatikai kategóriákról, mint a nyelvtani nem. Azt, hogy az igének milyen alakba kell kerülnie, úgy dönti el, hogy megvizsgálja, hogy (az adott alany mellett) az ige milyen alakban fordul elő gyakrabban. A fordító mindössze azt mutatja, hogy nők gyakrabban írják magukról, hogy kuncogtak, de ritkábban, hogy matematikát tanulnak, mint a férfiak.
Szexista a Google fordítója? Szó sincs róla! A fordítóalgoritmus még arra is képtelen, hogy elkülönítse egymástól, mik a statisztikákban megjelenő nyelvi tulajdonságok, és mik a bennük megjelenő nyelven kívüli információk. Tulajdonképpen azt is mondhatjuk, hogy a fordító éppen így működik jól, hiszen azt a fordítást adja meg, amelyikre nagyobb valószínűséggel lesz szükségünk – legalábbis az általa ismert adatok alapján.
Rendben, de akkor miért nevezünk egyes embereket mégis szexistáknak? Ha valaki egy mesekönyvet ír, és abban apa újságot olvas, míg anya főz, ráadásul a történet szerint mindez a dolgok természetes rendje, biztos, hogy ki fogja váltani egyesek felháborodását. Az illető nyugodtan védekezhet azzal, hogy – legalábbis az ő tapasztalata szerint – ez a tipikus, nem is írhatna mást.
Ez a védekezés részben megalapozott, mégsem fogadható el. A Google fordítója egy gép, amely nem ismeri fel az egyes statisztikai adatok társadalmi jelentőségét. Az meseíró azonban ember, akinek lehetősége van felmérni, hogy az általa leírt, akár valóban tipikus jelenségek mennyire rendjén valók. Lehetősége van ezeket a tipikusnak megfelelően, de kritikusan, akár ironikusan ábrázolni – vagy szándékosan szembemenni a tipikussal, és megmutatni azt, hogy a sztereotípiák legfeljebb a jellemzőt, de nem az egyedüli lehetségest vagy a követendő példát mutatják. Az embernek van ilyen felelőssége, a gépnek nincs.