nyest.hu
Kövessen, kérem!
Legutolsó hozzászólások
A nyelvész majd megmondja
A legnépszerűbb anyagok
Írjon! Nekünk!
nyest.hu
nyest.hu
 
Európának és neked
Az összes fordító egy helyen: itranslate4.eu

A jelenleg az interneten elérhető tartalmak nagy része idegen nyelven íródott, ezért is van szükségünk gépi fordítókra. Az Európai Unió támogatásának és lelkes magyar nyelvtechnológusoknak köszönhetően született meg az itranslate4.eu, amely egy helyen teszi elérhetővé az interneten található legtöbb gépi fordító alkalmazást.

Simon Eszter | 2011. május 17.
|  

A jelenleg az interneten elérhető tartalmak nagy része idegen nyelven íródott, valami olyan nyelven, amilyenen nem feltétlenül beszélünk. Ha én mondjuk csak portugálul találok meg valami olyan információt, amire feltétlenül szükségem lenne, kénytelen vagyok valamilyen eszközhöz folyamodni, aminek segítségével le tudom fordítani. Még emlékszem azokra az időkre, amikor az ember ilyenkor könyvtárba ment. Ma már véletlenül se tennék ilyet, inkább beütöm egy keresőbe, hogy Portuguese-English translator, és a kapott találatok közül szemezgetek. Sőt, a kapott találatok alapján igazából arra is rájövök, hogy már ezt a lépést sem kéne megtennem, elég lenne a Google translate-et használnom, mivel ott egy oldalon találok fordítási lehetőséget sok nyelvről sok másikra.

A fordítók közt egy európai

Lehet még ennél jobb is? Meglepő – vagy nem is annyira meglepő –  módon nem csak mi gondoljuk úgy, hogy szükség van ennél jobb megoldásra is, hanem az Európai Unió is rengeteg pénzt és erőfeszítést áldoz arra, hogy a nyelvi esélyegyenlőséget biztosítsa az Unió minden polgára számára. Erről tanúskodik az is, hogy minden tagország nyelve egyben az Unió hivatalos nyelvévé is vált. Ebből kifolyólag minden hivatalos iratot elméletileg le kellene fordítani minden hivatalos nyelvre, ami elképesztően idő-, munka- és pénzigényes, így a gyakorlatban nem is mindig történik meg. Többek között erre kínálnak megoldást a nyelvtechnológiai fejlesztések, mint például a számítógéppel segített szótárkészítés, a többnyelvű információkinyerés és -visszakeresés, valamint az automatikus gépi fordítás.

Az automatikus gépi fordítás célja, hogy akár nagy mennyiségű szövegnek egy gombnyomásra emberi vagy azt megközelítő minőségű fordítását állítsa elő. Az információáramlás fontossága miatt nem véletlen, hogy ma ez az egyik vezető irányzat a nyelvtechnológián belül. Számos nagy IT-vállalat rendelkezik saját fordítóval (pl. a már említett Google vagy a Microsoft), de számos olyan cég is van világszerte, amelyeknek fő tevékenységei közé tartozik az automatikus gépi fordítórendszerek fejlesztése (pl. Systran, Linguatec).

Egy kis módszertan

Módszertanilag a gépi fordítóknak két nagy csoportját különíthetjük el. A szabályalapú fordítók nyelvtani szabályok szerint elemzik a forrásnyelvi mondatokat és célnyelvi szabályokra képezik le ezeket, míg a statisztikai fordítók nem készítenek elemzést a mondatokhoz, hanem a szövegben megtalálható gyakori szókombinációkhoz keresnek célnyelvi megfelelőket valószínűségi alapon. A szabályalapú és a statisztikai fordítóknak egyaránt vannak erősségeik és gyengeségeik. A szabályalapú fordítók egyik előnye, hogy a ritkán előforduló nyelvi szerkezeteket, szókapcsolatokat is képesek helyesen lefordítani. Ezzel szemben egy statisztikai fordító elkészítése kevesebb emberi munkát, nyelvészeti szaktudást igényel, ezért a fejlesztése jóval költséghatékonyabb.

A magyar nyelv szempontjából nem kedvező, hogy a statisztikai fordítók jellemzően azon nyelvpárokra működnek jól, amelyekre sok bemeneti adat áll rendelkezésre, a nyelvekben előforduló szavaknak csak viszonylag kevés alakjuk van, illetve a forrás- és a célnyelv hasonlítanak egymásra (akár szerkezetileg, akár szókincsben). Ezekből az következik, hogy a magyarra a közeljövőben vélhetően nem fog jól működő statisztikai gépi fordító születni.

Mindent egy helyen!

Viszont egy magyar nyelvtechnológusnak, Tihanyi Lászlónak és az Unió támogatásának köszönhetően született egy olyan gépi fordító alkalmazás, amely egy helyen teszi elérhetővé az interneten található legtöbb gépi fordító alkalmazást. Az összes fordítási lehetőséget egyszerre látjuk, ami nagy mértékben segíti az idegen nyelvű szöveg megértését. További erényei, hogy egyrészt az EU összes hivatalos (és néhány kisebbségi) nyelvére nyújt szolgáltatást, másrészt nyelvrokonsági alapon használ közvetítő nyelvet azokban az esetekben, amikor nincs közvetlen fordítás egy nyelvről egy másikra – mindezt egy oldalról kényelmesen elérhetően. Ez az alkalmazás az itranslate4.eu, amely május elejétől béta üzemmódban már elérhető.

Mivel a vezető európai gépi fordítással foglalkozó cégek minden szolgáltatását, továbbá a két nagy multi (Google, Microsoft) fordítóját egy helyen érhetjük el, jelenleg összesen 57x57-57, vagyis 3192 nyelvpárra használhatjuk a gépi fordítást. Az itt felvonultatott szolgáltatások között találunk szabályalapú és statisztikai alapú megoldást is. Általánosságban elmondható, hogy a Google és a Microsoft használnak statisztikai alapú módszereket, míg az európai cégek szabályalapú rendszereket építenek. Az egymás alatt megjelenő fordítási alternatívák értékelhetők, vagyis az egyes nyelvpárok esetében elég jól láthatóvá válnak a két metódus közti különbségek. A fejlesztők jövőbeli tervei között szerepel, hogy a felhasználói értékeléseket visszaforgatják, vagyis azok a fordítások, amelyeket sokan tartottak jónak, előrébb fognak megjelenni a találati listán.

Minden egyes fordítási alternatíva mellett, a fordította gombra egerezve láthatóvá válik, hogy melyik cég fordította. A csillagra klikkelve lehet lájkolni a fordítást, valamint lehet jobbat javasolni és kérni is – ez utóbbihoz regisztráció szükséges. Érdemes regisztrálni, ugyanis a weboldalnak van egy közösségi modulja is, ahol élő emberekkel cserélhetünk tapasztalatokat, kaphatunk és adhatunk jobb fordítási javaslatokat, továbbá a saját felhasználási igényeinkhez szabhatjuk a szolgáltatások működését.

A szokásos alapszolgáltatáson, vagyis egy beírt vagy bemásolt szöveg lefordításán felül további hasznos funkciók is igénybe vehetők. Ilyen például az azonnali fordítással ellátott chat, amelynek segítségével a világ bármely részén élő, bármilyen nyelvet beszélő ismerősünkkel tudunk úgy chatelni, hogy nem kell közös nyelvet ismernünk. Ami még új, izgalmas szolgáltatás: kereshetünk a weben a saját anyanyelvünkön megadott kulcsszavakkal, amiket a rendszer lefordít az általunk megadott nyelvre, így azon a nyelven kapjuk a találatokat. Tehát ha én beírom a keresőbe, hogy kutya, és beállítom a magyar-angol nyelvpárt, akkor ilyen találatokat kapok: dogs for sale, dog breed info, dog training, dog equipment stb. Természetesen a külföldi találati oldalak visszafordítására is van lehetőség.

Az itranslate4.eu projekt 2010 áprilisában indult, vagyis most érkezett félidejéhez. A konzorcium tagjainak a célkitűzése a projekt hátralevő egy évére, hogy a jelenleg béta üzemmódban működő oldalt továbbfejlesszék, valamint a lájkolások és különféle kiértékelési módszerek alkalmazásával lehetővé tegyék a fordítási lehetőségek rangsorolását. Hosszabb távú terveik között szerepel az itranslate4.eu mobiltelefonokra való alkalmazása is. A fejlesztők minden visszajelzést szívesen vesznek.

Magyarok a projektben

Az itranslate4.eu projekt ötlete Tihanyi Lászlótól származik, aki a MorphoLogic Kft. fordító program üzletágának vezetője, a cég egyik alapítója és társtulajdonosa. A cég már két évtizede van a magyar piacon: először helyesírás-ellenőrző, majd fordító programjaikkal tűntek föl. A webforditas.hu angol-magyar, magyar-angol fordító 5 éve működő szolgáltatás.

Tihanyi Lászlónak sok évi munkája van abban, hogy az itranslate4.eu projekt tavaly elindulhatott. A Google gépi fordító szolgáltatásának elindulása és előretörése nélkül nem lett volna reális esélye annak, hogy a vezető európai gépi fordító cégek egy konzorciumba tömörüljenek.

A konzorcium résztvevői

MTA Nyelvtudományi Intézet (Magyarország)
MorphoLogic Kft. (Magyarország)
Systran (Franciaország)
Linguatec (Németország)
SkyCode (Bulgária)
PWN.pl (Lengyelország)
Amebis (Szlovénia)
Sunda Systems (Finnország)
PROMT (Németország)
Trident (Lettország)

A pályázati kiírás része volt, hogy a projekt koordinátora mindenképpen egy piaci érdekektől független akadémiai vagy egyetemi résztvevő legyen. Ez azért fontos kitétel, mert az egyes fordító szolgáltatások kiértékelésénél természetesen nem szabad, hogy egyéni, külső érdekek is szerepet kapjanak – a kiértékelés alapja pusztán tudományos lehet. Így jött a képbe az MTA Nyelvtudományi Intézete, amelynek Nyelvtechnológiai Osztálya Váradi Tamás vezetésével már több gépi fordító projektben vett részt, a MorphoLogickal együttműködve is.

Felhasznált forrás

Nyelv- és Beszédtechnológiai Platform Megvalósítási Terv

Követem a cikkhozzászólásokat (RSS)
Hozzászóláshoz lépjen be vagy regisztráljon.
1 Gaboras 2011. május 17. 22:27

"A hastáncosnőnek járt a hasa. Egész este ment a hasam."

Ezt nektek fordítógépek... :D

Információ
X