nyest.hu
Kövessen, kérem!
Legutolsó hozzászólások
A nyelvész majd megmondja
A legnépszerűbb anyagok
Írjon! Nekünk!
nyest.hu
nyest.hu
 
Mi az a WikiBasha?
A wikipédia többnyelvűsítése

A Wikipedián rengeteg tudás halmozódott fel, de az információk nagy része csak angolul lelhető fel. Egy új eszköz azonban hozzásegíti a más nyelvű wikipédiák fejlesztőit, hogy az angol nyelvű szócikkeket lefordítsák.

nyest.hu | 2010. október 27.
|  

Míg az angol wikipédia csaknem három és fél millió szócikket tartalmaz, addig a második legnagyobb, a német, már alig harmadannyit. Több, mint kétszáz olyan nyelv van, melyen a szócikkek száma nem éri el a százezret. (A magyar wikipédia szócikkeinek száma a 180.000 felé közelít, ezzel a 17. helyen áll.)

A Microsoft indiai kutatócsoportja fejlesztette ki a WikiBasha nevű eszközt (a basa szanszkritül nyelvet jelent). Az október 18-ától használható eszköz fordítógépet és a Wikipediában találhatóhoz hasonló szövegszerkesztőt tartalmaz. Ennek segítségével bármilyen nyelvre le lehet fordítani az angol – vagy akár más – nyelvű szócikkeket, illetve tetszőlegesen ki is lehet bővíteni őket.

A Rosette-i kő, a legkorábbi párhuzamos korpusz
A Rosette-i kő, a legkorábbi párhuzamos korpusz
(Forrás: Wikimedia commons)

A WikiBasha célja nem egyszerűen csak a wikipédiák fejlesztése. A használatára azért is szükség van, hogy az adott nyelvekre fordítógépeket készítsenek. Egy fordítógép valamilyen szinten már akkor is használható, ha csak kevés fordítási példát ismer, ahhoz azonban, hogy  megbízhatóan fordítson, legalább négymillió mondatpárra van szükségünk. Ezeket számos „kis” nyelvnél nem könnyű beszerezni. A wikipédiákat fejlesztő közösségek azonban fordítási munkájukkal folyamatosan ilyen mondatpárokat állítanak elő. Ahogy a munka halad, egyre több mondatpár áll a fordítógép rendelkezésére, így egyre tökéletesebben működik. Így aztán lassan létrejön egy olyan fordítógép, amely bármilyen szöveget képes fordítani. Igaz, az eltérő szövegtípusokhoz „szoktatni” kell a gépet, de az alapok ugyanazok.

Hogyan használható?

Magyar világsiker a géppel támogatott fordításban

Egy fiatal magyar cég történelmet írt a géppel támogatott fordításban: a memoQ fordítómemória ma már világhírű alkalmazás, a kis magyar cégből, a Kilgray-ből, nemzetközi cégcsoport lett amerikai, német, francia, lengyel cégekkel.

A memoQfesten most ön is megismerkedhet, nem csak a sikeres magyar fejlesztéssel, de a géppel támogatott fordítás előnyeivel általában. (x)

A WikiBasha böngészőre fejlesztett alkalmazás, melyet egy wikipédia-szócikkből lehet meghívni. A felhasználó először megjelöli, mely angol szócikkeket szeretné forrásként felhasználni, majd lefordítja a megfelelő mondatokat és megszerkeszti a szócikket, a kész szöveget pedig visszaküldi a wikipédiára. A WikiBashával nem csak meglevő szócikkeket lehet szerkeszteni, hanem újakat is létre lehet hozni.

Természetesen a wikipédiára feltöltött változatot már más is szerkesztheti. Ha valaki javít egy fordítási hibát, akkor az ő megoldása is bekerül a WikiBasha fordítási memóriájába. Amikor pedig legközelebb valaki hasonló mondatot fordít, megnézheti a már korábban használt fordítási megoldásokat, és alkalmazhatja őket.

A WikiBasha egyszerűsége lehetővé teszi, hogy alkalmi felhasználók is dolgozhassanak vele, ne csak azok, akik a Wikipedia aktív szerkesztői.

Kanyargós utakon

A WikiBasha hosszas fejlesztés eredménye. 2008-as első verziója még karakteres felületen működött, és kizárólag mondatról mondatra való fordítást engedélyezett. Az eredeti tervek szerint más tartalmak is fordíthatóak lettek volna vele, így például a The New York Times hírei.

Wikipedia – egyre több nyelven
Wikipedia – egyre több nyelven
(Forrás: Wikimedia commons)

A WikiBasha első, 2008-as németországi bemutatója nem volt igazán sikeres. Többek hangsúlyozták, hogy a különböző nyelvű wikipédiákon saját tartalomnak, nem az angol szócikkek fordításának kellene megjelenniük. A wikipédisták ahhoz is ragaszkodtak, hogy a fordításon a wikipédián belül dolgozhassanak, ne kelljen másik doménre elmenniük. Igyekeztek figyelembe venni az elvárásokat, de ennek következményeképp egyre bonyolultabb lett a szoftver kezelése.

Az utóbbi időben a WikiBasha erősen megváltozott, egyre inkább a születő szócikkre, nem pedig a forrásokra összpontosított. Egyre szorosabban integrálták a Wikipediával, ami elősegítette a fokozatos egyszerűsítését is.

Perspektívák

A jelenlegi WikiBasha a Microsoft Translator által támogatott 31 nyelvre használható (március eleje óta ezek között van a magyar is), de a képes lesz bármilyen, a Microsoft Translatorhöz adott nyelv kezelésére is. Forrásnyelvként jelenleg csak az angol használható, de a jövőben ez is változni fog. A cél az, hogy minél több nyelv elérhető legyen, és az együttműködésnek köszönhetően ne csak a különböző nyelvű wikipédiák bővüljenek, hanem egyre több nyelvre jelenjen meg fordítóprogram is.

Forrás

Enhancing Multilingual Content in Wikipedia

Követem a cikkhozzászólásokat (RSS)
Hozzászóláshoz lépjen be vagy regisztráljon.
Még nincs hozzászólás, legyen Ön az első!
Információ
X