-
Sándorné Szatmári: @nasspolya: (Hátha ennyi idő után még elolvasod..) -29-ben ezt írtad: ".... mi a pontos kü...2024. 11. 23, 12:47 A nyitás tárgya
-
szigetva: @Sándorné Szatmári: Kétségtelen, hogy majd ha tudunk valamit a jelenleg ismertnél korábbi ...2024. 11. 22, 14:33 Szótekerészeti agybukfenc
-
Sándorné Szatmári: @szigetva: 14 "..az állítólagos "ősnyelvről" azért könnyű bármit (és annak az ellenkezőjét...2024. 11. 22, 14:17 Szótekerészeti agybukfenc
-
szigetva: @Sándorné Szatmári: Kérlek, fejezd be a hülyeséget. Egyszer-kétszer talán vicces, de most ...2024. 11. 13, 12:05 Szótekerészeti agybukfenc
-
Sándorné Szatmári: @Sándorné Szatmári: 12 kiegészítés: -A mai angolban a "kulcs" szó időben csak oda helyezhe...2024. 11. 13, 11:33 Szótekerészeti agybukfenc
Kálmán László nyelvész, a nyest szerkesztőségének alapembere, a hazai nyelvtudomány és nyelvi ismeretterjesztés legendás alakjának rovata volt ez.
- Elhunyt Kálmán László, a Nyelvész, aki megmondja
- Így műveld a nyelvedet
- Utoljára a bicigliről
- Start nyelvstratégia!
- Változás és „igénytelenség”
Kálmán László korábbi cikkeit itt találja.
Ha legutóbb kimaradt, most itt az új lehetőség!
Ha ma csak egyetlen nyelvészeti kísérletben vesz részt, mindenképp ez legyen az!
Finnugor nyelvrokonság: hazugság
A határozott névelő, ami azt jelenti, hogy ‘te’
Az oroszok már a fejünkön vannak!
Különös oldal bukkant fel nemrég az interneten: egy nyílt kínai-magyar szótár, amelyben nemcsak keresni lehet, de bárki hozzá is írhat. Kinek van szüksége ilyesmire, és egyáltalán: mi fán terem 2017-ben egy kínai-magyar szótár?
Kezdjük címszavasan. A CHDICT egy kínai-magyar kétnyelvű szótár, amelynek célja, hogy a kínai szavak jelentését, használatát és írását/olvasását tegye hozzáférhetővé magyar anyanyelvűeknek, illetve magyarul jól tudóknak. Több értelemben is nyílt: ingyenes; az egész szótárat bárki szabadon letöltheti és felhasználhatja; bárki belejavíthat és hozzáírhat. Kezdeti állapotában mintegy 11 ezer szócikket tartalmaz, amivel alulról súrolja a közepes méretet. A kiinduló anyag más nyelvű, szintén nyílt kínai szótárak angol és német cikkeinek magyarra fordításával készült. A közzétett weboldalon olyan hasznos funkciókat nyújt, mint a kézírás-felismerés és az írásjegyekhez tartozó vonássorrend-animációk: ezek a CHDICT saját anyagához hasonlóan mind nyílt erőforrásokon alapulnak.
Nincs új a nap alatt
A CHDICT elgondolásában valójában semmi eredeti nincsen: a kelet-ázsiai nyelveket leíró nyílt digitális szótárak több mint 25 éves múltra tekintenek vissza. Az úttörő a japán-angol EDICT volt, amit Jim Breen kezdett összeállítani 1991-ben. Az ő munkája inspirálta Paul Denisowskit, aki 1997-ben kezdett dolgozni a kínai-angol CEDICT-en. Hamarosan színre lépett a német és a francia célnyelv is. Mostanra ezek a szótárak mind tekintélyes, 100 ezer címszó feletti méretet értek el, s máig is aktívan fejlődnek.
A későn érkező CHDICT-nek így többszörösen is könnyű dolga volt. Egyrészt az elődök megalapozták az egyszerű, de mégis pont elegendő kifejezőerejű formátumot, amit én kiforrott formájában változtatás nélkül átvehettem. Másrészt a kiinduló anyag létrehozásánál nem kellett a semmiből építkezni: a már létező nyílt szótárak lehetővé teszik bármiféle származtatott anyag létrehozását, így természetesen azt is, hogy a bennük található angol vagy német megfelelőket egész egyszerűen magyarra fordítsam.
Izgalmas kérdés, hogy felveheti-e a versenyt az igényes, szakemberek (sinológusok és lexikográfusok) általt szerkesztett szótárakkal egy olyan szerzemény, amit lelkes laikusok építgetnek, szakmai kontroll nélkül, csupán a közösség önszabályozására építve. Én rendkívül optimista vagyok, hogy igen: minden jel szerint a CEDICT ma a legelterjedtebb kétnyelvű kínai szótár. Bár kétségtelen, hogy a nyelvet kevésbé részletesen és pontosan írja le, mint a szakemberek által szerkesztett szótárak, mégis ékes hibáktól mentes, és akár szakszókincsről, akár szlengről van szó, a dinamikusan változó kínai nyelv legfrissebb szavait garantáltan a CEDICT-ben találjuk meg először.
Az oldal az ajánló után folytatódik...
Egy kicsit mégis más
A CHDICT az elődöktől egyvalamiben azért mégiscsak különbözik. Azok célnyelve mind „nagy” nyelv, vagyis sok beszélővel rendelkezik, a beszélők pedig gazdaságilag és informatikailag fejlett, Kínával intenzív kapcsolatokat ápoló országokban élnek. A magyar ezzel szemben a digitális világban közepes nyelvnek tekinthető. Az egyik legizgalmasabb kérdés számomra ezért pont az, hogy az enyhén eltérő paraméterek hogyan befolyásolják a CHDICT hosszú távú fejlődését.
Mindemellett irtó jó érzés, hogy az angol, német és francia után a magyar a harmadik európai nyelv, amire efféle kínai szótár létrejött.
A szoftver nem papír
Miután körbejártuk a nemzetközi előzményeket, közelítsünk most másfelől: tisztán digitális, weben hozzáféhető szótárról lévén szó, miben különbözik a CHDICT a „hagyományos”, papíralapú szótáraktól? Ez azért izgalmas kérdés, mert egy olyan narratívába illeszkedik, amelynek a szótárakhoz alapvetően semmi köze.
Bár az internet látszólag a mindennapi élet minden szegletébe beférkőzött, a valóság mégis az, hogy a web mint médium sok tekintetben még mindig gyerekcipőben jár. Rengeteg webes tartalom az analóg, statikus világból jól ismert formátumok mechanikus átültetése egy böngészőablakba.
Mi sem illusztálja ezt jobban, mint a kínai írásjegyekkel való bánásmód. Alfabetikus írást használó nyelveknél, amilyen a magyar is, egyszerű rendszerezni a szavakat, hiszen jól meghatározott szabályok szerint ábécé-sorrendbe rendezhetjük őket. Teljesen magától értetődőnek vesszük, hogy az ábécé-sorrend a nyomtatott szótárak fő rendezőelve.
Kínai írásjegyekből viszont sokezer van, és nem megjósolható, hogy mi a kiejtésük. Néha még az sem egyértelmű, egészen pontosan hogyan kell leírni őket. A rendszerezésükhöz ezért hagyományosan rendkívül komplikált módszert alkalmazunk, amihez eleve rengeteg ismeretre van szükség: fell kell ismerni a gyököt (ilyenből pár száz van), látni kell, hány további vonást tartalmaz az írásjegy, és egy hosszú táblázatban kell ezek alapján keresgélni. A keresgélésnek köszönhetően a múltban sok-sok sinológus tett szert tanulóévei során 2-3-4 többletdioptriára.
Ha a szótár nem papírra nyomtatott statikus információ, a fentiek egy csapásra eltűnnek: elég az írásjegyet egérrel (vagy ujjal) a képernyőre rajzolni, és a szoftver felismeri azt, még akkor is, ha nem teljesen szabályszerűen jártunk el a rajzolás során.
De ide tartoznak olyan szempontok is, mint a nyomtatott változat terjedelmi korlátai és az ezekből eredő tömörítési kényszer, ami miatt a szócikkek nehezen áttekinthetőek, hemzsegnek a rövidítésektől. Végül ott a tény, hogy egy online szótár esetén a fenntartó pontosan látja, mely szavakra keresnek gyakran a felhasználók, ami segít kijelölni a szótárbővítés irányait.
A fentiek közül a CHDICT egyik tekintetben sem különleges vagy egyedülálló, viszont külön erőfeszítést tesz arra, hogy elébe menjen a kínai szótárat használók egyedi igényeinek, és mindezt sok-sok opció, beállítás és kattintgatás nélkül tegye.
Zárásként még egy fontos szempont: nem csak azokat kívánja kiszolgálni, akik a szótárban keresnek, hanem azokat is, akik a szótárhoz hozzáírnak. Új szó bevitelekor több különböző nyilvános adatbázisra építve automatikusan felkínálja a hagyományos írásjegyeket írásjeleket, a fonetikus átiratot és más hasonló információkat.
Műhelytitkok
Azok pedig nincsenek. A CHDICT megalapozása és az oldal kifejlesztése során fontosnak tartottam, hogy minden döntés átlátható, minden művelet megismételhető legyen. Ezzel egyrészt segíteni szeretnék másoknak, akik utánam hasonló fába vágják a fejszéjüket, például más „közepes” vagy „kicsi” nyelvre készítenek kínai szótárat, vagy más forrásnyelvű magyar szótárat építenek. Másrészt jó tudományos-kutatási gyakorlat, ha nem csak a következtetéseket és a módszert, hanem a kiindulási adatokat is közzétesszük, mivel csak így fedezhetik fel és helyesbíthetik hibáinkat mások az eljárás megismétlésével.
A nemlétező műhelytitkokról, a kínai lexikográfia sajátságairól, a dilettáns szótáríró dilemmáiról hamarosan további cikkekben számolok be.