nyest.hu
Kövessen, kérem!
Legutolsó hozzászólások
A nyelvész majd megmondja
A legnépszerűbb anyagok
Írjon! Nekünk!
nyest.hu
nyest.hu
 
Add a hangod: olvass fel ebben az izgalmas kutatás-fejlesztési projektben!

Segíts nekünk egy olyan eszközt fejleszteni, ami mesterséges intelligencia segítségével segíti a kis közösségi rádiókat a keresőkben történő megjelenésben!

nyest.hu | 2022. december 12.
|  

Felmondanád a hangodat egy izgalmas kutatási projekt kedvéért? Egyrészt ez egy nagyon izgalmas feladat, másrészt a nyestnek is segítesz – a tudományról nem is beszélve! 

A képre kattintva a Common Voice oldalára jutsz, itt rögzítheted a mondatokat, és ellenőrizheted más mondatait
A képre kattintva a Common Voice oldalára jutsz, itt rögzítheted a mondatokat, és ellenőrizheted más mondatait

Miben kérjük a segítséged?

Nyertünk! A nyest – a Tilos és a Civil rádiókkal közösen – finanszírozást nyert egy szuper kutatási projekthez, ami nagymértékben hozzá tud járulni a mi megújulásunkhoz is.  

A lényeg, hogy rengeteg kicsi, kevés pénzből gazdálkodó közösségi rádióadó működik a weben. Ők – pénz híján – nem tudnak nagy pénzeket költeni arra, hogy az adásukban elhangzó szövegek valahogy kereshetőekké váljanak a weben. Ebben segít nekik a projektünk!

Mondj fel néhány magyar mondatot a Mozilla Common Voice közösségi hangadatbázis oldalán, valamint ellenőrizd mások hangmintáit!

Miért kérjük ezt? 

A programozókból, nyelvészekből, adatelemzőkből, designerekből álló csapat egy olyan alkalmazást hoz létre, ami egy mesterséges intelligencia segítségével leiratozza és kereshetővé teszi a rádióadásban elhangzott szöveget. Ehhez kérjük a Te segítségedet: a mesterséges intelligencia betanítására nagyjából 250 órányi felolvasott és ellenőrzött szöveget kell felolvassunk, ezen a weboldalon, amit erre a linkre kattintva érsz el!

A hangmintánk viszont olyannyira nem fog kárba vészni, hogy más csapatoknak is segít majd fejlesztéseikben, akik nyílt forráskódú, szabad szoftvereket fejlesztenek. Azaz a hangunkkal hozzájárulhatunk ahhoz, hogy ne csak nagyvállalatok számára hajtson hasznot a mesterséges intelligencia, hanem közösségi projektek, kisebb műhelyek számára is!

Milyen kiejtésre van szükségünk?

Mindenfélére! A beszéd sokféle, a beszéd nagyon emberi. Sokszínűek vagyunk abban, hogyan ejtjük ki a szavakat, hogyan hangsúlyozunk, hogyan mondjuk ki a gondolatainkat magyarul. Add a hangod, hogy a magyar adatbázis minél gazdagabb, teljesebb, sokszínűbb lehessen. 

Jelenleg 73 óránál jár az adatbázis, célunk, hogy ez a szám legalább 150-200-ra növekedjen.

Mit kell tenned?

  1. Menj fel a Mozilla Common Voice oldalára a számítógépeden, vagy a mobilodon. Nem szükséges regisztrálnod, de ha mégis megteszed, úgy követheted az előrehaladásod – és felkerülhetsz a toplistákra! 

  2. Kattints a Beszéljen fülre, és mondj fel magyar mondatokat a szövegkártyákról.

  3. Kattints a Figyeljen menüpontra, és csekkold le mások felolvasásait, hangmintáit. Figyelem: itt időnként előfordul, hogy a rendszer azt írja ki, hogy elfogytak az ellenőrzésre rendelkezésre álló mondatok. Ilyenkor az oldal frissítésével gyakran újabb mondatokhoz juthatunk, amivel feljebb araszolhatunk a toplistán!

  4. Ha bizonytalan vagy egy mondat felolvasásában, vagy egy hangminta ellenőrzésében, kattints a Kihagyás gombra.

Gyakori kérdések

Csak szép kiejtéssel lehet felolvasni? 

Nem, sőt! Kimondottan az szeretnénk, ha sokféle lenne az adatbázis, éppen ezért örömmel vesszük a legkülönfélébb felolvasókat is – nem kell "szépen" ejteni semmit, a raccsolók és pöszék épp annyira fontosak, mint pl. a palóc vagy salgótarjáni dialektusúak. 

Mit tegyek ellenőrzésnél, ha nagyon halk a felvétel? 

Ha a felvétel egyes részei annyira elhalkulnak, hogy már nem halhatóak, vagy ha a felvétel szaggat, nem kivehetőek a szavak, ne fogadjuk el. 

Azt írja, hogy "nincs már ellenőrzendő felvétel", közben csak 53% az ellenőrzött mondatok száma. Miért van ez? 

Azért, mert a rendszerben van egy kis probléma: ilyenkor, ha frissítjük az oldalt, új mondatokat fog felkínálni ellenőrzésre. 

Nem vagyok biztos a kiejtésben, mit csináljak? 

Egyáltalán nem baj, ha így is felolvasod a felkínált mondatot. Ha mégsem érzed úgy, hogy felolvasnád, megnyomhatod a Kihagyás gombot, vagy a Ctrl+K / Command+K billentyűkombinációt. A lényeg, hogy semmi esetre sem kell aggódnod a kiejtésed miatt! 

Rosszul ejti ki a beszélő az egyes szavakat, kifejezéseket. Elutasítsam? 

Csak azért, mert sajátosan ejt egy kifejezést a beszélő, még nyugodtan fogadjuk el. Akkor utasítsuk el a felvételt, amikor a felolvasó véletlenül kihagy, esetleg hozzátesz a mondathoz, ami le van írva.

Egy ideje nem látszik az alsó sáv a Common Voice-on: eltűnik a Kihagyás gomb is. Mit lehet csinálni? 

Már jeleztük a problémát a fejlesztőknek, de szerencsére nem akkora a gond: ha csökkentjük a böngészőben a nagyítást (zoom out), akkor a keresett gombok előbukkannak az alsó sávban. 

Adj hangot a rádióknak Te is, kattints ide!


Információ
X