-
Sándorné Szatmári: @ganajtúrós bukta: 22 A Google szerint további hasonló kifejezések (nem csak iskolában, bá...2024. 07. 23, 16:23 „Mert nincs rá szó, nincsen rá...
-
ganajtúrós bukta: Régi topik azért válaszolok hátha valaki visszaír... Talán: Szekálás, abuzálás, oltogatás,...2024. 07. 23, 13:34 „Mert nincs rá szó, nincsen rá...
-
Sándorné Szatmári: @Sándorné Szatmári: kiegészítés: A nyelvi bizonytalansági tényezők (amik annál gyakoribbak...2024. 07. 01, 08:12 Fantomok a magyar szavakban
-
Sándorné Szatmári: @szigetva: 117 Valóban.. A "Fedje meg!" parancs hosszú gy-vel--->hatása: "megfedd valak...2024. 06. 29, 12:28 Fantomok a magyar szavakban
-
szigetva: @Sándorné Szatmári: Nyilván a sok ostobaság mennyiségével akarsz dominálni. Annyit azért v...2024. 06. 29, 08:35 Fantomok a magyar szavakban
Kálmán László nyelvész, a nyest szerkesztőségének alapembere, a hazai nyelvtudomány és nyelvi ismeretterjesztés legendás alakjának rovata volt ez.
- Elhunyt Kálmán László, a Nyelvész, aki megmondja
- Így műveld a nyelvedet
- Utoljára a bicigliről
- Start nyelvstratégia!
- Változás és „igénytelenség”
Kálmán László korábbi cikkeit itt találja.
![](/media/news-depesmod.png)
Ha legutóbb kimaradt, most itt az új lehetőség!
Ha ma csak egyetlen nyelvészeti kísérletben vesz részt, mindenképp ez legyen az!
Finnugor nyelvrokonság: hazugság
A határozott névelő, ami azt jelenti, hogy ‘te’
Az oroszok már a fejünkön vannak!
Folytatjuk tudósításunkat a szegedi Magyar Számítógépes Nyelvészeti Konferenciáról.
A délelőtti szekció második fele már valójában koradélután zajlott.
Solt Illés, Szidarovszky P. Ferenc és Tikk Domokos Kontextualizált névelem-felismerés és relációkinyerés kórházi zárójelentésekben című előadásában arról esett szó, hogy a szövegben hogyan kell kijelölni a neveket. A kórházi zárójelentések azért bizonyulnak nehéz terepnek, mert megfogalmazásuk gyakran töredékes, nem teljes, jól megformált mondatok szerepelnek bennük. A kifejlesztett algoritmus feladata, hogy felismerje a páciens nevét, illetve a rá vonatkozó információkat (a betegségek, a kezelések, a gyógyszerek stb.) – de ne keverje bele pl. a családban előforduló betegségekre vonatkozó információkat.
Berend Gábor és Farkas Richárd beszámolója Kulcsszókinyerés magyar nyelvű tudományos publikációkból címen hangzott el. Kulcsszavaknak a szöveg tartalmilag legfontosabb kifejezéseinek nevezzük. A tudományos publikációk esetében feladatot külön nehezíti, hogy a legtöbb cikk pdf-ben van, ebben pedig a mondat-, időnként a szóhatárok sem világosak. A megtísztított dokumentumokat mondattanilag elemzik, a kifejezéseket azonosítják. A Wikipédiában ellenőrzik, van-e önálló oldala a kifejezésnek: ha igen, akkor általában alkalmas kulcsszónak. A kulcsszó általában arról ismerhető fel, hogy frekvenciája jóval magasabb, mint egy nagy, vegyes tematikájú korpuszban (szöveggyűjteményben).
Váradi Tamás, Pintér Tibor, Mittelholz Iván és Peredy Márta Bibliográfiai adatok automatikus kinyerése című előadása zárta az információkinyerésről szóló előadások sorát. Míg a természettudományos publikációk szinte kizárólag angol nyelvűek, addig a társadalom- és bölcsészettudományokat sok nyelven művelik. Egy-egy cikk, illetve szerző hatása leginkább azzal mérhető, hogy hányan hivatkoznak rá. Ennek automatikus méréséhez az egyes publikációkban azonosítani kell a hivatkozásokat. Ezek előfordulhatnak lábjegyzetben vagy a szöveg végén is. A bibliográfiai tételek formázására vontkozó, kiadványonként eltérő szabályok miatt a hivatkozás egyes elemeire (szerző neve, könyv vagy cikk címe, a publikáló folyóirat neve, évfolyama, a kiadó neve, a kiadás éve stb.) bontása igen összetett feladat.
A konferenciához kapcsolódó kötet letölthető.