-
szigetva: @mederi: Csakhogy te sem adatokra alapozod a fejtegetéseidet, hanem "szerintem"-ekre, ráad...2023. 03. 22, 11:59 Egy érdekes változásról: elvessze és...
-
mederi: @szigetva: Ja, persze, nyilván olvasható is.. :) "Igen, az etimológiák jó része adatok híj...2023. 03. 22, 11:15 Egy érdekes változásról: elvessze és...
-
szigetva: @mederi: „A "valószínűleg" nem éppen bizonyosság szerintem..” Igen, az etimológiák jó rész...2023. 03. 21, 13:29 Egy érdekes változásról: elvessze és...
-
mederi: @szigetva: Igazad van, hogy kevés további változata van, de mondjuk a "veszeget valamit va...2023. 03. 21, 12:11 Egy érdekes változásról: elvessze és...
-
szigetva: @mederi: „Úgy tűnik számomra, hogy a "feszít/ feszül// feszeget/ feszeng" mintájára szület...2023. 03. 20, 08:14 Egy érdekes változásról: elvessze és...
Kálmán László nyelvész, a nyest szerkesztőségének alapembere, a hazai nyelvtudomány és nyelvi ismeretterjesztés legendás alakjának rovata volt ez.
- Elhunyt Kálmán László, a Nyelvész, aki megmondja
- Így műveld a nyelvedet
- Utoljára a bicigliről
- Start nyelvstratégia!
- Változás és „igénytelenség”
Kálmán László korábbi cikkeit itt találja.

Ha legutóbb kimaradt, most itt az új lehetőség!
Ha ma csak egyetlen nyelvészeti kísérletben vesz részt, mindenképp ez legyen az!
Finnugor nyelvrokonság: hazugság
A határozott névelő, ami azt jelenti, hogy ‘te’
Az oroszok már a fejünkön vannak!
Folytatjuk tudósításunkat a szegedi Magyar Számítógépes Nyelvészeti Konferenciáról.
A délelőtti szekció második fele már valójában koradélután zajlott.
Solt Illés, Szidarovszky P. Ferenc és Tikk Domokos Kontextualizált névelem-felismerés és relációkinyerés kórházi zárójelentésekben című előadásában arról esett szó, hogy a szövegben hogyan kell kijelölni a neveket. A kórházi zárójelentések azért bizonyulnak nehéz terepnek, mert megfogalmazásuk gyakran töredékes, nem teljes, jól megformált mondatok szerepelnek bennük. A kifejlesztett algoritmus feladata, hogy felismerje a páciens nevét, illetve a rá vonatkozó információkat (a betegségek, a kezelések, a gyógyszerek stb.) – de ne keverje bele pl. a családban előforduló betegségekre vonatkozó információkat.
Berend Gábor és Farkas Richárd beszámolója Kulcsszókinyerés magyar nyelvű tudományos publikációkból címen hangzott el. Kulcsszavaknak a szöveg tartalmilag legfontosabb kifejezéseinek nevezzük. A tudományos publikációk esetében feladatot külön nehezíti, hogy a legtöbb cikk pdf-ben van, ebben pedig a mondat-, időnként a szóhatárok sem világosak. A megtísztított dokumentumokat mondattanilag elemzik, a kifejezéseket azonosítják. A Wikipédiában ellenőrzik, van-e önálló oldala a kifejezésnek: ha igen, akkor általában alkalmas kulcsszónak. A kulcsszó általában arról ismerhető fel, hogy frekvenciája jóval magasabb, mint egy nagy, vegyes tematikájú korpuszban (szöveggyűjteményben).
Váradi Tamás, Pintér Tibor, Mittelholz Iván és Peredy Márta Bibliográfiai adatok automatikus kinyerése című előadása zárta az információkinyerésről szóló előadások sorát. Míg a természettudományos publikációk szinte kizárólag angol nyelvűek, addig a társadalom- és bölcsészettudományokat sok nyelven művelik. Egy-egy cikk, illetve szerző hatása leginkább azzal mérhető, hogy hányan hivatkoznak rá. Ennek automatikus méréséhez az egyes publikációkban azonosítani kell a hivatkozásokat. Ezek előfordulhatnak lábjegyzetben vagy a szöveg végén is. A bibliográfiai tételek formázására vontkozó, kiadványonként eltérő szabályok miatt a hivatkozás egyes elemeire (szerző neve, könyv vagy cikk címe, a publikáló folyóirat neve, évfolyama, a kiadó neve, a kiadás éve stb.) bontása igen összetett feladat.
A konferenciához kapcsolódó kötet letölthető.