-
menasagh: Digitális tanulás...ennek is idővel jönnek meg a követkeményei mint a szombatesti bálnak.2021. 02. 24, 15:16 Hiánypótló online konferencia a...
-
K. Laci: Itt is nagyon sok hangoskönyveket meg lehet találni és elérhető az oldal akadálymnetesen i...2021. 02. 22, 17:59 Fehér bottal a monitor előtt
-
menasagh: Ezeknek a kifejezéseknek a nyelvújításkori változásokhoz van-e köze ?2021. 02. 17, 21:25 Bocsát és bocsájt
-
gekovacsistvan: Talán folytatnám a 23. - tól ( A többbi engem nem érdekel) "A Nomád Együttműködés Rendszer...2021. 02. 15, 12:38 A honfoglaló férfi, a gender studies...
-
menasagh: Valahol azt olvastam, hogy a biblia a régi eposzokból megmentett részletek átírása, tehát ...2021. 02. 14, 18:00 Jáfet, Magóg és magyarok mindenhol
Nyelvről vitatkozik kollégáival?
Kételyei támadtak?
Kálmán László nyelvész olvasóink égető kérdéseire válaszol:
- Így műveld a nyelvedet
- Utoljára a bicigliről
- Start nyelvstratégia!
- Változás és „igénytelenség”
- Mit állítsunk?
Olvasgassa itt a rovat korábbi cikkeit is!

Ha legutóbb kimaradt, most itt az új lehetőség!
Ha ma csak egyetlen nyelvészeti kísérletben vesz részt, mindenképp ez legyen az!
Finnugor nyelvrokonság: hazugság
A határozott névelő, ami azt jelenti, hogy ‘te’
Az oroszok már a fejünkön vannak!
Az adatbányászat módszerével a milliónyi oldalra rúgó tudományos publikációk közül ki tudjuk választani a számunkra relevánsakat. Az adatbányászat módszerét azonban nem használhatjuk szabadon, ugyanis a nagy kiadók adatbázisai nem férhetőek hozzá.
A Manchesteri Egyetem evolúcióbiológusa, Dr. Casey Bergman és Max Haeussler, a Kalifornia Egyetem kutatója kifejlesztették a Text2genome elnevezésű szoftvert. Ez az adatbányászó program képes a tudományos szövegekben azonosítani azokat a betűkombinációkat, amelyek DNS-szekvenciákat, azaz géneket írnak le, és képes kiválogatni az ezekről tett állításokat. Segítségével egy adatbázisból összegyűjthetjük mindazokat a tudományos cikkeket, amelyek ezt a szekvenciát tárgyalják. Az adatbányászó programnak köszönhetően tehát a kutatók egy adott génnel kapcsolatban könnyen és gyorsan megtalálhatják a releváns szakirodalmat... Azaz megtalálnák, de a dolog nem ennyire egyszerű.
Az oldal az ajánló után folytatódik...
A nagyobb tudományos kiadók ugyanis ellehetetlenítik a kutatásokat. A világ legnagyobb kiadói ugyanis – amilyen az Elsevier, a Macmillan vagy a Wiley –, amelyek a világ legtöbb tudományos publikációját kezelik, nem engedélyezik az adatbányászatot, mivel az általuk publikált tartalmak nem szabadon nem hozzáférhetőek. Súlyos pénzeket kell fizetniük a tudósoknak, a kutatóintézeteknek, hogy ezeket az adatbázisokat használni tudják.
Jóllehet az orvostudományi kutatásokban különösen fontos, hogy az interneten gyorsan és könnyen elérhetőek legyenek mindazoknak a kutatásoknak az eredményei, amelyek a világon folynak. Ahhoz, hogy ezeket hatékonyan használni tudják a tudósok, egyszerre kell, hogy hozzáférjenek több tízezer tudományos cikkhez egy adatbázisban.
Mivel évente körülbelül 1,5 millió tudományos publikáció lát napvilágot, az adatok, az eredmények megkettőzésének az esélye igen nagy. Egy-egy kutatótól nem várható el az, hogy ilyen mennyiségű adatot fejben tartson (ugyanis ez képtelenség), ezért lenne igazán nagy szükség a számítógépekre, az adatbányászó szoftverekre.
Különböző új adatbányászati technikákkal eddig még nem ismert mintázatokat fedezhetnének fel, kapcsolatokat kereshetnek milliónyi adat között. Az adatbányászat technikája a 21. században elfogadott kutatási módszernek számít, és egyre inkább elterjedt világszerte. Ezzel a technikával ugyanis olyan összefüggésekre derülhet fény, amelyek mindeddig rejtve maradtak a többezernyi oldalas kutatási anyagokban.
Éppen ezért az utóbbi időben egyre többen az adatok, a cikkek szabad hozzáférhetősége mellett kampányolnak: mindazokat a tudományos eredményeket, amelyek közpénzből lettek finanszírozva, szabadon hozzáférhetővé kell tenni. Ha ez megvalósulna, akkor az adatbányászat is probléma nélkül működhetne.
Forrás
Text mining: what do publishers have against this hi-tech research tool?