nyest.hu
Kövessen, kérem!
Legutolsó hozzászólások
A nyelvész majd megmondja
A legnépszerűbb anyagok
Írjon! Nekünk!
nyest.hu
nyest.hu
 
Hogyan írjunk cikket számokból? 4.
Adatújságírás: feltörekvő startupok

Cikksorozatunk befejező részében gyakorlati tudnivalókkal látjuk el olvasóinkat. Adatblogra fel!

Varjú Zoltán / Kereső Világ | 2013. április 5.
|  

A hagyományos sajtó mellett sok startup (minimális kezdőtőkéjű, újszerű ötleten alapuló vállalkozás) is megjelent, melyek a változó hírolvasási és -írási trendekre próbálnak reagálni. A teljesség igénye nélkül hármat mutatunk be most ezek közül.

Circa: újság vagy app?

A Circa alapötlete Adrian Holovaty, az adatújságírás egyik atyjának megfigyelésén alapul, mely szerint minden cikknek van egy minimális tényszerű része (mikor, hol, kik és mit csinálnak). Például egy választásokról szóló cikksorozatban ezek jelentős része többször előfordul, ezzel párhuzamosan a cikkekben is sokszor ismétlődnek bizonyos elemek. A Circa szerkesztői és algoritmusai együtt dolgoznak azon, hogy egy adott téma hírfolyama ne tartalmazzon felesleges ismétlődéseket, a hírfolyamok a lehető legkarcsúbbak legyenek, és a frissítések után ne kelljen mindenen újra átrágnia magát az olvasónak.

Circa  érdekessége, hogy a kor divatjával szemben nem törekszik teljes automatizálásra, hanem a szerkesztői munkát ötletesen ötvözi a technikai lehetőségekkel. Zavarban van az ember, amikor az appot teszteli, hiszen kicsit olyan, mint egy hagyományos újság, kicsit olyan, mint a sokadik hírolvasó-alkalmazás.

Adrian Holovaty
Adrian Holovaty
(Forrás: adrian.holovaty.usethis.com)

A hír így tulajdonképpen egy folyamatosan frissülő csatorna. A Circa újragondolta a lead fogalmát is, nem ütős felütéssel nyit egy cikk, hanem a kibányászott tények összefoglalójával, kiemelve ezek közül az újdonságokat. Ez lehetővé teszi, hogy a tényeket mi magunk is felfedezzük, például a térképen rögtön megtekinthetünk egy földrajzi nevet, egy személy esetében a biográfiai adatokhoz ugorhatunk. A cég a közeljövőben kíván belépni az Android platformra. Kérdés, mennyire tartható fenn a költséges működési modell, mennyiben tudnak többet nyújtani, mint az olyan teljesen automatizált versenytársak, mint például a Prismatic és a Wavii.

Prismatic – a felfedező

Ma már köztudott, hogy a Google hamarosan bezárja RSS-olvasó szolgáltatását. Az okok között szerepel, hogy szeretnének nyitni a közösségi média felé. Több mint egy éve elérhető már a Prismatic, ami egyszerre nyújtja a közösségi olvasás élményét, és ügyel arra, hogy elkerüljük a filter bubble-t, azaz azt, hogy virtuálisan be legyünk zárva a saját érdeklődési körünk buborékjába azzal, hogy elrejtik előlünk azt, amire általában nem kattintunk. 

A Prismatic tulajdonképpen arra az egyszerű tényre épít, hogy a közösségi médiában rengeteg tartalmat osztunk meg. A regisztráció során összekapcsolhatjuk Twitter-, Facebook- és Google-fiókjainkat a Prismatickel, beállíthatjuk milyen témák érdekelnek minket, és persze követhetjük itt is ismerőseinket. Mindezt pedig egy nagyon minimalista, magazinszerű felületen.

A Prismatic megkülönböztetőjegye az, hogy a közösségimédia-forrásokat és a felhasználó preferenciáit vegyítve alakítja ki a személyre szabott tartalmat. A használat során egyszerűen tanítjuk a rendszert, például számon tartja, mit olvastunk el, mit osztottunk meg másokkal, mit tettünk a kedvencek közé és mit töröltünk, mi érdektelen. A nyelvtechnológiai megoldásoknak köszönhetően a duplikátumok (ugyanarról a témáról szóló, szinte azonos tartalmú cikkek) száma elenyésző, viszont megdöbbentően jól szolgálja ki a felhasználó ízlését. 

A Prismatic technológiai körökben azzal vívott ki elismerést, hogy nagyon kis létszámú csapattal építette fel az egész szolgáltatást. Az alapító Bradford Cross a Flightcasterrel tette le névjegyét big data-fronton, majd teljesen kívülállóként vágott a hírek újragondolásába. Blogja, a Measuring Measures legendás a szakmában (habár a szerző új cégének indulásakor törölte), mivel itt jelentek meg először a big data termékfejlesztéssel kapcsolatos kérdések. Crossnak nagyon erős elképzelései vannak az adatvezérelt termékek fejlesztésével kapcsolatban, ezek egyike, hogy egy kicsi, erősen és sokoldalúan képzett csapat sokkal hatékonyabb ilyen feladatokra. 

A minimalista külső mögött komoly dizájnmegfontolások állnak. A Prismatic a tartalomra épít, az összegyűjtött híreket könnyen áttekinthető formában prezentálja a felhasználók felé és megkönnyíti a forráshoz navigálást. Ebben nagyon hasonlít a Google-re. A Prismatic célja egy általános felfedező motor (discovery engine) létrehozása, ami nem csak hírek, hanem minden más webes tartalom felfedezésében is segít.

Silk – indíts saját adatblogot!

A Silk egy olyan platfrom, ami lehetővé teszi tetszőleges adatok tárolását, feldolgozását és megjelenítését. A Silk a legtöbb nyilvánosan elérhető adatot tárolja (pl. a Wikipédia, linked data-adatbázisok stb.), de lehetőséget biztosít arra is, hogy mi magunk vigyük fel azokat. Az adatbázisok könnyen szűrhetők is, például ha a kétmilliónál nagyobb lakosságú európai városokat szeretnénk térképen megjeleníteni, akkor nem nekünk kell kézzel ezeket kikeresni. Az adatok szűrése és rendszerezése után egy egyszerű kezelőfelületen kiválaszthatjuk miképp szeretnénk megjeleníteni ezeket. Ezután már csak a kísérőszöveg megírása van hátra.

A Silk egyre népszerűbb, a befektetőket az ötlet megnyerte,de a további növekedéshez bevételt kell szereznie. Sokan a cég legnagyobb értékének a mögöttes technológiát tartják, ami nagyon közel áll a szemantikus web és a linked data ideájához. A szemantikus web alapötlete egyszerű: a weboldalak ne csak az emberileg olvasható és érthető információt tartalmazzák, hanem ezt tegyék elérhetővé szabványos, gépileg feldolgozható formában is. A honlapok felépítése egyszerű, egyrészt nem árt, ha van mit olvasni egy oldalon,  ezt pedig a böngésző számára értelmezhető formába kell becsomagolni, ami a html-szabvány dolga;  ezt kiegészíti a külcsínért felelős CSS  és a JavaScript, ami lehetővé teszi az interakciót is.Ehhez jönnek még hozzá az átlag felhasználó számára gyakran láthatatlan, háttérben futó adatbázis és egyéb szerveroldali eszközök. Berners-Lee a tartalom és a forma (html) mellé kívánatosnak tartaná a jelentés (szemantika) beágyazását is az oldalakba – innen ered az elnevezés.

A linked data – vagyis linkelt adatok – ennek egy visszafogottabb megvalósítása, ami az egyes adatelemek közötti kapcsolatokat is tartalmazza, például a Magyarország elem Budapesttel az „ország fővárosa", az Európai Unióval és a NATO-val a „tagállama" viszonyban áll egy ilyen adatbázisban. A Silk erőssége, hogy sok-sok ilyen adatbázist tartalmaz és kifejlesztett egy könnyen kezelhető lekérdezőfelületet ezekhez (szemben a nem szakmabeliek által nehezen elsajátítható standard SPARQL-lel). A felhasználók által létrehozott oldalak pedig további relációkkal gazdagítják az adatbázist, hiszen gyakran két adathalmazt kombinálnak. 

Ha kedvünk van saját adatblogot indítani, akkor érdemes körülnézni a Silk Youtube-csatornáján, átnézni a példákat, és átfutni a tanulási segédleteket. További elméleti és gyakorlati tudnivalókért pedig a legcélszerűbb ellátogatni az első magyar adatújságírás-napra, az inkLinkre

Az inkLink szervezői és a meghívott szakértők április 6-án, szombaton a MÚOSZ-székházban (Magyar Sajtó Háza, 1064 Budapest, Vörösmarty u. 47/A) várják a nyílt adatok és az adatújságírás iránt érdeklődőket. A részvétel ingyenes, de regisztrációhoz kötött. Amennyiben anyagilag is támogatná a szervezést, kérjük válassza a Supporter ticket (Támogatói jegy) opciót. 

Követem a cikkhozzászólásokat (RSS)
Hozzászóláshoz lépjen be vagy regisztráljon.
Még nincs hozzászólás, legyen Ön az első!
Információ
X