Web Koncept

új alkalmazások, szolgáltatások a nemzetközi mezőnyből merítve, web trendek, technológiák, szemléletváltás, forradalom

Archívum

Licenc

Creative Commons Licenc

HTML

Freebase, a digitális világ adatbázisa

2007.05.08. 08:00 | kósa.szabolcs | 3 komment

Március elején jelentették be azt a szolgáltatást, amely sokak reménye szerint az egyik megalapozója, előfutára lesz annak a víziónak, amelyet alkotói szemantikus webként fogalmaztak meg. Meghatározó vélemények szerint ez az internet fejlődésének egyik útja. Csapatunknak sikerült partizán jelleggel beszivárogni az alfa verzió csekély számú tesztelői közösségébe. Az azóta kialakult benyomásokról és tapasztalatokról az alábbiakban olvashattok.

A Metaweb által alapított, Freebase nevű startup azt az ambíciózus célt tűzte ki maga elé, hogy logikailag is struktúrált, relációs adatbázisba szervezze a világon szabadon elérhető digitális információhalmaz egészét, egyfajta nyitott katalógust létrehozva ezáltal. Természetesen, mint minden ilyen nagyszabású vállalkozás számos problémával kell hogy szembenézzen, azonban bizonyos megoldásai olyannyira előremutatóak, hogy várhatóan számos írás születik még róla, míg szolgáltatásai nyilvánossá válnak.

A Freebase-t a Metaweben keresztül régi iparági motorosokból álló tehetséges csapat alkotja. A pénzügyi hátteret a Benchmark Capital és egyéb kockázati tőkebefeketetők 15 millió dolláros A szériás bevonásával sikeresen teremtették meg.

"Data commons" - az információ, mint közvagyon

Ahogy azt már említettem a Freebase alapvetően egy adatbázis technikai értelemben is. Forradalmi lényege abban rejlik, hogy az információs "szigetek" közti rést, a logikát, a releváns kapcsolatokat, a metaadatokat a rendszer felhasználói hozzák létre.

Jogosan merülhet fel a kérdés, hogy létezik már ilyen a felhasználók által szerkesztett tudásbázis, mi szükség van egy újabb ilyen modellre. A Freebase nem tagadja meg ezt az "örökséget", következetesen idéz a Wikipediából de rámutat a weben elérhető egyéb tartalmakra is. A különbség abban rejlik, hogy itt lexikon helyett inkább egy univerzális katalógusról beszélhetünk, ahol mindig pontosan tudjuk, hogy a vizsgált entitás milyen típusokba tartozik és milyen fogalmi szinteken kapcsolódik más típusba tartozó entitásokhoz, nevezhetjük akár a web egyik reménybeli szemantikus rétegének is.

A két szolgáltatás közti rokonság (ingyenes hozzáférés, felhasználók által szerkesztett tartalom) magával hozza azokat a problémákat, amelyekkel a Wikipedia is szembesült története során az információk integritásával, helyességével kapcsolatban, azonban a készítőknek úgy tűnik van koncepciójuk a problémás helyzetek kezelésére. Maga a rendszer egy adatkarbantartó csapat folyamatos felügyelete alatt működik, akik részben a felhasználói visszajelzések alapján törlik a nem odaillő tartalmakat, esetleg egyesítik a duplikált entitásokat.

Természetesen illik egy ilyen önkéntes munka esetén felvázolni az ezzel kapcsolatos közös előnyöket. Véleményem szerint már az első lépések során is sikerült ezt a célt elérni és demonstrálni azon kevesek számára akik meghívót kaptak. A nemzetközi visszhang a blogoszférában nagyon pozitív. Az ingyenes és egyszerű hozzáférhetőség a rendszer adataihoz várhatóan sok izgalmas ráépülő szolgáltatást fog eredményezni.

A Freebase miután felhasználja az interneten ingyenesen már elérhető digitális közvagyont, a saját adatbázisát is a nyitottság szellemében elérhetővé teszi a Creative Commons licensz szerint. Az adatbázisban tárolt információk közti kapcsolat a megalkotott fogalmi rendszer (ontológia) és a benne foglalt relációk alkalmazásának segítségével nem csak emberek hanem szoftver ágensek számára is értelmezhetővé válik.

Nyitottság

A Freebase saját, jól dokumentált API kiadásával már a kezdetektől lehetővé teszi a rendszerben tárolt adatok külső alkalmazások általi lekérdezését, sőt akár magát az adatok kezelését (feltöltés, módosítás, törlés) is.

A szabadon elérhető adatokra alapozva bárki elkészíthető külső alkalmazását, akár a teljes adatbázismegoldást a Freebase-re építve. Természetesen ez esetben a külső rendszerben felvitt adatok is a Freebase adatbázisában landolnak, az adott licenszfeltételek mellett. Ezt támogatja az is, hogy bárki létrehozhatja saját adattípusát a rendszerben. Ez a flexibilis modell számos igen kreatív megoldást tesz lehetővé, az oldalon ma is elérhető több az adatokra alapuló vizualizációs demó alkalmazás. Az első ilyen fecskék közt megtalálható étteremajánló, zenetörténeti és több mozival kapcsolatos szolgáltatás.

A Freebase API akcióban - Cinespinner


Adatmodell

A Freebaseben zajló tevékenység az adatok 4 alapvető szintjén bonyolódik:

Domain : az ontológia legfelsőbb szintje, mint például Film vagy Csillagászat, a domainek olyan fő kategóriarendszerbe vannak csoportosítva mint például Média vagy Tudomány és technológia

Type: doménen belüli osztály, mint például Filmrendező vagy Bolygó

Topic: típuson belüli entitás, mint például Steven Spielberg vagy Föld

Property: az adott entitáshoz kapcsolódó tulajdonságok, mint például név

Egy rövid példa. A Freebaseba történő regisztráció során magunkat a Felhasználó típusba soroljuk. A Felhasználó típus egyik attribútuma (property) jelenti a kapcsolatot a felhasználói accountunk (user) és saját magunk, mint Személy (person) közt. A kettő közti különbség a különböző attribútumok mellett részben abban rejlik, hogy a felhasználóhoz kapcsolódó adatokat magunk szerkeszthetjük így egy szubjektív képet alkotva magunkról, míg a személyek adatlapja (topikja) bárki által szerkeszthető. Azt azonban eldönthetjük, hogy felhasználói accountunkat kapcsoljuk-e egy személy topikhoz avagy nem.

A különböző típusokhoz rengeteg rendszeren belüli (topikok, típusok, domainek) és kívüli hivatkozást, kapcsolatot lehetséges megadni. Egy zenekar esetében ez például a teljesség igénye nélkül műfajokat, albumokat, dalszövegeket, tagokat, kiadót, dalokat és természetesen külső linkeket is tartalmaz. Mindehhez természetesen az is hozzátartozik, hogy egy topik egyszerre több típusba is tartozhat (pl. egy vállalat esetében, mint jogi entitás, mint üzlet, mint munkaadó).

Egy vállalat típusba tartozó topic (entitás) leírását láthatjuk a lenti fotón.


Adatbázis elérés

A Freebase adatbázisát lekérdezni, módosítani a Metaweb által kifejlesztett saját nyelv, a Metaweb Query Language (MQL) által szabályozott keretek közt lehetséges. A lekérdezés és az írás is JSON (JavaScript Object Notation) objektumokon keresztül történik. Rövid betekintés után is elmondható, hogy rendkívül egyszerű lesz a fejlesztés a Freebase adataira támaszkodva, akár a teljes adatbázis problémát ezen a platformon lehetséges kezelni.

Felhasználói felület

A Freebase törekvése, amely a közösség munkájára alapoz, nehezen lenne kivitelezhető ha a felhasználói felület nem lenne minél barátságosabb és használhatóbb. Ez ma részben valósul csak meg, de a megközelítéssel véleményem szerint alapvetően nincs gond. A felület egyszerű, áttekinthető, sok AJAXal fűszerezve. Könnyen hozzá lehet szokni és a ha az ember elkezd játszadozni, létrehozni dolgokat, nehezen tudja abbahagyni. Nem nehéz elképzelni az erre fogékony tömegeket, amint szédítő sebességgel kategorizálják be a dolgokat és töltik fel a tartalmakat, miután publikus lesz a Freebase.

Nem sikerült kinyomozni, milyen formában támogatja a rendszer a későbbiekben a többnyelvűséget, bár annyi azért kiderült, hogy a nyelv, mint rendszertípus már elő van készítve, tehát hamarosan megjelenik ez a nagyon fontos vetület is.

Záró gondolatok

Jómagam régóta vártam, hogy megjelenjen egy hasonló szolgáltatás, mivel szívügyem az emberiség tudásának megőrzése és ingyenesen hozzáféhetővé tétele. Ami eddig megvalósult ígéretesnek tűnik. Drukkolok a sikerért, már csak azért is mert egyre aggasztóbb, hogy az Internet is megkapta a maga mogulját (Google), aki az információk keresésének és az ezzel kapcsolatos üzletnek szinte egyeduralkodója a mai piacon, pénzügyi potenciáljára alapozott sorozatos felvásárlásokkal (némelyet még ezek közül is hagynak elsorvadni) és új szegmensekbe való terjeszkedéssel már nem mindig az általa is megfogalmazott "do no evil" szellemében cselekszik, bár azért persze szeretjük őket ;).

A Freebase és az egyéb még "lopakodó" fázisban lévő megoldások (mint pl. Radar Networks) reményeim szerint új kategóriát és direkt kihívást teremtenek a piac nagy szereplőinek a saját területükön (információk keresése). Arról, hogy hogyan lesz ebből nagy üzlet most nem szóltam, de nem nehéz elképzelni, hogy van a csapatnak koncepciója, mivel a kockázati tőkét is sikerült meggyőzni és egyébként is tudjuk, hogy az információ maga a hatalom. Nagy dolgok vannak készülőben kérem.


Ps. 5 meghívóm van, amit szeretnék szétosztani.  Üzenetben jelezze akit érdekel.

A meghívók elfogytak.

Címkék: internet tudásmenedzsment adatbázis creative commons katalógus freebase

A bejegyzés trackback címe:

https://webkoncept.blog.hu/api/trackback/id/tr3171444

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

molcsa (törölt) 2007.05.08. 20:44:48

köszi a meghívót. még csak egy fél órát játszadoztam vele, szval csak első benyomások.
úgy tűnik, hogy a description szekció úgy jött létre, hogy egy robot végignent a wikipedian, és lementette a bejegyzések első x betűjét. tudom, hogy ez alapvetően nem tárolni akar infókat, hanem rendszerezni (ha jól értem), de ez akkor is ciki kissé
a taxonómia szintjeit is próbáltam, és úgy tűnik, hogy a jelenlegi állapotában a showbizniszben erősek, viszont pl. a tudományokban eléggé gyengék. a legtöbb oldalon összesen egy taxonómiai szintet lehet megadni (topic), esetleg van egy "also known as" rubrika is.
próbáltam szürni a találatokat is. pl. a "dog" keresőszóra bejött egy csomó találat, köztük az állat is. ezután próbáltam szűrni a találatokat az "animal" topicra, és nem volt egy találat sem.

szval van hova fejlődni, és talán az én hibám, de azt sem látom igazán, hogy mi szükségem nekem erre. de talán később rájövök.

Prof. Grétsy 2007.08.13. 11:14:16

Magyarul licenc, tessék megjegyezni végre.
süti beállítások módosítása