//
avoimuus, kirjastopalvelut, seminaarit, tiedonhallinta, verkkopalvelut

Online11: Datan avausta ja semantointia

parksdh, $G_{\mu\nu}+\Lambda g_{\mu\nu} = \frac{8\pi G}{c^4}T_{\mu\nu}$, https://secure.flickr.com/photos/parksdh/5663203649/

Isossa-Britanniassa on avoin data -liikkeen myötä kasvanut paine lisätä julkisin varoin tuotetun datan hyödynnettävyyttä. British Libraryn (BL) edustaja Neil Wilson heitti McKinsey Global Institute arvion, jonka mukaan Euroopan valtioiden julkiset sektorit voivat saada datansa avaamisesta vuositasolla lisäarvoa 250 biljoonaa puntaa (Henke et al. 2011, 65).

Metadatansa avaamisella BL halusi siirtyä teoriasta käytäntöön. Tavoitteena kirjastolla oli julkaista ns. ”kriittinen massa” luettelointidataa ja toisaalta vähentää raja-aitoja, jotka hidastavat bibliografisen metadatan innovatiivista hyödyntämistä. Linkitetyn datan teknologioiden hyödyntämisellä BL tavoitteli puolestaan datan helpompaa hyödynnettävyyttä yli maantieteellisten ja sektorirajojen. Tavoitteena oli päästä ulos kirjastospesifeistä standardeista ja ottaa käyttöön webin kehittämisessä yleisiä standardeja. Lisäksi linkitetyn datan integrointi muihin web-varantoihin on helpompaa. Parempi hyödynnettävyys puolestaan lisää näkyvyyttä.

BL avasi 3–15 miljoonaa tietuetta sisältäviä datasettejä CC-lisenssein ja kirjaston järjestelmässä on tapahtunut heinäkuun 2011 jälkeen miljoona transaktiota, mikä vahvisti käsitystä siitä, että käyttökelpoista dataa kyllä hyödynnetään, jos datan tuottava organisaatio tämän mahdollistaa. Yhteistyötä BL on tehnyt JISC:n ja linkitetyn avoimen datan implementoijien kanssa teknisiin, standardointiin ja lisensointiin liittyvien haasteiden kanssa.

Projektissa edettiin valitsemalla tavoitteisiin sopiva CC-lisenssi (CC0). Data sijoitettiin Talis-yrityksen palvelinympäristöön. Asiantuntija-apua pyydettiin myös muun muassa W3C:ltä.

Lisätavoitteina hyödyntää jo olemassa olevia työkaluja ja teknologioita mahdollisimman pitkälle. Kirjasto halusi myös lisätä oman talon asiantuntijaosaamista projektin myötä. Erityisesti kirjasto pyrki hyödyntämään oman talon luettelointiosaamista eikä pelkkää IT-osaamista.

Liikkeelle lähdettiin yksinkertaisesti ja kehitystyössä edettiin henkilökunnan osaamistason kasvun mukaan. BL teki myös yhteistyötä Taliksen kanssa: yhtiö muun muassa tarjosi koulutusta ja osallistui teknologisen alustan määrittelyyn. BL halusi ns. kytkeä datansa laajempaan kontekstiin. Linkityksiä tehtiin muun muassa GeoNames-, Lexvo– ja RDF Book Mashup -varantoon.

Lähtökohtaisesti bibliografista metadataa ei ole luotu tätä varten. Datamallinnukseen ja datan säilyvyyteen kannattaa panostaa. Teknologia kehittyy ja moni toimija opettelee vasta, mikä tuo omia epävarmuustekijöitä matkaan. Prosessissa kannattaa hyödyntää jo olemassa olevia työkaluja ja osaamista. Semanttisen webin yhteisöltä kannattaa pyytää palautetta eri vaiheissa. Konversiossa paljastuu vanhoja luettelointidatassa piileviä ongelmia ja syntyy toisaalta uusia. Ongelmat ja haasteet huomioiden Wilson kuitenkin totesi BL:lle datan julkaisemisen olevan tärkeämpää kuin 100 %:n puhtaan ja täydellisen lopputuloksen hakeminen.

”But it’s often better to release an imperfect something than a perfect nothing!”

Advertisement

Keskustelu

Trackbacks/Pingbacks

  1. Päivitysilmoitus: Online Information 2011 « Sorvipenkki - 31.12.2011

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out /  Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out /  Muuta )

Muodostetaan yhteyttä palveluun %s

%d bloggaajaa tykkää tästä: