//
informaatiotutkimus, tiedonhallinta, verkkopalvelut

Dataumpioista datamolekyylipilviin

Suru mainion Taliksen Library 2.0 Gang -keskustelusarjan taannoiselle päättymiselle on kääntymässä iloksi: Harvardin yliopiston kirjastoblogin (The Harvard Library Innovation Laboratory) podcast-sarja vaikuttaa potentiaaliselta seuraajalta Library 2.0 Gangille.

Oma riemuni repesi kuunneltuani haastattelua, jossa David Weinberger jututti Karen Coylea. Aiheena oli linkitetty (avoin) data ja kirjastot (The Molecule of Data http://librarylab.law.harvard.edu/blog/2011/09/27/library-labthe-podcast-008-the-molecule-of-data/). Keskustelu mp3-muodossa: http://hlsl10.law.harvard.edu/blog/wp-content/uploads/podcast/2011-09-27_karencoyle.mp3

Linked Data (Semantic Web) candies, reedster, http://www.flickr.com/photos/reedsturtevant/4288406572/

Linked Data (Semantic Web) candies, reedster, http://www.flickr.com/photos/reedsturtevant/4288406572/

Perusideaa linkitetystä (avoimesta) datasta avaa hyvin Laila Heinemann Tietolinjan artikkelissa Kirjastodataa raakana.

Haastattelu kestää vain parikymmentä minuuttia, joten polvivesiä syvemmälle ei valitettavasti päästä. Keskustelu toimiikin hyvänä aperitiivina, kun pääruokana Coylen osalta voi pitää hänen teostaan Understanding the Semantic Web : Bibliographic Data and Metadata (2010, Library Technology Reports, vol. 46, nro 1).

Coyle määrittelee kirjaston ongelmaksi bibliografisen datan osalta sen, että nykyinen luettelointi on suunniteltu suljettuja järjestelmiä varten. Tavassamme toimia ja tuottaa dataa on paljon hyviä puolia, kuten se, että työtä tehdään rakenteisilla, dokumentoiduilla formaateilla. Eräs huono puoli on se, että nämä kirjastojen käytännöt eivät ole tuttuja esimerkiksi webin kehittäjäyhteisöille. Esimerkiksi MARC-formaatti ei ole web-kehittäjien käytössä. Tämän voi nähdä yhdeksi syyksi sille, että tietueemme pörisevät eräänlaisessa kirjastojen omassa pikkunetissä.

Tästä tilanteesta kumpuaa Coylen mukaan erilaisia muutostarpeita: Luetteloinnin ja sisällönkuvailun osalta pitäisi nähdä kirjastojen tuottama bibliografinen data osana laajempaa kontekstia, muuta webiä. Käyttäjäkunnaksi pitäisi nähdä muutkin kuin suppea kirjastoyleisö eli muut kirjastot ja kirjastonkäyttäjät. Lisäksi avoimen datan osalta kirjastojen pitäisi Coylen mukaan nähdä avoin data itselleenkin mahdollisuukseksi ja miettiä, kuinka erilaisia hyödynnettäviä datavarantoja voidaan hyödyntää kirjastopalvelujen kehittämisessä. Kolmanneksi muutostarpeeksi voidaan nähdä tarvis avata kirjastojen metadata webiin. Yhtenä lopputuloksena on kirjastodatan parempi hyödynnettävyys ja saavutettavuus. Muutos edellyttää Coylen mukaan sisällönkuvailun ja luetteloinnin ajattelua uusiksi.

Coyle haluaa datan ns. eroon formaateista. Nykyinen kirjastojen MARC-muotoinen tietueformaatti on hankala. MARC on kehitetty Coylen mukaan merkkauskielimäiseksi formaatiksi, joka perustuu noin neljäkymmentä vuotta vanhoihin tekniikoihin (On the Record : Report of The Library of Congress Working Group on the Future of Bibliographic Control). Datan esitystavat ja hyödyntämismahdollisuudet ovat rajatut. Käyttämiemme formaattien mukaiset tietueet ikään kuin lukitsevat datan sisäänsä.

Linkitetystä datasta on kaavailtu apua näihin vaivoihin. Linkitetyn datan perusideaksi Coyle määrittelee datamolekyyli-käsitteen, jolla hän tarkoittaa sitä, että data esitetään pieninä itsenäisinä hippusina. Nämä hippuset ovat puolestaan helpommin yhdisteltävissä keskenään ja eri lähteistä. Toimintamalli on myös joustava: linkitetyn datan pilveen on helppo lisätä uutta dataa. Tavoitetilanteessa lopputuloksena on ikäänkuin datamolekyylipilvi, joka on web-standardien mukaan tuotettu ja hyödynnettävissä oleva.

MARC-tietueformaatin hyviä puolia on se, että se on suhteellisen hyvin kuvattu ja sillä on suhteellisen selkeät säännöt. Yhteentoimivuutta syntyy helpommin tältä pohjalta. Weinberger kysyy, miten saavutetaan yhteentoimivuus linkitetyn datan ympyröissä. Coylen mukaan yhteentoimivuuteen päästään julkaisemalla informaation sisältö ja rakenne standardissa muodossa avoimesti.

Haasteita

Koska on kyse kirjastoalalla uudesta asiasta, puuttuvat meiltä parhaat käytännöt. Linkitetyn datan teknologia tarvitsee stabilisaatiota ja stabiilimpi tila saavutetaan Coylen mukaan ajan kanssa ja tekemällä kokeiluja uudella teknologialla. Tarvetta olisi Karen Coylen mukaan osaamisrintaman laajentamiselle. Tällä hetkellä tekninen osaaminen kirjastoalalla keskittyy järjestelmäntoimittajille ja muutamille isoille yksiköille, kuten kansalliskirjastoille.

Mainokset

Keskustelu

Ei kommentteja.

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s

%d bloggers like this: