//
avoimuus, tiedonhallinta

Avoimen datan julkaisemisesta

Avoimen dataan liittyviä kysymyksiä käsitellään kiinnostavasti sekä Richard Wallisin (The Data Publishing Three-Step) että Gavin Starksin blogikirjoituksessa (Data is not binary : Why open data requires credibility and transparency).

Molemmat kirjoittajat nappaavat kiinni kysymykseen siitä, millä tavoin data tulisi julkaista avoimena ja mitä huomioitavaa julkaisemisessa on.

Wallis yksinkertaistaa prosessin kolmeen vaiheeseen

  1. julkaise data avoimena muiden käyttöön
  2. muokkaa dataa niin, että se on linkitettävissä
  3. kytke data linkitetyn datan webbiin (web of linked data).

1. Julkaise data avoimena muiden käyttöön

Periaatteessa asia on yksinkertainen: data annetaan verkkoon muiden saataville. Asiaan liittyy erilaisia osakysymyksiä. Wallis nostaa pohdittaviksi kysymyksiksi

  • kuinka data lisensoidaan eli millaiset käyttöoikeudet muille käyttäjille annetaan? Wallis antaa hyvänä esimerkkinä selkeyden puolesta Ison-Britannian hallituksen lisenssiehdot data.gov.uk-sivulla
  • onko data ymmärrettävää organisaation ulkopuolisille toimijoille? Datassa esiintyvät termit ja käsitteet eivät välttämättä ole ymmärrettäviä oman organisaation ulkopuolisille
  • olisiko data johdonmukaisempaa yhdessä saman organisaation (tai muiden saman alan organisaatioiden)  julkaiseman muun datan kanssa? Kirjastoalan osalta tämän voisi kai tulkita siten, että mikäli muut kirjastot lähtevät mukaan HelMet-kirjastojen aloittamiin avoimen datan julkaisutalkoisiin, olisi fiksua tehdä jokin yhteisjulkaisu laajempana datapakettina.

Gavin Starks haarukoi tarkemmin datan taustojen merkitystä. Starksin mukaan etenkin tieteellisen datan käytettävyyden kannalta tärkeää on pohtia datan luotettavuuteen liittyviä kysymyksiä. Luotettavuuden arvioinnissa tärkeitä taustatietoja ovat

  • How was the data collected?
  • How should the data be used?
  • Are the models for processing the data valid?
  • What assumptions exist, in words and equations?
  • What is the significance of the assumptions?

Haasteita datan hyödynnettävyyteen esimerkiksi tutkimuskäytössä tuo se, että dataa voidaan tulkita eri tavoin. Starks määrittelee viisi kohtaa, jotka tulisi ilmaista dataa julkaistaessa:

  1. raaka data itsessään (the raw data)
  2. olosuhteet datan kokoamisen taustalla (the circumstances of its collection)
  3. metodit ja oletukset, jotka vaikuttivat datan käsittelyn taustalla (the method and assumptions used to process the data (in words and equations))
  4. tämän käsittelyn tulokset (the results of the processing)
  5. metodin jo tiedetyt rajoitukset ja ennakko-oletusten merkitys (the known limitations on the method and significance of the assumptions).

Starks esittelee, miten Association for Medical Education in Europe (AMEE) pyrkii vastaamaan näihin haasteisiin. Kuusikohtaiseen ratkaisuun kuuluu

  1. Aggregation
  2. Content Enhancement
  3. Discoverability
  4. Repeatable Quality
  5. Computable Engine
  6. Interoperability and auditability.

2. Datan linkitettävyys

Wallis painottaa avoimen, linkitettävyyttä parantavan standardin formaatin merkitystä. Dataelementeillä tulee olla yksilölliset tunnisteet (unique identifiers) ja näiden tunnisteiden tulee toimia web-linkkeinä. Prosessi voi edellyttää datan mallintamista: dataelementtien ja niiden välisten suhteiden määrittelyä. Lopputuloksena tästä vaiheesta on julkaistun datan RDF-kuvaus linkitettävän datan periaatteiden mukaisesti. Wallis mainitsee, että tämän vaiheen voi toteuttaa jokin muukin toimija, kunhan data on ylipäätään avoimena.

3. kytke data linkitetyn datan webbiin (web of linked data)

Vaiheiden 1 ja 2 jälkeen tulisi data saada kytketyksi osaksi linkitetyn datan webiä (Web of Linked Data). Tämä vaihe voidaan viedä läpi eri tavoin. Wallis heittää kolme mahdollista tapaa:

Ja miksi nähdä kaikki tämä vaiva? Wallisin perustelut ovat lisäarvon tuominen sekä dataan että palveluihin:

So that your data can be linked with other data to add value to the experience of consumers of your data and services, as well as others using your data to add value elsewhere. (Wallis)

Advertisements

Keskustelu

Ei kommentteja.

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s

%d bloggers like this: