//
avoimuus

Pari riviä kesäkuun HRI Open Cafésta

Kesäkuussa kokoontui HRI Open Café Kaisaniemessä Café Pirittassa. Tilaisuus oli kaikille avoimesta datasta kiinnostuneille. Tapaamisessa ideoitiin työpajatyöskentelynä erilaisia konkreettisia projekteja ja mietittiin ongelmia, joita näissä projekteissa voi nousta vastaan. Tapaaminen oli hedelmällinen, sillä lopputuloksena oli koko joukko hyviä kysymyksiä.

Tilaisuuden järjesti Helsinki Region Infoshare (HRI), joka edistää avoimen datan laajenemista pääkaupunkiseudulla ja pyrkii löytämään vastauksia muun muassa kysymyksiin, kuinka julkaistaa avointa dataa ja miten hyödyntää sitä.

Muutamia nostoja, mitä minulla jäi mieleen istunnosta.

Miksi avata?

“Miksi avata” on inhottavan hyvä kysymys. Miten perustella avaaminen? Miten avointa dataa hyödynnettäisiin? Kuinka kypsä ja pitkälle lopputuote on oltava tähtäimessä, kun datan avaamista lähdetään suunnittelemaan? Hyvät esimerkit maailmalta ovat tarpeen muun muassa kirjastojen osalta. Kirjastomaailmasta mielenkiintoinen pelinavaus tulee Münsterin yliopistosta, joka on strategiassaan (Linked Open Data University of Münster, LODUM) ottanut tavoitteekseen parantaa yliopiston näkyvyyttä avoimen datan ja avoimen saatavuuden (open access) kautta.

Eric Hellman on puolestaan blogissaan käsitellyt luettelointidatan merkittävyyttä, ja olen monessa kohtaa Hellmanin kanssa samaa mieltä (Library Data: Why Bother?). Hellman on huolissaan bibliografisen datan merkittävyydestä.

Library produced data is still important, but it’s not essential in the way that it used to be. (Hellman)

Luetteloinnin yhtenä peruslähtökohtana on se, että parannetaan/mahdollistetaan aineiston löydettävyyttä ja tätä löydettävyyttä ja hyödynnettävyyttä voidaan Hellmanin mukaan datan avaamisella parantaa. Datan monimuotoinen hyödyntäminen puolestaan lisää koko kirjastolaitoksen relevanssia muulle yhteiskunnalle.

Kannattaako olla eturintamassa kokeilemassa? Datan avaamisesta koituvat hyödyt voivat olla yllättäviä ja uusia, joten hyötyarvioiden tekeminen on vaikeaa. Yritysmaailmassa on nyt trendikästä olla Facebookissa. Missä vaiheessa on trendikästä tarjota avointa dataa?

Fasilitointi

Yhteistyöverkostot ja fasilitaattoritoiminta ovat tärkeitä. Yksi Helsingin alueen fasilitaattoreista on Forum Virium. Vastaavaksi fasilitaattoriksi voisi sopia esimerkiksi Tampereen seudulta COSS.

Toimintatapa, -ympäristö

Avoin data tarkoittaa monia asioita. Yksi näistä on ajattelutavan kiepauttaminen uuteen asentoon, sillä tulokulma omaan toimintaympäristöön voi muuttua enempi vähempi radikaalisti. Jotkut yritykset voivat kokea avoimen datan uhkaksi liiketoimintamallilleen. Yrityksen toimintaan liittyvän datan helpompi käytettävyys voi mahdollistaa esimerkiksi helpomman kilpailuttamisen. Avoin data voi näyttäytyä nopealla vilkaisulla uhkaksi omalle liiketoiminnalle. Toisaalta tämän voi vääntää niinkin päin, että avoin data voi mahdollistaa yritykselle uudenlaisia liiketoimintamalleja, uusia tuotteita, uusia mahdollisuuksia.

Miten?

Tietoturvan kannalta julkaistava data voi olla liian tarkalla tasolla. Anonymisointi pitäisi tehdä ennen luovutusta datavarantoon.

Datan avaamista on syytä hautoa myös organisaation lakimiesten ja päättävässä asemassa olevien kanssa, koska vaikkapa datan lisensointi on merkittävä sääntelevä tekijä siinä, kuinka dataa voidaan hyödyntää. Avaamisen taustalla voi vaikuttaa myös historian painolasti: toimijoilla voi olla erilaisia alihankkijoiden kanssa tehtyjä iänvanhoja sopimuksia, jolloin ei ole voitu huomioida datan avaamiseen liittyviä kysymyksiä. Avoin data voi merkitä muutostarpeita sopimuksiin ja liiketoimintamallien uudelleenrakentamista.

Jos organisaatio avaa isoja datamääriä, pitää olla järkevä varanto, jonne dataa voidaan tallentaa. Tämä on yrityspuolella suurimpia kysymys. Kuka tarjoaa datan säilytystilan ja kuka tarjoaa esimerkiksi ETL-välineet (Extract, transform, load -työvälineet, Wikipedia-artikkeli) datanvarastoimiseksi? Miten minimoida päällekkäisyys, että samoja asioita ei tehtäisi sata miljoonaa kertaa? Millaisten rajapintojen takaa palveluja tarjotaan? Yritykset ja kunnat eivät ole innokkaita päästämään kontrolloimatta käyttäjiä palomuuriensa taakse.

Parhaat käytännöt pitäisi saada julki: miten tehtiin, miten dataa hyödynnettiin jne.

Millaista dataa voi julkaista?

Miksi-kysymyksen lisäksi toinen hyvä ja perustavanlaatuinen kysymys on se, voiko julkaista huonoa, valmistelematontakin dataa? Voiko data itseasiassa olla ns. Read/Write-dataa, jota voidaan muokata vapaasti. Avoin muokattavissa oleva data voi antaa mahdollisuuden esimerkiksi crowdsourcing-henkiseen datan validointiin. Mikäli käyttäjäyhteisö on aktiivinen, se pystyy korjaamaan itse mahdolliset ilkityöt. Käytännön esimerkki tästä on Wikipedia ja ne toimintamekanismit, joilla siinä palvelussa siivotaan mahdolliset tarkoitukselliset tai vahingossa tuotetut virheet.

Eri toimijoiden tyypillinen reaktio on yllättyminen siitä, että dataa voidaan hyödyntää näinkin. Ehkä viiden, kymmenen, kahdenkymmenen vuoden päästä datan avoimuus voi olla itsestään selvää jo siinä vaiheessa kun dataa tuotetaan. Avoin data voi enteillä uudenlaista käyttäjäsukupolvea ja teknologista toimintaympäristöä, josta voi nähdä viitteitä siinä, että erilaisia datantyöstämistyökaluja syntyy SaaS-pohjaisesti yhä enemmän. Esimerkiksi Google Refine, jolla voi työstää erilaisia datamassoja. Eräs mielenkiintoinen uusi palvelu on visual.ly-verkkopalvelu, jolla käyttäjä voi luoda infografiikkoja web-pohjaisista datamassoista (Mashablen artikkeli Find & Make Your Own Infographics With Visual.ly).

Open data -työpajat ovat opettavia sinällään. HS:n työpaja 23.5. osoitti, että datadumpin hyödyntäminen on haastavaa muun muassa tarvittavien tietojen löytämisen osalta (Kutsu: HS Open #2 – Seurataan rahaa 23.5. ja HS Open 2 tuotti parikymmentä prototyyppiä). Dumpin julkaiseminen on avoimuuden kannalta jo sinällään hyvä juttu, mutta hyödyntämistä helpottaa järkevän lisensoinnin lisäksi riittävän hyvät kuvaukset siitä, miten datadumppi on koostettu.

Luvassa on mahdollisesti vielä muutamia kahvilatapaamisia. Tietoa tilaisuuksista kannattanee seurata HRI:n Facebook-sivulta.

Mainokset

Keskustelu

One thought on “Pari riviä kesäkuun HRI Open Cafésta

  1. Hyvä kooste, kiitos tästä, en itse päässyt osallistumaan kesäkuussa.

    Posted by Antti Poikola | 25.07.2011, 6:50 am

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s

%d bloggers like this: