//
seminaarit, tiedonhaku, tiedonhallinta, verkkopalvelut

Herbert van de Sompel, Paint-yourself-into-corner Infrastructure

Z33 art centre, Hasselt, Wesley Meuris - Memento, https://secure.flickr.com/photos/z33be/7506662932/

Z33 art centre, Hasselt, Wesley Meuris – Memento, https://secure.flickr.com/photos/z33be/7506662932/

Herbert van de Sompel pohti esityksessään tieteellistä kommunikointia (scholarly communication) ja miten tutkimusmaailma makaa digitaalisella kaudella. Iso teema Sompelin esityksessä oli tieteellisen työn muutos Internet-aikakaudella.

Digitalisoitumisen myötä perinteisen tutkimuksen rinnalle ovat ilmaantuneet uudenlaiset ilmiöt, kuten datajoukot (datasets), ohjelmistot ja verkkokommunikointi. Digitalisoituminen on tehnyt tutkimuksesta dynaamisemman ja lisännyt toisaalta painetta tutkimustyön dynamisoitumiselle. Perinteiset tieteelliset julkaisut ovat vielä staattisia eivätkä mahdollista julkaisujen jatkuvaa päivittämistä. Osin tälle löytyy varmasti hyvät perusteensa, mutta päinvastaisiakin esimerkkejä alkaa olla. Esimerkkinä tästä on PLoSin laskennallisen biologian (computational biology) julkaisuyhteistyö englanninkielisen Wikipedian kanssa.

Rosemary Dickin (2012) on blogannut aiheesta. PLoSin laskennallisen biologian (computational biology) osioon luotiin artikkelisivu, jossa julkaistaan aiheeseen liittyviä vertaisarvioituja artikkeleita. Kun artikkeli on hyväksytty julkaistavaksi ja julkaistu PLoSissa, artikkeli latautuu myös Wikipediaan ja käy Wikipedian julkaisuprosessin läpi. Tällä haluttiin tuoda näkyvyyttä aiheeseen liittyvälle tieteelliselle julkaisemiselle. Wikipediassa julkaistu artikkeli on siis asiantuntijan kirjoittamaa ja asiantuntijan arvioimaa sisältöä. Kirjoittaja saa myös krediitit työstään.

Tällaisesta tieteellisten julkaisujen uittamisesta Wikipediaan on kirjoiteltu aiemminkin, esim. Jyrki Ilvan yhteenveto vuodelta 2007 ja oma bloggaukseni.

Tieteellisen artikkelin muutosta Sompel kuvasi termillä executable paper. Kyse on julkaisusta, joka ei ole vain lukemista varten vaan myös vuorovaikutusta varten. Käytän termin kökkönä suomennoksena ilmausta toiminnallinen julkaisu.

Kun yhä enemmän tutkimuksesta perustuu laskentaan, tietojenkäsittelyyn, datajoukkojen käsittelyyn, toiminnallisella julkaisulla pyritään tekemään tieteellisestä julkaisusta kokonaisvaltaisempi paketti, joka tarjoaa lukijalle tutkimustulosten varmistamiseksi samoja välineitä, joilla tutkimustulokseen on päästy.

Lopputulos toiminnallisessa julkaisussa on se, että tutkija tarjoaa lukijalle sekä tutkimustuloksensa että tutkimusdatan, riittävät sovellukset ja tutkimustuloksen tuottamista varten suoritettavia tietokonekoodeja. Tässä kokonaisuudessa staattista, perinteistä tieteellistä julkaisua täydennetään vuorovaikutuksellisilla osasilla. Näillä täydentävillä osioilla lukija voi esimerkiksi varmistaa tutkimustuloksia.

Elsevierin järjestämässä Executable Paper Challenge -kilpailussa osanottajat ovat luonnostelleet erilaisia toteustustapoja, joilla tieteellisten artikkelien julkaisuprosessissa voidaan luoda toiminnallisia julkaisuja. Kilpailun finalistien joukossa on useita lähestystapoja aiheeseen. Kilpailun voitti Piotr Nowakowski et al. (2011) kilpailutyöllään The Collage Authoring Environment.

Tässä näkyy kaikuja e-kirja-keskusteluun, jossa on pohdiskeltu, millaiseen muodonmuutokseen e-kirjat voivat joutua. Tällä hetkellähän e-kirjat ovat suurimmaksi osaksi imitaatioita perinteisistä paperijulkaisuista, mutta teknologian tullessa tutummaksi e-kirjan muoto muuttunee. Musiikkipuolella Björkin uusi levy Biophilia on tarjonnut uuden tulokulmaan perinteiseen musiikkijulkaisuun. Biophiliassa musiikkikappaleiden lisäksi on tarjolla 7 iPad-sovellusta, jotka eri tavoin tarjoavat uusia näkökulmia laulujen teemoihin.

Sompel nosti yhdeksi olennaiseksi kysymykseksi, mikä on tieteellinen tietue (scholarly record). Mistä tieteellinen tietue alkaa ja mihin päättyy? Tämä tulee muuttumaan Sompelin mukaan: tieteelliset tietueet muuttuvat joukosta PDF-tietueita verkostoksi, joka on dynaaminen ja joka koostuu toisiinsa eri tavoin kytkeytyneistä komponenteista ja toimijoista. Sompel arvioi, että julkaisut tulevat ns. versioitumaan. Julkaisuista tulee uusia päivitettyjä versioita ja tutkimusjulkaisusta tulee elävä, muuttuva kokonaisuus.

Webin osuus tieteellisessä tutkimuksessa tulee Sompelin mukaan kasvamaan. Siitä tulee osa tieteen infrastruktuuria. Tässä muutoksessa tärkeiksi kysymyksiksi nousee pitkäaikaissäilytys ja tämän infastruktuurin uudelleenkäytettävyys. Tärkeää on myös tieteellisen diskurssin integrointi muuhun webbiin.

Vaikka sisällöt yleisten ja tieteellisten kirjastojen välillä ovat erilaiset, ovat peruskysymykset hyvin samanlaiset: palvelujen uudelleenkäytettävyys ja integroitavuus verkkoympäristöön.

Webin hyödyntämisen ja webbiin siirtymisen myötä myös tieteellisen keskustelun mittaamisen merkitys kasvaa. Tutkimusten vaikuttavuutta pitäisi mitata monella mittarilla myös verkkokeskustelun puolella. Yksi väline tähän on ImpactStory. Kyse on verkkopalvelusta, jonka avulla voi selvittää tutkimustuloksen vaikuttavuutta viiteanalyysia laajemmin. Palvelu kartoittaa eri lähteistä, miten esimerkiksi artikkelia on hyödynnetty, kuten esimerkiksi viittaamalla, tallentamalla kirjanmerkiksi jne.

Jonkinlaiseksi verkkomaailman Sveitsin armeijan linkkuveitseksi ovat muodostuneet HTTP URI -osoitteet. Kyse on oikeastaan webin ytimestä, ja webissä olevien tieteellisten tietueiden olemassa olo rakentuu pitkälti HTTP URIen käyttämiseen. HTTP URIen avulla identifioidaan monia webissä olevat sisältöjä, kuten SlideShare-dokumentit, ohjelmistot, ontologioiden termit jne.

Nykyiset teknologiset ratkaisut esimerkiksi arkistoinnin osalta ovat ristiriidassa webin dynaamisen luonteen kanssa. Nykyisten arkistointijärjestelmien perustuvat pysyvyyteen ja rajojen luontiin. Ongelmallista tuossa lähestymistavassa on se, että web puolestaan elää jatkuvassa nyt-hetkessä. Webistä puuttuvat ajalliset ominaisuudet eikä webillä ole menneisyyttä. Sisällöt vanhenevat, poistuvat käytöstä eivätkä ole saavutettavissa.

Paperikaudella julkaistujen teosten kontekstit pyritään tallentamaan: julkaisuihin ja niihin tehtyjen viittausten tiedot arkistoidaan eri tavoin. Web-aikakaudella julkaisujen kontekstit elävät suuresti. Siinä missä paperiaikakaudella tehdyt julkaisujen väliset viittaukset säilyvät, ei webissä tehdyillä viittauksilla ole välttämättä yhtä pitkää elinkaarta. Lopputulos on se, että julkaisuhetken viittauksia ei saada tallennettua eikä niihin välttämättä voida myöhemmin palata.

Web-maailman muutokset ovat haaste: web-pohjaisen tieteellisen julkaisun kontekstia esimerkiksi viittausten osalta tiettynä ajankohtana ei voida välttämättä rekonstruoida. Luvassa on Sompelin mukaan yhä enemmän 404-tapauksia, joissa on kyse virhetilanteesta, kun tiettyä haluttua verkkoaineistoa ei enää löydy verkosta.

Kuvassa yhdenlainen 404-ilmoitus (http://www.denisechandler.com/404)

Kuvassa yhdenlainen 404-ilmoitus (http://www.denisechandler.com/404)

Sompel korosti verkkohistorian tallentamisen merkitystä Internet-arkistoihin. Hän käytti esityksessä tilaisuutensa mainostaa kehittämäänsä Memento-palvelua. Memento tallentaa sivustoversioita ja antaa mahdollisuuden tarkistaa, miltä tietty sivu näytti tiettynä ajankohtana. Mementolla on yhteisprojekti muun muassa International Internet Preservation Consortiumin (IIPC) kanssa (IIPC Memento Aggregator). Mementolla on yhteistyökuvio myös Wikipedian ja Wikipedian semanttisen version eli DBpedian kanssa. Näissä projekteissa pyritään tarjoamaan pääsy Wikipedian vanhoihin versioihin, esimerkiksi miltä Wikipedia näytti vuonna 2010. Projekti DBpedian kanssa on nimeltään DBpedia Archive @ mementodepot.org.

Mementon avulla sama HTTP URI voi toimia viittausvälineenä ajallisesti muuttuviin informaatiolähteisiin. Jotta tiettynä ajankohtana olemassa olevaan sisältöön voidaan viitata, tarvitaan sekä HTTP URI että tieto halutusta ajankohdasta. Tähän käytetään ns. DURI-osoitteita, joka on lyhenne Dated- (ajankohtatieto) ja URI-termistä.

Tieteellisten julkaisujen saatavuutta on pyritty varmistamaan DOI-osoittein. Sompelin mukaan tämä tekniikka ei auta kaikissa tapauksissa, esimerkiksi kustantamoiden yrityskauppoissa. Omistajavaihdosten yhteydessä kustantajien DOI-osoitteet eivät välttämättä enää pidäkään paikkaansa ja ne eivät viittaakaan enää sinne minne pitäisi, mikäli tätä ei huomioida tällaisissa tilanteessa. Pahimmillaan DOIt siis elävät samassa nyt-hetkessä kuin muukin web.

Käsityksen Mementosta saa Firefox-selaimeen asennettavalla Mementofox-lisäpalikalla.

Arkistointinäkökulma aiheeseen

Web-sisältöjen arkistointiin on erilaisia tapoja. Arkistointipalveluina merkittävää roolia voivat pelata julkaisujärjestelmät, wikit, ns. datawikit (datawikis), joilla on toimivat versiointimekanismit. Sompel heitti esimerkin eräästä arkistointipalvelusta: SiteStory-arkistointipalvelun toimintamekanismi on ns. vuorovaikutuksellinen (transactional). Periaate palvelulla on se, että aina kun tuotantopalvelin pukkaa käyttäjälle tämän haluaman web-sivun, palvelin heittää samalla SiteStory-palvelimelle ko. sivun arkistoitavaksi.

Memento ei estä tieteellisten julkaisujen kokonaisvaltaista tilastointia: ohjelman arkkitehtuuri sallii sen, että sisältöjen käyttö tapahtuu jonkin institutionaalisen toimijan kautta eli esimerkiksi yliopiston tai kirjaston ja näin myös artikkelien vanhojen versioiden käyttö kerryttää artikkelin kokonaiskäyttötilastoa.

Yleisökysymys heitettiin siitä, mikä on yksilön oikeus muuttaa sanomisiaan? Arkistointipalvelut periaatteessa saattavat pitää pysyvästi tarjolla henkilön tiettynä hetkenä, vaikka henkilö ei enää allekirjoittaisikaan sanomisiaan. Sompelin vastaus on, että pitää ajatella viestintävälinettä. Web on luonteeltaan sellainen, että kaikki sinne laitettu myös säilyy eli pitää harkita, mitä webissä sanoo.

Lopputulemia

Sompelin esiin nostamat webin ominaispiirteet, kuten dynaamisuus ja sen hallinta, ovat asioita, joihin on tärkeä etsiä vastauksia. Webin dynaaminen perusluonne pysyy Sompelin mukaan osin hallinnassa, kun hyödynnämme Internet-arkistoja ja huolehdimme web-sisältöjen arkistoinnista ja säilyttämisestä.

Mieleen tuli myös paikallisen verkkoon tuotetun sisällön tulevaisuus. Nyt verkkoon tuotetut paikalliset sisällöt ovat osa paikallishistoriaa, joka voi olla pienillä resursseilla toteutettua ja jonka tuottamisessa ei ole välttämättä mietitty sitä, miten sisältö säilyisi pitkiä aikoja. Tässä voisi olla hyvä sauma yleisillä kirjastoilla/museoilla/arkistoilla ottaa jonkinlainen rooli verkossa olevan paikallishistorian tallentamiseen.

Advertisements

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s

%d bloggers like this: