//
informaatiotutkimus, kirjastopalvelut, seminaarit, tiedonhaku, tiedonhallinta, verkkopalvelut

Ontologiaseminaari: järjestelmäasiaa, käytännön esimerkkejä

Maijala, Ere: Ontologiat : järjestelmänäkökulma

Lähtökohtatilanne on se, että kirjastojärjestelmät eivät juurikaan tue RDF:ää tai OWL:ää. Resource Description Framework (RDF) kytkeytyy ontologioihin. Kyse on kuvailukehyksestä, joka määrittelee, kuinka kuvata webissä olevaa informaatiota. RDF määrittelee, kuinka kuvaillaan, ja kuvailukielenä on eXtensible Markup Language (XML). (World Wide Web Consortium julkaisee RDF- ja OWL-suositukset.)

RDF:n syntaksi on samantapainen kuin MARC:ssa, mutta joustavampi. OWL on puolestaan kieli ontologioiden esittämiseen ja laajennus RDF:ään. (OWL Web Ontology Language : Guide, 2004)

Maijala kävi läpi muutamia ontologian hyödyntämiseen liittyviä teknisiä kysymyksiä. Yksi näistä kysymyksistä on se, miten ontologiatermin tunniste tallennetaan bibliografiseen dataan, koska esimerkiksi MARC 21 -formaatti ei tällä hetkellä tue ontologioita. Kun käytössä on MARC 21 -formaatti, ontologioiden hyödyntäminen sisällönkuvailussa vaatii rakentelua käsin. Formaatin osalta pitäisi myös sopia, kuinka ontologiatunnisteet merkitään MARC 21 -formaatissa: mitä kenttiä käytetään ja miten.

Muita ontologioiden hyödyntämiseen liittyviä kysymyksiä ovat muun muassa kuinka ontologisointityö organisoidaan? Jos ontologisointia tehdään hajautetusti, käyttävätkö kaikki samoja sanastoja ontologisoinnissa? Ontologisoidaanko vanha aineisto, jota on määrällisesti paljon? Osa aineistosta voidaan ontologisoida automaattisesti, mutta ei kaikkia. Miten ontologisointi saadaan hyödyntämään kaikkia? Tässä nousee esiin yhteisjärjestelmien ja yhteentoimivuuden tarpeellisuus. Monet kysymyksistä ovat sopimusasioita, mikäli vain päästään yhteiseen päätökseen suunnasta.

Kansallisen digitaalisen kirjaston asiakasliittymän näkökulmasta ontologiat on huomioitu, mutta ontologioiden hyödyntäminen asiakasliittymässä edellyttää, että taustajärjestelmät on ontologisoitu. Tässä haasteena on se, että metadataa käytetään lukuisista eri lähteistä (kuten kirjasto-, museo- ja arkistoluettelot) ja vaikka Suomessa YSO olisikin käytössä, niin kuinka käy kansainvälisten aineistojen suhteen? Eri maiden ontologiat pitäisi integroida toisiinsa.

Rajapintojen on oltava avoimet ja hyvät, jotta onnistuisi vaikkapa termien poiminta sisällönkuvailussa. Digital Library Federation muodostaman työryhmän tekninen suositus, ILS Discovery Interface Task Group (ILS-DI) Technical Recommendation : An API for effective interoperation between integrated library systems and external discovery applications on yksi suositus sille, kuinka rajapinnat tulisi rakentaa. Integroitavuuden ja yhteentoimivuuden parantaminen edellyttää yhteistyötä järjestelmätarjoajien kanssa.

Kirjastojen omien järjestelmien ontologiavalmius ei riitä, vaan esimerkiksi hakujärjestelmät pitäisi saada ymmärtämään ontologioita. Ontologisoinnista ei ole hyötyä, jos muut järjestelmät eivät osaa hyödyntää niitä.

Monta kysymyksiä, monta haastetta, ja oitis ei saada kokoon verkkoa, joka hyödyntää ontologioita täysimääräisesti ja on 100 %:n kattava. Toisaalta edes jotain on parempi kuin ei mitään ja jostain on aloitettava.

Mitä seuraavaksi: YSO pitäisi saada valmiiksi ja ylläpitokuviot pyörimään. Ontologiaa voidaan jo nyt hyödyntää tiedonhaussa, mutta sisällönkuvailussa sitä ei vielä voi käyttää.

Sovellustapaukset

Hypén, Kaisa: Kaunokki-ontologia ja Kirjasampo

Kirjasammosta tulee kirjastoalan ensimmäisiä käytännön esimerkkejä, joka hyödyntää ontologioita (Kirjasampo KirjastoWikissä). Kyse on kaunokirjallisuussivustosta, joka valmistuessaan perustuu lukemisen yhteisöllisyydelle. Palvelua rakentavat

  • kirjastoammattilaiset ja
  • kirjallisuuden lukijat.

Loppukäyttäjien tuottamat sisällöt eivät tallennu teosrekisterin tietoihin.

Palvelussa sovelletaan semanttisen webin tekniikoita eli ontologioita ja SAHA-annotointityökalua. Kirjasampo käyttää Kaunokki-ontologiaa, joka pohjautuu fiktiivisen aineiston asiasanastoon. Kaunokki-ontologia on ns. yhdistelmäontologia, joka sisältää Kaunokin ja YSA:n termit ontologisoituna. Kaunokki kattaa kaikki kirjallisuudenlajit, aikuisten ja lasten kirjallisuuden ja elokuvat.

Kirjasampo saa oman sivustonsa, mutta jo nyt Kirjasampoon tallennetut teostiedot ovat Kulttuurisampo-palvelussa tarkasteltavissa.

Tarkka, Minna: Mediaontologia : mediakulttuurin sanastokehityksen ja soveltamisen haasteita

Tarkka esitteli mediakulttuuriyhdistys m-cultin mediaontologiaprojektia, jossa ontologisoinnin kohteena on mediakulttuuri ja mediataide.

Osana tätä projektia on Rajapinnalla-tuotanto, jossa protoiltiin videoannotointia Logger-annotointityökalulla. Loggerilla voidaan aikakoodipohjaisesti sisällönkuvailla videoista haluttuja kohtia.

Mediaontologia sisältää tällä hetkellä noin 3000 käsitettä kattaen mediakulttuurin genret, taidelajit. Käsitteet on kytketty YSO:oon. Ontologian sovelluskohteina ovat digitaalisen mediakulttuurin ja yhteisötelevision verkkopalvelut. Julkaisutavoitteena on tammikuu 2010.

Advertisements

Keskustelu

Trackbacks/Pingbacks

  1. Päivitysilmoitus: Ontologiaseminaari Kansalliskirjastolla « Sorvipenkki - 13.01.2010

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s

%d bloggers like this: