//
informaatiotutkimus, kirjastopalvelut, seminaarit, tiedonhaku, tiedonhallinta, verkkopalvelut

Ontologiaseminaari : paneelikeskustelu

”Asioilla on nimet. Ja niillä, joilla ei ole, on värisevä hahmo ajan virrassa.” (naisrunoilija Helsingin Kirjamessut, Runononstop-tapahtuma)

Sekä Vesa Suominen että Eero Hyvönen alustivat paneelikeskustelun. Alustukset ja paneelikeskustelu löytyvät myös tallenteena:
connect.humac.fi/p20163226

Suominen, Vesa: Referentiaalisesti hankalien käsitteiden ongelma YSO:ssa

Suominen näki ongelmallisena ontologioiden referentiaalisuuden, pyrkimyksen ilmaista käsitteiden väliset suhteet ja eri merkitykset hyvin eksplisiittisesti. Toisissa tapauksissa tämä ei aiheuta ongelmia, esimerkiksi ”auto” on mukavasti referentiaalinen käsite. ”Jumala” jo ongelmallisempi.

Suominen pohti, mikä on suurin ongelma tässä mielessä. Ehkä pyrkimys laittaa kaikki käsitteet yhteen geneerisin suhtein etenevään hierarkiaan on se ongelma.

Eero Hyvösen kommentteja:

  • kun puhutaan sanoista ja ontologioista, ne on pidettävä erillään. Ontologiat eivät ole lingvistisiä leksikkoja. Esimerkiksi ennustaminen ontologian tietyssä kohtaa sisältää ne tietyt alakäsitteet (korteista ennustaminen, kädestä ennustaminen). Ennustamisella on toki muitakin sisältöjä ja ne ovat tuotavissa esiin, sillä ontologioita ja näkökulmia voi olla useita
  • tavoitteena on kielenrikkauden saaminen konemuotoon
  • YSO ei ole maailman malli vaan yksi kannanotto aiheeseen. Tavoite on löytää yksi ydin, johon on kytkettävissä muita ontologioita, näkökulmia.

Hyvönen, Eero: Miksi asiasanastoista pitäisi siirtyä ontologioihin

Ontologiassa kerrotaan koneen ymmärtämässä muodossa, mistä tietyssä objektissa on kyse. Hyvösen mukaan, että tällä tavoin voidaan ratkaista tiedonhakuun liittyviä kysymyksiä.

Yksi ongelma nykytilanteessa on se, että tietosisältöjä tuotetaan hajautetusti eri organisaatioissa ja nämä sisällöt eivät ole linkitettyjä keskenään.

FinnONTOn ratkaisu tähän ongelmaan on kansallinen ontologiainfrastruktuuri, joka linkittäisi tietosisällöt keskenään. Tiedonmuruset verkottuvat tuossa struktuurissa keskenään, mikä kasvattaa Hyvösen mukaan tiedonmurusen merkitystä. Tähän ontologiainfrastruktuuriin FinnONTO pyrkii.

Miksi asiasanastot eivät riitä? Ne ovat hyvä lähtökohta, mutta niiden hyödyntäminen sovelluksissa on rajoittunutta muun muassa siksi, koska

  • monet termit ovat moniselitteisiä eivätkä sijoitu luokkahierarkioihin
  • osa-kokonaisuus-suhteita ei eroteta luokkasuhteista (Halleyn komeetta LT komeetat LT aurinkokunnat LT galaksit -käsiteketju on ongelmallinen, kone katsoo, että jos etsitään galakseja, niihin kuuluu Halleyn komeettakin, mikä ei pidä paikkaansa. Termilaajennukset eivät toimi.)
  • asiasanaston sitoutuminen kieleen on voimakasta, mikä vaikeuttaa monikielisten sovellusten tekoa.

Ontologian eksplisiittisyys toisaalta kuivattaa käsitteen semanttista rikkautta: kun käsitteet viedään yhteen struktuuriin, niiden merkitys tarkentuu. Vaikka ontologia tekee tavallaan väkivaltaa termien monikäsitteisyydelle, se toisaalta selkeyttää pelikenttää. Sisällönkuvailussa ja tiedonhaussa syntyy ”sitä saa, mitä tilaa” -tilanne.

Kommenteissa nousi esiin ontologioiden käyttökelpoisuus. Voidaanko niitä käyttää sisällönkuvailussa, mikäli ne eivät ole valmiita? Hyvönen totesi, että ontologiaa käytettäessä sisällönkuvailuun voi sisällönkuvaaja käyttää mitä termejä vain, mikäli ontologia ei ole valmis, mutta se heikentää hakutulosta.

Käytännön esimerkeistä Hyvönen mainitsi BBC:n, joka on ryhtynyt integroimaan ja linkittämään dataansa ja dokumenttejaan muihin verkossa oleviin tietosisältöihin semanttisen webin teknologioita hyödyntäen. BBC julkaisee runsaasti verkkoaineistoa erilaisilla sivustoillaan, ja tämä sisältöjoukko ei linkity keskenään. Tilanteen parantamiseksi BBC:n verkkopalveluissa otettiin käyttöön Linked Data -teknologioita, joilla sisältöjä linkitettiin muun muassa DBpediaan. DBpedia on eräänlainen semanttisen webin versio Wikipediasta. Kyse on yhteisöllisestä projektista, jossa Wikipediasta suodatetaan rakenteista informaatiota ja annetaan tämä rakenteinen informaatio vapaaseen käyttöön verkossa. DBpedian avulla loppukäyttäjä voi tehdä tehokkaampia hakuja Wikipedia-artikkeleihin ja myös linkittämään muita verkossa olevia datajoukkoja (data sets) tähän Wikipedia-dataan. (Kobilarov et al. 2009; DBpedia.)

Valittuja paloja paneelikeskustelusta

Yleisten kirjastojen suhtautuminen ontologioihin ja semanttiseen webiin

Kaisa Hypén: yleisten kirjastojen tunnelma on varovaisen kiinnostunut. Toivottavasti Kirjasamposta tulee niin hyvä, ettei muuta vaihtoehtoa osata ajatellakaan.

Ontologioiden kehitystyöstä ja rooleista

Vesa Suominen: ovatko kirjastot asiakasroolissa siirryttäessä YSA:sta YSO:oon? Mikä on kirjastojen mahdollisuus ratkaista sisällönkuvailuun liittyviä ongelmia?

Eero Hyvönen: kyse on tutkimuslähtöisestä hanke ja hanke on tutkimuksen ehdoilla etenevä. Kirjastojen roolina on nyt antaa asiakkaana panoksensa.

Tuula Haapamäki: kirjastolaisten tulevaisuus on yhteinen museoiden ja arkistojen kanssa. Ontologioiden lisäksi tuloillaan on auktoriteettitietokanta ynnä muita isoja asioita: niiden ainoa toimintamallina on verkostoituminen, jossa jonkun on pakko vetää ja koordinoida.

Tiedonhausta

Ere Maijala: ”Loppukäyttäjät eivät halua hakea” -väite: näin on, ei ne haluakaan. ”Käyttäjät haluaa samoilla” -väite: ei, vaan loppukäyttäjä haluaa jotain tiettyä teosta tms. Paras käyttöliittymä on nappi, jossa lukee ”Anna”.

Vesa Suominen: ei loppukäyttäjä ehkä halua samota, mutta jos käyttäjä jotain haluaa, hän tunnistaa sen, kun selailee, samoilee. Kirja ei voi löytyä kuin lääke apteekin hyllyltä. Kirja ei ole lääke vaan moniulotteinen asia.

Eero Hyvönen: jos tietää mitä hakee, niin Google on hyvä. Jos ei tiedä, mitä hakee, niin silloin selailu on ok. Kolmas käyttötapa: tiedon jäsentäminen koneellisesti, esimerkiksi kuinka partamuodin muuttuminen 1800-luvulla. Tuollaisen asian selvittäminen on hyvin vaikeaa perinteisesti. Tietojärjestelmä voi antaa nopeasti vastauksen, kun tieto on hyvin strukturoitu.

Hyvä seminaari: olo jäi ontologisinspiroituneeksi, vaikka ontologiat ja niiden käyttöönotto eivät ongelmattomia olekaan.

Lähteet

Mainokset

Keskustelu

Ei kommentteja.

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out /  Muuta )

Google photo

Olet kommentoimassa Google -tilin nimissä. Log Out /  Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out /  Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out /  Muuta )

Muodostetaan yhteyttä palveluun %s

%d bloggers like this: