//
seminaarit, tiedonhaku, tiedonhallinta

Online11: Big data

Thomas Hawk, The Key is Now, This is the Moment in Which We Can Do, http://www.flickr.com/photos/thomashawk/495519553/

Big data -sessiota pohjusti jo ensimmäisenä päivänä konferenssin pj Stephen Dale avauspuheenvuorossaan ennustaessan big data -trendin kasvavan. Dalen esittämän arvion mukaan seuraavan 5 vuoden aikana luvassa on 800 %:n kasvu datamäärässä.

Will Reilly (IBM) piti yrityspuheenvuoron big datasta ja totesi jo alkuun termin olevan sen verran uutuudenkarhea, että termin tarkka määritys on hakusessa. Tämän huomasi. Moni konferenssin puhuja määritteli termin samansuuntaisesti: big data tarkoittaa nyt todella isoa määrää dataa. Todella. Isoa. Tyhjentävää. :)

IBM on Smarter Planet -projektillaan ollut sisäänajamassa big data -ajattelua. Kyse ei ole vain datavuoresta, joka muodostuu twiiteistä tai fbsi-statuksista; sosiaalinen media twiitti- ja statusvirtoineen on osa kokonaisuutta. Tyypillistä big datalle on reaaliaikaisuus. Dataa kerätään suuret määrät ja sitä analysoidaan reaaliaikaisesti. Reilly ennusti datan keräämismenetelmien kehittymisen ja datamäärän kasvun muuttavan organisaation työprosesseja ja analysointivälineitä ja -tapoja.

Esimerkiksi maanviljelyksessä big data -trendiä edustavat ns. älykkäät traktorit (Kirkpatrick, Driverless Tractors & Farmer Drones of the Future (Video), 9/2011, ReadWriteWeb), jotka kokoavat dataa muun muassa säätilasta, maaperästä ja traktorin fyysisestä sijainnistaan. Traktorien kokoama datamassa kiinnostaa laitevalmistajia, jotka puolestaan voivat myydä dataa maanviljelijöille erilaisiin analysointitarpeisiin.

Analysoinnissa perinteisesti operoidaan siten, että meillä on valmis kysymys, jolle haemme vastausta datasta. Reillyn mukaan big data -teknologian yksi lupaus on siinä, että tarjolle saadaan paljon potentiaalisesti hyödyllistä dataa, josta on revittävissä vastauksia erilaisiin kysymyksiin.

Käytännön esimerkkinä big data -toteutuksista Reillyllä oli muun muassa keskosvauvojen tehohoitojärjestelmät. Järjestelmä kerää koko ajan dataa keskosvauvan fysiologisesta tilasta ja hoitohenkilökunta voi seurata reaaliajassa vauvan tilaa.

Kaupallisella puolella big data -teknologiaa voidaan hyödyntää muun muassa mainosten kohdistamisessa tarkemmin kuluttajakohtaisesti ja analysoimalla asiakasprofiileja ja kulutustoimintaa.

Eräs tulokas analysointialalla on göteborgilainen startup-yritys Recorded Future (Cheshire, The News Forecast, 11/2011, Wired UK). Recorded Future kerää dataa eri Internet-lähteistä, kuten sosiaalisesta mediasta, viranomaistiedotteista ja tiedotusvälineistä. Yritys on kehittänyt analysointimenetelmiä, joiden avulla se tekee datamassan perusteella ennusteita tulevaisuuden tapahtumista. Yritys ennakoi muun muassa vuotta aiemmin Jemenin levottomuudet.

Big data -sessiossa sivuttiin kirjastojakin. Puhujat näkivät kirjastoalalla olevan osaamistarvetta. Kun big datassa on kyse vallattoman suuresta dataköntsästä, on tarvetta matemaattiselle ja tilastolliselle osaamiselle, jotta tuosta massasta saadaan louhittua irti se, mitä siitä on louhittavissa. Richard Boulderstone totesi datan tallentamisen ja hallinnan vaativan uudenlaista osaamista kirjastoissakin.

About these ads

Keskustelu

Trackbacks/Pingbacks

  1. Päivitysilmoitus: Online Information 2011 « Sorvipenkki - 29.12.2011

  2. Päivitysilmoitus: Avoimen tiedon ohjelma 2013 - 2015 | Sorvipenkki : blogi - 20.02.2014

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out / Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out / Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out / Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out / Muuta )

Muodostetaan yhteyttä palveluun %s

Seuraa

Get every new post delivered to your Inbox.

%d bloggers like this: