tk-icons
Sivuston näkymät
  • Tämä juttu on arkistoitua sisältöä, joka tarjotaan luettavaksi sellaisenaan. Tämän vuoksi siinä voi olla saavutettavuusongelmia.

Hype laantuu, iso data arkipäiväistyy

4.5.2015
Twitterissä: @mrsbruun ‏

Pahin hypetyspöly big datan, eli suomalaisittain ison datan, ympärillä on hiljalleen laskeutumassa ja tilalle on nousemassa tilastoinninkin kannalta mahdollisuuksia. Iso data tarjoaa vakavasti otettavan lisän tilastotuotannon modernisoimiseksi.

Marjo Bruun, Tilastokeskuksen pääjohtaja

Pahin hypetyspöly big datan, eli suomalaisittain ison datan, ympärillä on hiljalleen laskeutumassa ja tilalle on nousemassa tilastoinninkin kannalta mahdollisuuksia. Iso data tarjoaa vakavasti otettavan lisän tilastotuotannon modernisoimiseksi.

Räjähdysmäisesti kasvava tiedon määrä sähköisissä järjestelmissä on jo vuosia ruokkinut visioita datavallankumouksesta, joka johdattaa yhteiskunnan uudelle tekniselle ja tiedolliselle tasolle. Reaaliaikaisesti tarjolla oleva lähes rajaton tietomäärä mahdollistaa edullisen perustan uusien palveluiden tuottamiseksi ja vanhojen uudistamiseksi.

Uskoa vahvistavat konkreettiset esimerkit uudesta tulevaisuudesta ovat toistaiseksi olleet vähissä. Ponnistelut alkavat kuitenkin viimein tuottaa hedelmää. EU-maiden tilastovirastot ovat yhteisessä strategiassaan sitoutuneet ison datan hyödyntämiseen tilastokäytössä (ns. Scheveningen Memorandum), ja uusien ideoiden testauksesta ollaan siirtymässä tuotannollisiin ratkaisuihin.

Pisimmällä ollaan varmaankin Hollannissa. Maanteiden massiivisen sensoriverkoston raakadataa on analysoitu nykyaikaisin menetelmin, jotta tieliikennetilastoja voitaisiin rikastaa. Hollannissa on myös tuloksellisesti testattu väestön taloudellisia odotuksia kuvaavien tilastojen täydentämistä Twitterin ja Facebookin tarjoamalla datalla. Sosiaalisen median mahdollinen käyttö tilastotoimessa on kaikkiaan kansainvälisen tilastoyhteisön mielenkiinnon kohteena.

Myös muualla on edistytty ison datan hyödyntämisessä. Italiassa kuluttajahintaindeksin lentomatkatietoja ja kodinelektroniikkatietoja täydennetään internetistä kerättävillä tiedoilla. Myös Tilastokeskuksessa on meneillään kehittämishanke, jolla pyritään selvittämään kahden uuden datalähteen eli verkkokauppojen ja kassapääteaineistojen hintatietojen hyödyntämistä.

Useat maat ovat jo testanneet kännyköiden käytöstä kertyvää dataa matkailu-, työssäkäynti- ja muuttoliiketilastojen tekemisessä. Suuria toiveita asetetaan satelliittikuvauksen hyödyntämiseen maataloustilastoissa.

Tyypillisimmät datalähteet tilastojen täydentämiseksi ovat ainakin toistaiseksi olleet sosiaalinen media, mobiililaitteista kertyvä data ja internetin tietojen hyödyntäminen. Lyhytkin kokemus on osoittanut niiden tarjoavan usein nykyistä nopeamman ja edullisemman tavan tuottaa tietoa. Samanaikaisesti EU:n tietosuojadirektiiviä ollaan uudistamassa. Sen vaikutus esimerkiksi mobiilidatan käyttöön on vielä epäselvää.

Ison datan hyödyntämistä on tilastovirastoissa arvioitu myös menetelmällisistä lähtökohdista. Uusi ja vanha tuotantomalli eivät sulje toisiaan pois, vaan niiden välillä on myös yhtäläisyyksiä. Jo nyt kansantalouden tilinpito käyttää erilaisia lähteitä, joiden luotettavuutta arvioidaan kokonaistaloudellisessa kehikossa. Hallinnollisten aineistojen tiedot koostetaan tilastovirastojen välittömän ohjauksen ulkopuolella, mutta aineistojen laatua pystytään silti arvioimaan riittävän luotettavasti.

Edistysaskeleista huolimatta haasteita toki riittää. Hallinnollisista aineistoista poiketen suurin osa isosta datasta on yritysten hallussa. Datan käyttö tilastojen pohjana edellyttää uusien, molempia osapuolia hyödyttävien kumppanuuksien luomista. Monissa tapauksissa myös kansallista lainsäädäntöä tulisi kehittää yhteiskunnan muuttuvien tarpeiden myötä. Samalla on huolehdittava siitä, että tilastotuotannon kulmakivi, yksilön tietosuoja, on varmistettu asianmukaisella tavalla.

Tehokkaasti organisoitu tilastotoimi edellyttää uusien tietovarantojen innovatiivista hyödyntämistä. Tarve korostuu tiukassa taloudellisessa tilanteessa. On selvää, ettei myöskään Tilastokeskus voi jättää huomioimatta uusien tietolähteiden tuomia mahdollisuuksia.

Marjo Bruun on Tilastokeskuksen pääjohtaja.

 

Tilaa Tieto&trendit-juttukooste sähköpostiisi

Kommentit

Lue samasta aiheesta:

Blogi
12.2.2016
Vieraskynä: Jussi Melkas

Big data muuttaa yhteis­kuntaa syvällisesti. Jokseenkin varma muutos on se, että tiedon näköinen informaatio lisääntyy valtavasti. Mutta mitä big data merkitsee tiedon tuottamiselle?

Artikkeli
11.5.2015
Jari Nieminen

Aineistojen yhdistäminen on yksi tapa uudistaa ja tehostaa tilastointia. Suomen ja muiden Pohjoismaiden kokemus rekisteriaineistoista tarjoaa iso data -aineistojen hyödyntämisessä etulyöntiaseman verrattuna maihin, joissa ollaan riippuvaisia kyselyaineistoista.

Artikkeli
29.4.2015
Pasi Piela

Iso data haastaa monessakin mielessä perinteistä tilastotietoa. Ylivoimaisin se on nopeutensa vuoksi. Perinteisen tilastotiedon vahvuuksia ovat tiedon ajallinen vertailtavuus ja edustavuus. Yhteistyöllä voidaan saavuttaa molempia tiedontuotannon muotoja hyödyttäviä etuja.

Blogi
13.1.2015
Jouni Kotkavuori

Suomen suurimmat asunnot löytyvät Suvisaaristosta, Etelä-Espoosta. Asunnot ovat Suvisaariston postinumero­alueella keskikooltaan reilut 165 neliötä, yli neljä kertaa isompia kuin Helsingin Sörnäisissä, missä asunnot ovat pienimpiä. Hmm…

Artikkeli
19.12.2014
Marjo Bruun

Virallinen tilasto on aina pyrkinyt sovittautumaan yhteiskunnan ja talouden merkittäviin muutoksiin. Tämän päivän muutostarpeen käynnistäjiä ovat datavallankumous, globalisaation vaatimat uudet mittarit, tilastotuotannon kustannukset ja tulevaisuuden haasteiden vaatima tietopohja.