Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Suuret tietovarannot, suuret odotukset

12.1.2023
Twitterissä: @MarkusSovala
Kuva: Risto Wuolle

Suomessa on poikkeuksellisen laadukkaat rekisterit kansalaisista, yrityksistä ja yhteisöistä. Rekisterit kertovat faktoja siitä, mitä me teemme ja miten meillä menee. Rekisterin­pitäjiä on useita, ja kullakin on oma näkymänsä yhteiskuntaan.  

Tilastokeskus on poikkeuksellinen tiedon solmukohta, koska sen haltuun on omien aineistojen lisäksi suotu Suomen tärkeimmät tietovarannot myös muilta rekisterin­pitäjiltä. Tällaista tiedon keskittymää ei ole muualla.

Tiedon keskittäminen mahdollistaa tietojen yhdistämisen. Esimerkiksi tulorekisteri­aineiston ja sähkömarkkina­datan yhdistämällä voimme vastata kysymykseen: kuinka paljon Suomessa on pienituloisia sähkö­lämmitteisessä talossa asuvia kotitalouksia, joilla ei ole kiinteä­hintaista sähkö­sopimusta. Toisistaan irrallaan näillä rekisteri­tiedoilla voitaisiin tarkastella vain tulotasoa tai energian­kulutusta erikseen, ei näiden kahden yhteis­vaikutusta.

Rekisterien pohjalta syntyvä tietovarallisuus on Suomen kilpailuetu. Jos hyödynnämme sitä, pystymme tekemään parempia päätöksiä niin kansalaisten arjessa, yrityksissä kuin ylimmän valtiojohdonkin tasolla.

Tietoon pohjautuvan päätöksenteon merkitys on tiedostettu. Siitä on raportteja ja selontekoja runsaasti, esimerkiksi Sipilän hallituksen aikainen tietopoliittinen selonteko ja Marinin hallituksen aikainen Valtioneuvoston periaatepäätös tiedon hyödyntämiseksi ja avaamiseksi. Teemaa käsitellään myös Julkisen hallinnon strategiassa, Suomen digitaalisessa kompassissa ja Euroopan datastrategiassa. Näissä kaikissa alleviivataan tiedon hyödyntämisen merkitystä. 

Koska Tilastokeskus on ainutlaatuinen tiedon solmukohta, kohdistuu tieto­varantojemme hyödyntämiseen tietenkin suuret odotukset. Niin sisältä kuin ulkoakin.

Haasteen muodostaa suurten odotusten ja supistuvien resurssien yhteen­sovittaminen. Tilasto­keskukselle valtion budjetissa kohdennetut toimintamenot ovat reaalisesti supistuneet, ja on varauduttava siihen että supistuvat jatkossakin. Tilasto­keskuksen budjetissa kilpailevat keskenään tilasto­tuotannon velvoitteiden täyttäminen, järjestelmien uudistamis­tarpeet, henkilöstön jaksaminen ja odotukset tieto­varallisuuden hyödyntämisestä. Kaikkien osa-alueiden priorisoiminen yhtä aikaa on vaikeaa. 

Olemme ottaneet viime vuosina tiedon hyödyntämisessä harppauksia eteenpäin. Ei ehkä yhtä suuria kuin tiedon käsittelyn teknologian kehittyminen olisi mahdollistanut, mutta merkittäviä kuitenkin. Pelkästään Tilastokeskuksen avoimessa StatFin-tietokannassa on julkaistu lähes kahdeksan miljardia havaintoa laadukasta tilastotietoa yli 5 000 tietokanta­kuutiossa, ja niiden määrä on kasvanut vuosittain noin 15 prosentin vauhtia.  

Korona-aikainen tilannehuone raotti näkymää sille, mitä kaikkea Tilastokeskuksen käsittelemien ja yhdistelemien tietoaineistojen avulla on mahdollista tehdä. Nyt ministeriöiden datahuone jatkaa tuota työtä ministeriöiden päätöksenteon tukena. Konseptin muotouduttua olisi luonnollista rakentaa vastaavia reaali­aikaisen data-analyysin mahdollistavia datahuoneita muillekin toimijoille. Datahuone on kuitenkin vain yksi tiedon hyödyntämisen kanava. 

Kansallisen tietovarallisuuden potentiaalin hyödyntämisessä on valtavasti mahdollisuuksia. Maksullista dataa voitaisiin avata yhä enemmän. Etenkin avoimen aluedatan palvelulle olisi suurta kysyntää. Keväällä (toistaiseksi) lakkautettua Findikaattori-palvelua jäivät kaipaamaan sadat tuhannet käyttäjät, ja se ansaitsisi modernisoidun seuraajan. Esimerkkiä voi hakea Virosta, mutta riman voisi nostaa korkeammallekin.

Ministeriöiden datahuoneen ohella kansalais­yhteiskunnalle olisi mahdollista rakentaa oma tilannekuva­palvelu, joka sisältäisi Tilastokeskuksen asiantuntevien data-analyytikoiden kuratoimia reaaliaikaisia ja interaktiivisia indikaattoreita ajankohtaisista aiheista. Norjan Microdata.no-tyyppisellä ”tilastokoneella” käyttäjien olisi mahdollista koostaa Tilastokeskuksen tarkoista tietoaineistoista itse haluamiaan tilastoja, kuitenkaan tinkimättä tieto­turvallisuudesta.

Eri julkisen sektorin toimijoilla on paljon muitakin mittaristo­tarpeita eli tarve visualisoida tilannekuvaa, tavoitteita ja kehitystä kuvaavia indikaattoreita. Sen sijaan, että teemme mittaristoja kukin tahoillamme, olisi järkevää keskittää voimavaroja kansallisen indikaattori­alustan rakentamiseen. Tätä ja monia muita tavoitteita tukisi kansallisen tilastotieto­kannan rakentaminen, jolloin eri tiedontuottajien tuottama tieto olisi saatavilla yhdestä lähteestä, yhtenäisillä metatiedoilla ja rajapinnoilla.

Tässä on mainittu muutamia, muttei tietenkään kaikkia käyttäjätarpeista kumpuavia ratkaisuja, joilla Tilastokeskuksen olisi mahdollista edistää tiedon hyödyntämistä ja saavutettavuutta Suomessa. Näin saisimme Tilastokeskukseen kootun kansallisen tietovarallisuuden paremmin käyttöön. 

Viime aikojen kriisit ovat osoittaneet suomalaisen varautumis­työn arvon ja huolto­varmuuden merkityksen. Tilastokeskus ylläpitää monia yhteiskunnan tieto­infrastruktuurin kannalta kriittisiä järjestelmiä. Ilman kansantalouden tilinpidon lukuja ei ole luottoluokitusta, eikä ilman luottoluokitusta ole valtionlainoja. Ilman hintaindeksien päivityksiä ei ole indeksi­korotuksia. Nämä ja monet muut yhteiskunnan toiminnan kannalta tärkeät tiedot tuotetaan järjestelmillä, jotka vaativat ylläpitoa ja uudistamista. 

Kansallisen tietovarallisuuden hyödyntäminen rakennetaan Tilastokeskuksen tietovaranto­infran päälle, ja infra muodostaa kivijalan, jonka kehittäminen on tiedon hyödyntämisen kannalta äärimmäisen tärkeää. Ilman tietovarantojen kehitystyötä jäävät askeleet Tilastokeskuksen modernisoinnissa ja uusissa tiedon hyödyntämisen tavoissa puolitiehen. Ennen kaikkea on varmistettava, että käytämme uusinta teknologiaa niin, että saamme hyödynnettyä tieto­varallisuutemme potentiaalin tietoturvallisesti. 

Meillä on Suomessa poikkeuksellinen tietovarallisuus, jonka potentiaalin lunastamisessa otamme koko ajan askeleita oikeaan suuntaan. Etenkin epävarmuuden vallitessa ja yhteiskunnan kriisin­kestävyyden merkityksen noustessa, meidän on huolehdittava myös tietoinfran huolto­varmuudesta ja katsottava myös tulevaan.

Nykyteknologialla meidän on mahdollista tuottaa tietoa, jollaista ei ole ikinä ennen pystytty tuottamaan. Tilastokeskus pyrkii kaikin keinoin mahdollistamaan uusia tapoja hyödyntää tietoa kaikilla yhteiskunnan tasoilla. Uskomme, että parempi tieto tuotetaan kaikkien yhteiskunnan tiedontuottajien yhteistyönä.  

 

Kirjoittaja on Tilastokeskuksen pääjohtaja.

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

Blogi
24.10.2022
Jukka Hoffren

Demokratioissa tilastot ovat osa yhteiskunnallista keskustelua, päätöksentekoa sekä seurausten arviointia  ja puolueettomina ne luovat edellytyksiä kompromisseille. Tietoon perustuva päätöksenteko edellyttää hidasta, harkitsevaa ja kyseenalaistavaa ajattelua. Jotta demokratia säilyisi informaatioyhteiskunnan perustana, tulisi tilastojen luku- ja käyttötaidosta tehdä yleinen kansalaistaito.

Blogi
20.10.2022
Anna Pärnänen

Miten keskustelisimme nyt vaikkapa palkkojen ostovoimasta – eli inflaatiosta ja ansioiden kehityksestä – tai nuorten mielenterveysongelmista, jos mitään tilastotietoa yhteiskunnasta ei olisi olemassa? kysyy Anna Pärnänen Euroopan tilastopäivän blogissaan. 

Blogi
1.7.2022
Sirkku Hiltunen

Suomi lukuina 2022 -julkaisujen kesä alkoi tänä vuonna vauhdikkaasti: uunituoreet taskutilastot olivat jo kesäkuun alussa mukana juhlistamassa Tutkitun tiedon teemavuotta Heurekassa. Taskuun menevään julkaisuun on jälleen kerran koottu mielenkiintoisia tilastolukuja – vanhimmat lähes 300 vuoden takaa. Lue blogista toimittajan poiminnat.

Blogi
9.6.2022
Anna Pärnänen

Suuri määrä eri mittareita kertoo monenlaista tarinaa lasten tilanteesta Suomessa, mutta tieto on hajallaan. Tilastokeskus suunnittelee lapsia ja nuoria koskevaa tietoa kokoavan portaalin – paitsi helpottaakseen tiedon käytettävyyttä myös palvellakseen kansallisen lapsistrategian toteutusta.

Blogi
7.3.2022
Leena Storgårds

YK:n tilastotoimen laatimat tilastotyön perus­periaatteet täyttävät tänä vuonna 30 vuotta. Vuosien saatossa niiden merkitys on vahvistunut yhteiskunnassa. Perus­periaatteet luovat hyvän perustan tietojen hallinnalle ja jakamiselle erityisesti julkisella sektorilla.

Blogi
28.2.2022
Outi Ahti-Miettinen

YK:n virallisen tilaston periaatteet ohjeistavat tilastoviranomaisia kertomaan tarkasti, miten tilastot on laadittu. Periaatteen avulla voidaan arvioida myös muun yhteiskunnassa syntyvän tiedon luotettavuutta. 

tk-icons