Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Massa-aineistot nopeuttavat tietojen keruuta kuluttajahinta­indeksiin

19.2.2019
Twitterissä: @nieminekri
Kuva: Kari Likonen

Digitalisaation myötä on käytettävissä entistä tarkempaa tietoa kansalaisten ostamien tuotteiden ja palveluiden myynti­hinnoista ja ostetuista määristä. Perinteikäs kuluttajahinta­indeksin laskenta mullistuu, kun hyödynnetään tätä massadataa.

Kuluttajahinta­indeksi on yksi vanhimmista ja tunnetuimmista tilastollisista tunnus­luvuista. Se mittaa yksityiseen kulutukseen hankittujen tuotteiden ja palveluiden hinnan­­muutosta ajassa.

Aikaisemmin tiedonkeruu perustui tyypillisimmin ostettujen tuotteiden ja palveluiden hinta­seurantaan. Kaikkien tavaroiden ja palvelujen hintoja ei voitu seurata, joten hyödyke­koriin koottiin mahdollisimman edustava joukko hyödykkeitä, joita on yhtäläisesti saatavilla koko maassa.

Hyödykekoriin kuului noin 500 tuotetta ja palvelua, joista kerättiin kuukausittain lähes 50 000 hintaa usealta eri alueelta.

Tiedonkeruu vaati paljon työ­voimaa, ja kuluttajahintaindeksin ­kustannukset ovatkin olleet yksi suurimmista Tilasto­keskuksen tiedon­keruiden meno­eristä.

Nykyisin kaikki tieto tallentuu tallennus­järjestelmiin. Näitä hyödyntämällä voidaan nopeuttaa tiedon­keruuta, lisätä hyödyke­kattavuutta ja kerätä entistä tarkempaa ja ajan­tasaista tietoa myynnistä.

Tähän mahdollisuuteen on nyt tartuttu, ja kokemuksia ns. massa-aineistojen hankinnasta ja käytöstä indeksi­laskennassa on kerätty viimeisen neljän vuoden aikana.

Ensimmäiset käyttöön otetut kokonais­aineistot myynnistä kattoivat lääkkeiden ja alkoholin vähittäis­myynnin kuluttajille. Nämä uudistukset olivat kohtuullisen helppoja toteuttaa, koska Suomessa näiden tuotteiden myynti on keskittynyttä ja tiedot on siten tallennettu muutaman toimijan järjestelmiin.

Seuraava iso askel massa-aineiston hyödyntämisessä otettiin tämän vuoden alussa, kun päivittäis­tavarakaupan myynti haetaan yhden toimijan järjestelmästä osaksi kuluttajahinta­indeksin laskentaa.

Aiemmin

Nyt

500 tuotetta ja palvelua


>>yhteensä 50 000 hintaa / kk

10 000 tuotetta lääkkeistä,
8 000 tuotetta alkoholijuomista
74 000 elintarviketuotetta
>> yhteensä 3 000 000 hintaa/kk

Aineiston laajuudesta johtuen käyttöön otettiin aluksi vain elintarvike­tuotteiden hinnat ja myynti­määrät. Seuraavien vuosien aikana siirrymme muihin tuotteisiin, kuten virvoitus­juomiin, vaatteisiin, pesu­aineisin jne.

Tämän työn tehostamiseksi olemme testanneet luokittelu­algoritmia, joka päättelee oikean hyödyke­luokan tuotteen nimen, tuote­ryhmän ja jopa hinnan perusteella. Näin tekniikkaa hyödyntämällä massiiviset data­määrät ja yksittäiset tuotteet pystytään mahdollisimman tarkasti ja tehokkaasti luokittelemaan.

Nyt käyttöön otetut massa-aineistot ovat kattavia, sisältäen kaikkien myytyjen tuotteiden myynnin arvon ja kappale­määrät nyky- ja vertailu­ajankohdalle. Muutos on merkittävä verrattuna perinteiseen keruuseen, jossa hinta otetaan myynti­pakkauksen päältä tai hyllyn reunasta mutta ei tiedetä tuotteen todellisia myynti­määriä.

Jatkossa hinnanmuutosta voidaankin mitata entistä tarkemmin hyödyntämällä laajempaa aineisto­sisältöä ja indeksi­teorian mukaisia laskenta­kaavoja, jotka huomioivat nyky- ja vertailu­hetken myynti­määrissä tapahtuvan vaihtelun.

Tulosten tarkentumiseen ja harhattomuuteen vaikuttaa myös liike- ja hyödyke­otoksista luopuminen, kun laskentaan otetaan kaikissa liikkeissä myydyt tuotteet.

Paljon hyvää saadaan siis aikaiseksi, mutta silti ei vielä voi huokaista. Tieto­suojasta johtuen – jotta emme paljasta yhden toimijan tarkkoja tietoja – voimme julkistaa tuotteiden hinnan­muutoksen ainoastaan aiempaa karkeammalla tasolla.

Emme siis voi kertoa suurelle yleisölle, minkä yksittäisen tuotteen hinnan­muutos on ollut suurinta, vaikka massa-aineistot juuri mahdollistaisivat näin tarkan tiedon. Harmillinen tilanne.

Nyt tarvitaankin myös muilta toimijoilta vastaavan­laiset aineistot, jotta tarkkoja hinnan­muutoksia voidaan julkistaa avoimesti.

Neuvottelut aineistojen hankinnasta ovat käynnistyneet, mutta kokemus on osoittanut, että aika neuvotteluista käyttöön­ottoon on pitkä. Toivotaan, että hyvällä yhteis­työllä tätä viivettä voidaan lyhentää.

 

Kirjoittaja työskentelee yliaktuaarina Tilastokeskuksen Talous- ja ympäristötilastot -yksikössä.

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

tk-icons