Elinolotilastot perustuvat haastattelu- ja rekisteriaineistoihin


Kirjoittajat: Kirsti Ahlqvist ja Seppo Paananen ovat Hyvinvointikatsauksen toimittajia. Artikkeli on julkaistu Tilastokeskuksen Hyvinvointikatsauksessa 3/2010.

Hyvinvointikatsauksen edellisissä numeroissa on keskusteltu rekisteritiedon luonteesta ja rekisterien tilastokäytön lisääntymisestä. Marja Alastalo (Hyvinvointikatsaus 4/2009 ja 2/1010) käsitteli suomalaisen hallinnollisen rekisterijärjestelmän muotoutumista ja sen vakiintumista osaksi yhteiskuntatilastointia sekä teki ehdotuksia rekisteriperusteisen tilastoinnin käsitteellistämisestä. Pekka Myrskylä (Hyvinvointikatsaus 1/2010) toi esiin rekisteritilastoinnin etuja tilastoinnin kustannusten ja vastaajien tiedonantotaakan näkökulmista sekä pohti kokonaistilastojen ja otostilastojen välisiä eroja. Tässä kirjoituksessa rekisteritiedon käyttöä tarkastellaan muutamien elinolotilastojen kannalta.

Tilastointi ei jakaudu kategorisesti rekisteriperusteiseen ja suoraan tiedonkeruuseen perustuvaan tilastointiin. Esimerkiksi otoksiin perustuvissa ja haastatteluin kerättävissä elinolotilastoissa käytetään runsaasti hyväksi rekisteritietoja tiedon tuotannon eri vaiheissa. Samoin useat rekisteriperusteiset tilastot ovat riippuvaisia haastattelemalla saaduista tiedoista.

Elinolotilastojen otokset poimitaan rekistereistä, tulosten estimoinnissa käytetään rekisteritietoja ja tietojen tarkistuksissa hyödynnetään paljon rekistereistä saatavia tietoja. Lisäksi suuri osa tilastojen kuvaamista tiedoista saadaan suoraan rekistereistä. Artikkelissa kiinnitämme huomiota ennen kaikkea tähän viimeksi mainittuun näkökohtaan ja pohdimme, missä määrin ja millä edellytyksin rekisteritietoja voidaan käyttää väestön elinolojen kuvauksessa. Artikkelia varten pyysimme kolmea elinolotilastojen asiantuntijaa — tilastopäällikkö Juha Honkkilaa, erikoistutkija Marie Reijoa ja tutkija Markku Säylää — kertomaan rekisteritietojen käyttöön liittyvistä kokemuksistaan ja havaitsemistaan kehittämistarpeista. Lähteinä olemme käyttäneet myös tulonjakotilastoinnin menetelmäkuvauksiin liittyviä muistioita.

Elinolotilastot kuvaavat väestön hyvinvoinnin jakautumista ja siihen vaikuttavia tekijöitä. Tulonjakotilasto perustuu tulo- ja elinolotutkimuksen haastattelutietoihin ja tulotietoihin, jotka saadaan pääosin hallinnollisista rekistereistä.

Tulonjakotilaston aineistonkeruun perusteella laaditaan myös EU:n tilastoviraston Eurostatin tulo- ja elinolotilastoa, jota kutsutaan EU-SILCiksi (European Union Statistics on Income and Living Conditions). Tutkimuksen avulla köyhyyttä ja sosiaalista syrjäytymistä on mahdollista tarkastella monipuolisesti.

Kulutustutkimus kuvaa kotitalousryhmien kulutustottumuksia ja kulutuksen rahoittamista. Tilaston tuloja koskevat tiedot saadaan hallinnollisista rekistereistä. Varallisuustutkimus puolestaan kuvaa sitä, miten tulojen säästetty osa on kanavoitunut pääomanmuodostuksen kautta varallisuudeksi. Varallisuus voi olla kiinteää pääomaa kuten asuntoja tai eri muodoissa olevaa rahoitusvarallisuutta. Tulojen lisäksi tarvitaan tietoja myös lainanotosta.

Rekisterit ovat elinolotilastojen teossa tärkeitä erityisesti sen vuoksi, että niistä saadaan suurin osa tulotiedoista. Tulotiedot muodostavat nykyisin yhtenäisen ja kattavan rekisterikokonaisuuden, jonka tietolähteinä ovat verohallinnon ja useiden sosiaalisista tulonsiirroista vastaavien viranomaisten tietokannat. Näistä muodostetaan tietyin poimintasäännöin rekisterityyppinen aineisto tilastoinnin tarpeisiin. Myös henkilöiden lainoista saadaan nykyisin tietoja Verohallituksen tietokannasta.

Tilastokeskuksen haastattelutiedonkeruisiin perustuvissa tilastoissa on vuosikaudet tehty määrätietoista työtä haastattelutiedon korvaamiseksi hallinnollisilla aineistoilla. "Rekisteritiedoissa on monia etuja haastattelutietoon verrattuna. Tiedot ovat usein virheettömämpiä, tiedon keruu ja tuotanto on halvempaa ja niiden käyttö pienentää tiedonantajien vastausrasitetta", toteaa Marie Reijo.

"On valitettavaa, että edellisten Hyvinvointikatsausten puheenvuorot rekisteriperusteisesta tilastotuotannosta voivat synnyttää virheellisen käsityksen tehdystä työstä", kommentoi Juha Honkkila. "Rekisteritiedon käyttökelpoisuutta on elinolotilastojen yhteydessä runsaasti tutkittu, ja tietoja käytetään aina kun se on mahdollista. Ennen rekisteritiedon käyttöä siitä saatavan tiedon laatu tulee jatkossakin varmistaa. Rekisterien käytön laajentamiseen tulee suhtautua ennakkoluulottomasti, mutta ei kannata olla liian optimistinen. Joitakin tietoja on jatkossakin pakko kerätä haastattelemalla aineiston laatukriteereiden täyttämiseksi."

Tietolähteen vaatimukset johtuvat tilastoinnin tavoitteista

Rekistereitä käytetään aina, kun ne täyttävät sisältövaatimukset, tietoja on kattavasti saatavissa ja ne soveltuvat tilaston kokonaisuuteen. Väestön elinolot on kuitenkin niin laaja ja moniulotteinen kokonaisuus, että sitä ei kyetä kuvaamaan täydellisesti pelkästään rekisteritietojen avulla. Esimerkiksi kulutus- ja varallisuustilastoinnissa varsinainen ilmiöalue jää rekistereiden ulottumattomiin. Varallisuustilastoinnissa tosin osa tiedoista on saatavissa rekistereistä.

Ihmisten kokemuksiin perustuvaa tietoa voidaan saada vain haastattelemalla. "Pelkästään rekisterien varaan jättäytyminen tiedonkeruussa voi tuottaa aika yksioikoista, kuivahkoa viranomaistietoa. Monesta aihealueesta saadaan monipuolisempi kuva, kun rekisteritiedon lisäksi käytetään haastattelutietoja, jotka voidaan suunnitella tietotarpeiden mukaan", toteaa Markku Säylä.

Säylä ottaa esimerkiksi edellisen, vuonna 2004 toteutetun varallisuustutkimuksen, johon liitettiin asumista koskevia haastattelukysymyksiä. Vaikka asumisen perustilastot ovat Suomessa hyvät, niiden lisäksi tarvitaan monia asumisen ongelmia ja asukasryhmiä koskevia tietoja.

Asumistoiveita ja asumispreferenssejä koskevaa tietoa on Suomessa tuotettu hyvin vähän. Asunto on kotitalouksien suurin varallisuuserä, ja varallisuustutkimuksessa asumiskysymyksiä voitiin tarkastella kotitalouksien talouden osana. Samalla kotitalouden taloudellisten mahdollisuuksien selvittäminen antoi realistisemmat mahdollisuudet tulkita kotitalouksien asumistoiveita, koska asumista voitiin tarkastella elämänvaiheen ja elämäntavan kokonaisuudessa — varallisuustutkimuksen haastatteluosuuden painopiste on asukkaiden mielipiteissä, kokemuksissa ja asumistoiveissa. Myös EU-SILCissä on runsaasti ihmisten kokemuksiin perustuvia tietoja, joita ei saada kuin haastattelemalla.

Tietolähde ja tiedon prosessointi vaikuttavat tuloksiin

Tulo-, kulutus- ja varallisuustilastojen keskeiset käsitteet ovat kotitalous ja kotitalouden viitehenkilö, jotka ovat tärkeitä esimerkiksi kotitalouden ja sen jäsenten sosioekonomisen aseman sekä jäsenten keskinäisten suhteiden määrittelemisen kannalta. Pelkät hallinnolliset tiedot eivät riitä joidenkin keskeisten muuttujien kuten kotitalouden rakenteen tai henkilön sosioekonomisen aseman määrittelemiseen. Lisäksi rekisteriperusteisten taustamuuttujien valmistuminen on hidas prosessi, jolloin niiden käyttö saattaisi joissakin tapauksissa hidastaa tilastojen tuotantoaikatauluja.

Sosioekonominen asema on yksi tulo-, kulutus- ja varallisuustilastojen keskeisimmistä taustamuuttujista. Sosioekonomisen aseman muodostus perustuu pääosin haastatteluista saataviin kalenterivuoden aikaisiin tietoihin, joita ovat henkilön ammatti, työpaikka ja toimiala. Näin muodostettuna sosioekonomisesta asemasta on saatavissa ajallisesti vertailukelpoisia tietoja jo vuosista 1966 ja 1977 lähtien. Tätä aikasarjaa ei haluta katkaista.

Tulonjakotilastoinnin yhteydessä on selvitetty tietolähteiden vaikutuksia keskeisiin muuttujiin ja indikaattoreihin. Vertailua on tehty esimerkiksi kotitalouden muodostamisesta rekisteriperusteisesti ja haastatteluperusteisesti (Ruotsalainen 2004). Samoin on analysoitu, miten kotitalouden viitehenkilön määrittely muuttuu, kun rekisteritietoja täydennetään haastattelusta saaduilla tiedoilla (Ruotsalainen — Petrola 2009).

Elinolotilastoissa haastattelutiedon perusteella muodostettava kotitalous tarkoittaa kaikkia niitä henkilöitä, jotka asuvat ja ruokailevat yhdessä tai jotka muuten käyttävät tulojaan yhdessä. Rekistereissä kotitaloutta vastaava tulonkäyttöyksikkö on asuntokunta, jonka muodostavat kaikki ne henkilöt, jotka asuvat vakituisesti samassa osoitteessa.

Vertailun perusteella kotitalouksien ja asuntokuntien rakenne poikkesi toisistaan 15 prosentissa tutkituista tapauksista. Yleistä oli, että asuntokuntaan kuului enemmän jäseniä kuin kotitalouteen. Rekisteritieto oli jonkin verran alipeittävää pienten yhden ja kahden hengen kotitalouksien osalta.

Eri lähdeaineistoista laaditut tuloindikaattorit poikkesivat myös toisistaan. Ensinnäkin rekisteriperusteisten asuntokuntien keskimääräiset tulot olivat haastatteluperusteisten kotitalouksien tuloja suuremmat, mutta tämä ero tasoittui, kun käytettiin ekvivalentin tulon käsitettä. Tietolähde vaikuttaa jonkin verran myös sosioekonomisten ryhmien tuloeroihin.

Yleisesti ottaen rekisteriperustaisen asuntokuntakäsitteen käyttö tuottaa tulonjaosta hieman tasaisemman kuvan kuin haastatteluperustaisen kotitalouskäsitteen käyttö. Tämä johtuu siitä, että näiden kahden lähdeaineiston tuottama kotitalouden rakenne poikkeaa toisistaan. (Ruotsalainen 2004.)

Kotitalouden viitehenkilön määrittely edellyttää usein jälkikäsittelyä

Kotitalouden viitehenkilön määrittely on kotitalouden lisäksi keskeistä kotitalouskohtaisille elinolotilastoille, koska viitehenkilöä koskevat tiedot vaikuttavat kotitalouden sosioekonomisen aseman ja muiden kotitaloutta kuvaavien luokittelumuuttujien määrittelyihin. Kotitalouden viitehenkilö määritellään yleensä henkilökohtaisten, rekisteritiedoista saatavien tulojen perusteella siten, että kotitalouden suurituloisin jäsen on viitehenkilö.

Tämä periaate toimii parhaiten kotitalouksissa, joissa kotitalouden tulonsaajajäsenten sosioekonominen asema on sama (esimerkiksi palkansaaja). Jos näin ei ole, viitehenkilön määrittelyssä otetaan huomioon kaikkien kotitalouden jäsenten sosioekonominen asema ja haastattelujen perusteella kerätyt tiedot heidän tutkimusvuoden aikaisesta toiminnastaan ja työpanoksestaan.

Tällaista jälkikäsittelyä tehdään noin 10 prosentille tulonjakotilaston otoskotitalouksista. Erot ovat kuitenkin suuria sosioekonomisten ryhmien välillä. Eniten jatkokäsittelyä vaativat yrittäjien kotitaloudet. Mikäli viitehenkilö määriteltäisiin ainoastaan rekisteritulotietojen perusteella, sillä olisi vaikutusta sosioekonomisten ryhmien lukumääriin ja tuloihin. (Ruotsalainen — Petrola 2009.)

Tietolähteiden monipuolistuminen ja tiedontuotannon monimutkaistuminen vaatii jatkuvaa kehitystyötä

Kansainvälinen kiinnostus rekisteriperusteista tilastointia kohtaan on kasvanut lähinnä julkisen tilastoinnin budjettirajoitteiden ja vastausrasituksen pienentämistavoitteen myötä. Lisäksi huolta aiheuttaa haastattelututkimusten kadon jatkuva lisääntyminen. On yleisesti tunnustettu, että rekisteritieto auttaa ratkaisemaan näitä ongelmia. Pohjoismaista rekisteriperusteisen tilastoinnin edelläkävijöinä on tullut esikuvia muille maille (Register-based statistics... 2007). Muutos on myös lisännyt vaatimuksia rekisteriperusteisen tiedon käsitteellistämisestä ja sen käytön ongelmien analysoinnista (mt.; Desrosierés 2007; Alastalo 2010).

Rekisteriperusteista tilastointia kohtaan esitetty yleinen kritiikki kohdistuu lähinnä siihen, että se on liiaksi kytköksissä hallintoon. Hallinnolliset rekisterit kuvaavat ennen kaikkea hallinnon toimivuutta ja suoriutumista suhteessa sille asetettuihin tavoitteisiin. Tilastoinnin sen sijaan tulisi kuvata yhteiskunnallisia ilmiöitä ja olla herkkä myös muutoksille. Samaiseen seikkaan liittyy epäily tilastotoimen riippumattomuudesta.

Toinen ongelma koskee lisääntyvää vaatimusta tilastojen kansainvälisestä vertailtavuudesta. Hallinnolliset rekisterit perustuvat kansallisiin käytäntöihin, josta seuraa, että käsitteet eivät aina vastaa kansainvälisesti määriteltyjä tilastollisia käsitteitä. Usein on kuitenkin mahdollista muokata rekisterikäsitteitä lähemmäksi tilastollisia käsitteitä esimerkiksi käyttämällä samanaikaisesti useampia hallinnollisia aineistoja.

Myös kansallisissa tilastotutkimuksissa voi ilmetä uudenlaisia tiedon vertailtavuuteen liittyviä ongelmia, kun rekisteritietoja ja haastattelutietoja käytetään rinnan. Tästä syystä tiedontuottajilta edellytetään lisääntyvässä määrin selvitystyötä ja riittävän metatiedon tuottamista vertailtavuudesta. Tiedonkäyttäjiltä puolestaan edellytetään, että he ottavat huomioon tämän tiedon tehdessään omia tulkintojaan.

Alain Desrosiéres on kiinnittänyt huomiota siihen, että tilastoja koskevat laatukriteerit — etenkin tarkkuutta koskeva — on laadittu lähinnä tilastovirastojen itse suunnittelemien otostilastojen näkökulmasta, joten ne eivät sellaisenaan sovellu rekisteriperusteiseen tilastointiin. Hänen mukaansa relevanssin kriteeri on niille yhteinen, ja hän viittaa rekisteriperusteisen tilastoinnin yhteydessä edellä mainittuun rekisterien hallintokytkennän ongelmaan. Tiedon tarkkuusvaatimus liittyy otosteoriaan ja vastaavaa teoriaa ei ole olemassa rekisteriperusteiselle tilastoinnille.

Ajantasaisuus on olennainen kriteeri ja rekisterien merkitys jatkuvana tiedontuotannon tapana on tässä suhteessa merkittävä. Institutionaaliset tai pienetkin tekniset muutokset aiheuttavat kuitenkin suuria ongelmia tietojen tulkinnassa. Myös rekisterien päivitysongelmat aiheuttavat ongelmia. Kysymys metadatasta on myös kokonaan erilainen. Vertailtavuuden ja koherenssin kriteereitä ei voi lähestyä samalla tavalla. Näiden kahden tietolähteen vertailut edellyttävät uudenlaisten laatukriteerien kehittämistä. (Desrosiéres 2007.)

Elinolotilastoja koskevat esimerkkimme osoittavat, että jyrkän eron tekeminen rekisteriperusteiseen ja otosperusteiseen tilastointiin ei ole kovinkaan perusteltua, koska useassa tilastossa molemmat tietolähteet ovat käytössä (Register-based statistics... 2007). Molempiin tietolähteisiin liittyy hyviä ja huonoja puolia, joita tulisi tarkastella niiden omista lähtökohdista, kuten Marja Alastalo (2010) on ehdottanut.

Kysymys tietolähteestä ei ole pelkästään tekninen ja taloudellinen kysymys. Keskeistä on, että tilastointi pohjautuu aina tiedollisiin tavoitteisiin, ja tämän tavoitteen toteuttamiseen käytetään parhaita mahdollisia tietolähteitä — usein ne ovat sekä rekistereitä että otoksiin perustuvia haastatteluita.

Lähteet:

Alastalo, M. 2010. Miten käsitteellistää rekisteriperusteista tilastointitapaa? Hyvinvointikatsaus 2/2010.
Desrosierés, A. 2007. Surveys versus administrative records: reflection on the duality of statistical sources. Courrier des statistiques, English series no. 13, 2007. Saatavissa: http://www.insee.fr. [Viittauspäivä: 24.8.2010.]
Register-based statistics in the Nordic countries. 2007. Review of best practices with focus on population and social statistics. United nations Economic Commission for Europe. Saatavissa: http://www.unece.org. [Viittauspäivä: 21.7.2010.]
Ruotsalainen, P. 2004. Kotitalous haastattelusta vai rekisteristä? Selvitys kotitalouskäsitteen vaikutuksista keskeisimpiin tulonjakomittareihin. Tilastokeskus. Muistio 28.10.2004.
Ruotsalainen, P.Petrola, T. 2009. Tulonjakotilaston ja EU-SILCin integraatioprojekti. Viitehenkilön määrittely. Tilastokeskus, muistio 2009.

Hyvinvointikatsauksen artikkeleita ja muita kirjoituksia saa siteerata lähde mainiten. Kokonaisen kirjoituksen lainaamiseen tulee saada kirjoittajan lupa. Kirjoittajat kirjoittavat omissa eivätkä Tilastokeskuksen nimissä.


Päivitetty 13.12.2010