- Tämä juttu on arkistoitua sisältöä, joka tarjotaan luettavaksi sellaisenaan. Tämän vuoksi siinä voi olla saavutettavuusongelmia.
Henkilötiedonkeruuta tehdään pian myös verkossa
Tilastokeskus antaa kansalaisille mahdollisuuden vastata kyselyihinsä verkossa vuodesta 2016 alkaen.
Tilastokeskuksen tavoitteena on mahdollistaa kansalaisille verkossa vastaaminen vuodesta 2016 alkaen.
Verkkovastaaminen edellyttää kuitenkin paljon tiedonkeruisiin liittyvää menetelmätyötä ja testaamista. Eri menetelmin saatujen tietojen tulee olla keskenään vertailukelpoisia, vastauskato ei saa nousta, tietoturvasta tulee huolehtia ja kansalaisia tulee kohdella tasapuolisesti.
Tilastokeskus kerää vuosittain väestön elinoloihin liittyviä tietoja noin 200 000 kansalaiselta. Tietojen pohjalta laaditaan sosiaalitilastoja, jotka muodostavat kattavan kuvan suomalaisten elämästä ja olosuhteista. Kansalaisilta kysyttäviin haastattelutietoihin perustuvat muun muassa työllisyys- ja tulonjakotilastot sekä väestön tietotekniikan käyttöä, kulutusta, ajankäyttöä ja vapaa-ajan toimintaa kuvaavat tilastot. Näitä tiedonkeruita kutsutaan henkilötiedonkeruiksi, ja ne kuuluvat Suomen virallisen tilastoinnin piiriin.
Nykyisin virallisten tilastojen tiedot kerätään kansalaisilta pääosin puhelinhaastattelujen avulla. Myös käyntihaastatteluja käytetään eräissä isohkoissa tiedonkeruissa. Haastattelujen määrä on valtava; yksinomaan työvoimatutkimuksessa tehdään joka kuukausi noin 10 000 puhelinhaastattelua. Tiedonkeruuta on tekemässä jatkuvasti lähes 200 haastattelijaa.
Tietotekniikka ja internetin käyttö alkavat olla arkipäivää jo suurimmassa osassa suomalaiskoteja. Alle 65-vuotiaista suurin osa käyttää internetiä lähes päivittäin, ja aktiivikäyttäjiä löytyy yhä runsaammin myös vanhimmista ikäryhmistä (kuvio 1).
Kuvio 1. Suomalaisten internetin käyttö ikäryhmittäin vuonna 2014
Lähde: Tilastokeskus, väestön tieto- ja viestintätekniikan käyttö
Erilaiset nettikyselyt ovat kansalaisille tuttuja, ja myös monet viranomaisasiat voidaan hoitaa internetin välityksellä. Netissä voi esimerkiksi tilata verokortin, hakea Kelasta tukia ja tehdä päivähoitohakemuksen, ja suuri osa kansalaisista myös käyttää näitä mahdollisuuksia (kuvio 2). Tämän myötä tuntuu luontevalta, että myös virallisen tilaston tiedonkeruuseen olisi mahdollista vastata verkon kautta.
Kuvio 2. Suomalaisten internetin käyttö viranomaisasiointiin vuonna 2014
Lähde: Tilastokeskus, väestön tieto- ja viestintätekniikan käyttö
Tilastokeskuksen tavoitteena onkin mahdollistaa verkossa vastaaminen kansalaisille vaiheittain vuodesta 2016 alkaen. Yritystilastoissa ja ulkopuolisella rahoituksella toteutetuissa tilaustiedonkeruissa verkkovastaaminen on ollut käytössä jo pitkään.
Viimeksi kuluneiden parin vuoden aikana verkkotiedonkeruuta on testattu pilottitutkimusten avulla kahdessa erityyppisessä tiedonkeruussa: kansalaisten talouteen liittyviä mielikuvia kartoittavassa kuluttajabarometrissa sekä työllisyys- ja työttömyyslukujen pohjana olevassa työvoimatutkimuksessa. Pilottitutkimuksista saadut kokemukset osoittavat, että virallisten henkilöpohjaisten tilastojen tiedonkeruisiin liittyy erityisiä haasteita.
Yhdistelmätiedonkeruu käyttää useita menetelmiä
Haastatteluja ei täysin korvata verkkolomakkeilla, vaan suurimmassa osassa henkilötiedonkeruita tullaan käyttämään kahta rinnakkaista tiedonkeruumenetelmää. Kyse on siis niin kutsutusta yhdistelmätiedonkeruusta (mixed mode data collection), jossa osa tiedoista saadaan verkkotiedonkeruun kautta, osa haastattelemalla.
Kansalaisten tasapuolisten vastaamismahdollisuuksien turvaaminen on Tilastokeskukselle tärkeää, joten esimerkiksi tietokoneen puuttuminen ei saa olla esteenä tutkimukseen osallistumiselle. Ja vaikka välineissä ja taidoissa löytyisikin, vastaaja voi muusta syystä kokea verkossa vastaamisen epämieluisaksi.
Haastatteluja tarvitaan paikkaamaan katoa, sillä aiempien pilottitutkimusten perusteella pelkällä verkkotiedonkeruulla ei päästä riittäviin vastausosuuksiin. Kun kuluttajabarometrissa testattiin yhdistelmätiedonkeruuta, saatiin vastauksista 42 prosenttia verkkotiedonkeruun kautta, ja työvoimatutkimuksen verkkotiedonkeruupilotissa vastausaste oli 30 prosenttia. Puhelimitse tehtävän työvoimatutkimuksen vastausosuus on noin 70 prosenttia.
Tiedonkeruilla on usein tiukka aikataulu, eikä vastauksia voida pitkään odotella. Toisaalta väljemmästä aikataulustakaan ei välttämättä olisi merkittävää hyötyä. Esimerkiksi työvoimatutkimuksen verkkotiedonkeruupilotissa suurin osa verkkovastauksista saatiin heti tiedonkeruun käynnistyttyä tai muistutusviestien jälkeen. Jos vastaaminen jää tuonnemmaksi, se jää helposti kokonaan, vaikka vastaaja suhtautuisi kyselyyn periaatteessa myönteisesti. Tällöin haastattelijan yhteydenotto on tarpeellinen vastausten saamiseksi.
Haastattelemalla saatujen vastausten osuus tulee siis ainakin toistaiseksi olemaan tiedonkeruissa suurempi kuin verkkovastausten osuus. Ajan myötä tämä suhde voi toki muuttua.
Tietojen laadusta on huolehdittava
Uuden tiedonkeruumenetelmän käyttöönotto ja usean tiedonkeruutavan yhdistäminen tuo mukanaan tietojen laatuun ja vertailtavuuteen liittyviä haasteita. Lopullisten tietojen tulee olla vertailukelpoisia tiedonkeruutavasta riippumatta, ja aikasarjojen jatkuvuudesta on huolehdittava.
Henkilötiedonkeruiden pohjalta tuotetaan monia poliittisesti keskeisiä indikaattoreita, kuten kuluttajabarometrin perusteella laskettava kuluttajien luottamusindikaattori, työvoimatutkimukseen perustuvat työttömyys- ja työllisyysasteet sekä tulo- ja elinolotutkimukseen pohjautuva pienituloisuusaste. Erityisesti taloudellisesti epävakaina aikoina epäilys siitä, että muutokset näissä luvuissa johtuisivat uudesta tiedonkeruutavasta, vaarantaisi tilastotietojen luotettavuuden vakavasti.
Verkossa ja haastattelussa käytettävät tiedonkeruulomakkeet eivät voi olla ominaisuuksiltaan täysin samanlaisia, sillä vastaaminen on erilaista eri menetelmillä. Verkkolomake nojaa visuaalisiin ratkaisuihin, joiden avulla vastaaminen yritetään tehdä mahdollisimman helpoksi, kun taas haastattelussa haastattelija voi motivoida ja auttaa vastaajaa.
Tiedonkeruu on kuitenkin muutoksille herkkää, ja pieniltäkin tuntuvat muutokset lomakkeella saattavat vaikuttaa tuloksiin yllättävällä tavalla. Yksi esimerkki tästä on ”en osaa sanoa” eli eos –vastausvaihtoehdon esittämistapa lomakkeella. Tutkimukset ovat osoittaneet, että eos-vastauksen tarjoaminen yhtenä näkyvänä vastausvaihtoehtona lisää eos-vastausten osuutta erityisesti tieto-, mielipide- ja asennekysymyksissä ja siten heikentää tiedonkeruun laatua (ks. Jokinen & Järvensivu 2014).
Tämä nähtiin selvästi kuluttajabarometrin pilottitutkimuksessa, jossa eos-vaihtoehto oli näkyvissä verkkolomakkeella, mutta sitä ei puhelinhaastattelussa luettu ääneen. Eos-vastausten osuus oli selvästi suurempi verkkolomakkeella kuin puhelimessa vastanneilla, mikä heikentää eri keruutapojen vertailukelpoisuutta.
Keruutapa voi vaikuttaa selvästi tuloksiin myös kysymyksissä, joissa vastaus valitaan usean vaihtoehdon joukosta. Kun haastattelija lukee vaihtoehdot ääneen, vastaajan mieleen jäävät listalta helpoimmin viimeksi mainitut, ja vastaus valitaan herkemmin näiden joukosta. Verkkolomakkeella annetut vastaukset puolestaan painottuvat listan alkupäähän, sillä vastaaja valitsee listalta herkästi ensimmäisen, joka tuntuu sopivalta. Näin ollen samaan kysymykseen voidaan saada haastattelussa ja verkkolomakkeella erilainen vastausjakauma. (Bethlehem & Biffignandi 2012.)
Tiedonkeruuta testataan monin tavoin
Tietojen laadunvarmistukseen on onneksi keinoja. Tärkein keino on ammattitaitoinen ja huolellinen lomakesuunnittelu, joka Tilastokeskuksessa osataan. Olennaista on myös lomakkeiden testaus aidoilla vastaajilla. Testaus voi olla joko laadullista tai kvantitatiivista, ja molempia tarvitaan näin laajamittaisen uudistuksen yhteydessä.
Laadullisessa testauksessa mukana on pieni joukko vastaajia, joita pyydetään vastatessaan kertomaan siitä, miten he lomakkeen kysymykset ymmärtävät ja miltä vastaamiskokemus tuntuu. Laadullinen testaus on joustavaa ja kustannustehokasta, ja sen avulla saadaan arvokasta tietoa lomakkeen kehittämiseksi. Erityisen hyödyllistä laadullinen testaus on silloin, kun halutaan tutkia jonkin rajatun, juuri kyseiselle tiedonkeruulle kriittisen kohderyhmän vastaamista.
Kvantitatiivisessa testauksessa kyse on pilottitutkimuksesta, jossa tutkimusasetelma on lähellä aitoa tiedonkeruuta ja vastaajajoukot melko laajoja. Pilottitutkimus on usein eräänlainen kenraaliharjoitus, jonka avulla voidaan varmistua tiedonkeruun toimivuudesta ennen muutosten käyttöönottoa varsinaisessa tiedonkeruussa. Pilottitutkimuksen tuloksia voidaan tutkia tilastollisin menetelmin ja siten selvittää esimerkiksi muutoksia keskeisissä indikaattoreissa.
Tänä vuonna Tilastokeskus toteuttaa yhdistelmätiedonkeruun käyttöönottoon liittyvää laadullista testausta työvoimatutkimuksessa ja asuntojen vuokratiedustelussa sekä kvantitatiiviset pilottitutkimukset väestön tieto- ja viestintätekniikan käyttö -tutkimuksessa ja työvoimatutkimuksessa. Testikierrosten tuloksia saadaan käyttöön vaiheittain vuosien 2015–2016 aikana, ja niitä hyödynnetään yhdistelmätiedonkeruun käyttöönoton suunnittelussa.
Vastauskokemus vaikuttaa katoon
Lomakesuunnittelu on tärkeää paitsi tietojen laadun kannalta, myös kadon hillitsemisen keinona. Vastauskadon kasvu on yksi keskeisimmistä huolenaiheista henkilötiedonkeruissa.
Yrityksille ja yhteisöille tilastotiedonkeruisiin vastaaminen on usein pakollista, mutta kansalaisten osallistuminen perustuu vapaaehtoisuuteen. Haastattelujen yhteydessä haastattelija voi suostutella vastahakoistakin vastaajaa jatkamaan kyselyn loppuun, mutta verkossa vastatessaan vastaaja on omillaan. Jos vastaaminen tuntuu hankalalta tai epämiellyttävältä, verkossa kyselyyn vastaaminen on helppo lopettaa.
Tiedonkeruulomakkeiden tekniseen toimivuuteen ja käytettävyyteen sekä sisällön ymmärrettävyyteen on siis panostettava, jotta vastaaminen olisi mahdollisimman miellyttävä kokemus. On myös kiinnitettävä erityistä huomiota vastaajien motivointiin tiedonkeruumateriaaleissa (kuten tiedonkeruusta kertovissa saatekirjeissä ja Tilastokeskuksen verkkosivuilla).
Erityisen tärkeää motivointi on toistuvien tiedonkeruiden kohdalla; esimerkiksi työvoimatutkimuksessa saman vastaajan pitäisi pysyä mukana kaikkiaan viisi ja tulo- ja elinolotutkimuksessa neljä tiedonkeruukertaa. Vastaamiskokemuksen laatu vaikuttaa ilman muuta siihen, miten innokkaasti vastaaja seuraavalla kerralla lähtee lomaketta täyttämään.
Tietoturva on varmistettava
Vastaajan tietoturvasta huolehtiminen on ensiarvoisen tärkeää kaikissa tiedonkeruissa. Yksittäisen vastaajan antamat tiedot ovat ehdottoman luottamuksellisia, ja myös verkkotiedonkeruun puolella on varmistuttava siitä, ettei vastauksia pääse vuotamaan tiedonkeruujärjestelmän ulkopuolelle. Vastaajien luottamuksen säilyttäminen on Tilastokeskukselle ensiarvoisen tärkeää, eikä tietoturva saa vaarantua missään olosuhteissa.
Tietoturvaan liittyy myös se, että varmistutaan vastaajan henkilöllisyydestä. Tilastokeskuksen henkilötiedonkeruut perustuvat väestötietojärjestelmästä poimittuun satunnaisotokseen. Vastaajaksi käy vain otokseen poimittu henkilö, eikä alkuperäistä vastaajaa voi korvata toisella henkilöllä. Usein lomakkeelle on viety valmiiksi tietoja, jotka ovat peräisin saman tiedonkeruun edelliseltä vastauskerralta, joten luonnollisesti on tärkeää, että tiedot ovat vain vastaajan itsensä nähtävissä.
On siis rakennettava tunnistautumisjärjestelmä, jonka kautta otokseen valittu pääsee kirjautumaan lomakkeelle. Järjestelmä varmistaa, että kyse on juuri oikeasta henkilöstä. Pankkitunnukset ovat varsin yleisesti käytössä viranomaisten internet-palveluissa. Pankkitunnusten kautta kirjautuminen on yksi vaihtoehto myös Tilastokeskuksen verkkotiedonkeruissa.
Toinen vaihtoehto on käyttää erikseen määriteltäviä kirjautumistunnuksia, jotka lähetetään vastaajalle henkilökohtaisen saatekirjeen mukana. Molemmissa ratkaisuissa on hyvät ja huonot puolensa, ja ne soveltuvat vaihtelevasti eri tiedonkeruiden tarpeisiin. Lopullinen käyttöön otettava järjestelmä tuleekin todennäköisesti olemaan jonkinlainen yhdistelmä eri ratkaisuja.
Verkkovastaaminen ei tuo nopeita säästöjä
Verkkotiedonkeruuta kehitetään parhaillaan myös muissa Euroopan tilastovirastoissa. Työ on edennyt varovaisin askelin, eikä täysin valmista ratkaisua ole tarjolla missään. Tiedonkeruiden ja maiden lähtötilanteen erilaisuudesta johtuen samat ratkaisut eivät toimi kaikissa maissa. Samassa tilanteessa Suomen kanssa ovat vain muut Pohjoismaat ja muutama muu Euroopan maa kuten Hollanti, Viro ja Itävalta.
Selvää kuitenkin on, että verkkotiedonkeruun käyttöönotto on lähitulevaisuuden tavoitteena kaikissa Euroopan tilastovirastoissa. Tähän vaikuttavat paitsi tietoteknisten välineiden läpimurto, myös toive säästää tiedonkeruukustannuksissa.
Uusi tiedonkeruumenetelmä ei tuo ihmepelastusta tilastovirastojen budjetteihin. Kehittämistyö vaatii resursseja ja kustannushyödyt realisoituvat vasta pitkällä tähtäimellä, kun yhdistelmätiedonkeruu saadaan käyttöön täysimittaisesti. Ajan myötä vastaajat oppivat kuitenkin varmasti hyödyntämään verkkovastaamisen hyviä puolia, ja verkkotiedonkeruiden suunnittelusta tulee rutiinia myös tilastoviranomaiselle.
Kirjoittaja toimii yhdistelmätiedonkeruusta vastaavana projektipäällikkönä Tilastokeskuksen tiedonhankinta-yksikössä.
Lähteet:
Bethlehem, Jelke & Biffignandi, Silvia 2012. Handbook of Web Surveys. Hoboken, New Jersey: John Wiley & Sons.
Jokinen, Marika & Järvensivu, Marjaana 2014. En osaa sanoa -vastaaminen verkkokyselyissä. Hyvinvointikatsaus 4/2014.