Julkaistu: 16.2.2003

Vastaus kysymyksiin Internet-kyselyistä

Muutama kuukausi sitten kirjoitin, että Internet-kyselyille ei voida parhaalla tahdollakaan antaa muuta kuin viihdearvoa, jos sitäkään. Sen jälkeen olen saanut muutaman kyselyn, miten niin? Olen tällä palstalla aiemminkin kirjoitellut muusta kuin tilastografiikasta, joten vastaan nyt näihin kyselyihin.

Otanta- eli survey-tutkimusten (kansanomaisesti galluppien) ajatuksena on, että tutkimalla vain pieni osa kokonaisuudesta eli perusjoukosta voidaan päätellä kokonaisuuden ominaisuuksia, esimerkiksi mielipiteitä. Syynä tähän menettelyyn on se, että kaikkia perusjoukon jäseniä ei voida syystä tai toisesta tutkia, ja siksi on tyydyttävä osittaisinformaatioon.

Tällaisia tutkimuksia tehdään nykyisin erittäin paljon ja miltei kaikilta elämänaloilta. Perinteisesti tällaisia tutkimuksia ovat toteuttaneet tutkimuslaitokset, joilla on vakiintuneet ja testatut menetelmät tutkimusten tekemiseksi. Viime vuosina ovat kuitenkin yleistyneet erilaiset "viihdekyselyt".

Esimerkiksi lehdet pyytävät lukijoitaan kertomaan mielipiteensä tai televisio- ja radio-ohjelmissa katselijoita (tai kuuntelijoita) pyydetään lähettämään mielipiteensä tekstiviestinä tai sähköpostilla. Myös Internetissä kysellään kiihtyvään tahtiin kaikkea maan ja taivaan väliltä. Erilaisten kyselyiden määrä näyttää kasvavan kovaa vauhtia.

Otantatutkimuksen teossa on eräitä keskeisiä vaatimuksia, jotka määräävät sen, voidaanko tutkimuksen tulokset luotettavasti laajentaa käsittämään laajempaa kokonaisuutta. Ensinnä pitää määritellä perusjoukko eli se kokonaisuus, jonka ominaisuuksia tutkitaan. Perusjoukko voi olla esimerkiksi Suomen väestö, jonkin kunnan asukkaat, ison yrityksen työtekijät, marketin asiakkaat, ohjelman katsojat tai Internetin käyttäjät.

Toinen olennainen elementti on se menettely, millä tavalla valitaan ne yksiköt, joilta tietoa kerätään eli miten otos tai näyte muodostetaan. Tämän jälkeen pitää vielä määritellä menetelmät, joiden avulla voidaan arvioida perusjoukon ominaisuudet. Keskityn nyt kuitenkin vain kahteen ensimmäiseen kohtaan.

Tilastotieteellisesti oikeaoppisessa tutkimuksessa perusjoukosta on oltava käytettävissä niin sanottu kehikko, jossa on lueteltu kaikki perusjoukon jäsenet ja näiden tavoittamiseen tarvittavat tiedot. Kehikko voi olla esimerkiksi väestörekisteri tai luettelo yrityksen työntekijöistä. Myös kattava puhelinluettelo voi toimia kehikkona puhelinhaastatteluissa.

Viihdekyselyjen perusjoukkoa on useissa tapauksissa mahdotonta tietää tai edes arvata. Esimerkiksi irtonumeroina ostettavan iltapäivälehden lukijat ovat vaikeasti arvioitava joukko. Samoin televisio-ohjelmat katselijat tai radio-ohjelman kuuntelijat. Varmuudella voidaan sanoa, että perusjoukko ei ole Suomen väestö tai jokin hyvin määritelty osa siitä. Internetissä tehdyn kyselyn perusjoukko on vieläkin epämääräisempi, koska ei tiedetä, keillä on mahdollisuutta päästä Internetiin ja vielä vähemmän, ketkä vierailevat niillä sivustoilla, joihin kysely on asetettu.

Vieläkin vaikeammin hahmotettava asia on se, ketkä viihdekyselyyn vastaavat ja millä perusteella he sen tekevät. Tilastotieteellisesti perusteltu tapa on sellainen, jossa tutkimuksen tekevä taho, esimerkiksi tutkimuslaitos, ottaa vastaajiin yhteyttä ja pyytää vastauksia. Vastauksien saaminen ei siis olennaisesti riipu vastaajien aktiivisuudesta tai kiinnostuksesta tutkittavaan asiaan.

Viihdekyselyissä vastaaminen perustuu vastaajien spontaaniin reaktioon, ja tämän vuoksi vastaajat eivät edusta edes epämääräisesti määriteltyä perusjoukkoa. Spontaanin vastaamisen taustalla on joko voimakas kiinnostus kysyttyä asiaa kohtaan tai useammin luultavasti voimakas tunnetila. Minulla on lisäksi aavistus (tosin sitä ei ole tutkittu), että voimakas kielteinen tunne saa ihmiset reagoimaan useammin kuin voimakas myönteinen tunne. Toisin sanoen neutraalisti tai välinpitämättömästi suhtautuvat eivät vaivaudu vastaamaan, vaikka he saattavat muodostaa enemmistön perusjoukosta. Tämä vinouttaa tuloksia varmuudella, mutta on mahdotonta arvioida, miten paljon.

Esimerkiksi, jos jääkiekko-ottelun, jossa kolme pelaajaa joutuu sairaalahoitoon ja kolme pelaajaa saa eri mittaisia pelikieltoja, jälkeen television katsojilta kysytään, onko pelaajien kunnioitus toisiaan kohtaan vähentynyt, tulos on ennustettavissa. Suuri enemmistö (85% muistaakseni) vastasi, että kunnioitus on vähentynyt. Jos kysely olisi toteutettu paria viikkoa aikaisemmin, tulos olisi suurella varmuudella ollut toisenlainen, mahdollisesti jopa päinvastainen. Tosin kumpikaan tuloksista tuskin edustaisi katsojien yleistä mielipidettä.

Viime kädessä kysymys on siitä, keiden mielipidettä tuloksen sanotaan edustavan. Jos sanotaan, että 50 % niistä, jotka vastasivat oli tietty mielipide, tulos on luonnollisesti oikea. Harvoin kuitenkin ollaan kiinnostuneita vain niistä, jotka vastaavat, vaan jostakin laajemmasta kokonaisuudesta. Lisäongelma on se, että osa yleisöstä kuitenkin ajattelee tuloksen edustavan laajempaa kokonaisuutta sanottiinpa edustavuudesta mitä tahansa.

Peruskysymys on siis, keitä vastaajien ajatellaan edustavan eli mikä on se kokonaisuus, josta vastaajat tulevat. Viihdekyselyihin vastaavat ovat useimmiten epämääräisestä kokonaisuudesta epämääräisellä menetelmällä valittu joukko. Valitettavan usein näin saatujen tulosten sanotaan edustavan lukijoiden, katsojien tai kansan tms. mielipidettä. Jos tämä pitää paikkansa, kysymys on samasta ilmiöstä kuin silloin, kun sokea kana löytää jyvän. Erona tosin on se, että kana tietää löytäneensä jyvän.


Päivitetty 16.2.2003

Lisätietoja:
sähköposti: tietoaika@tilastokeskus.fi