Otostutkimukset otettiin hitaasti käyttöön virallisissa tilastoissa

Otostutkimukset tulevat väestölaskennan korvikkeiksi

Ensimmäisenä nykymuotoisena otostutkimuksena pidetään Norjan tilastoviraston pääjohtajan Anders Kiaerin haastattelututkimusta 1890-luvun alussa. Tällä tutkimuksellaan Kiaer pyrki hankkimaan tietoja norjalaisten sosiaalisista oloista väestölaskentaa yksinkertaisemmalla ja halvemmalla menetelmällä. Kiaerin menetelmässä tutkimusnäyte pyrittiin muodostamaan väestön "pienoismalliksi". Tämä oli käänteentekevä innovaatio, ja edelleenkin edustavan otoksen ajatellaan olevan pienoismalli perusjoukosta.

Kiaer esitteli "edustavan menetelmänsä" Kansainvälisen tilastoinstituutin ISI:n kokouksessa vuonna 1895 (Kiaer 1895). Se sai osakseen voimakasta kritiikkiä sen ajan nimekkäimmiltä tilastotieteilijöiltä. Jyrkin arvostelu Kiaerin menetelmää kohtaan tuli yllättäen Norjasta: sen väitettiin antavan harhaanjohtavan kuvan Norjan väestöstä ja sen elinoloista. Kritiikki oli niin vakuuttavaa, että otostutkimukset hävisivät Norjasta kokonaan moneksi vuosikymmeneksi (Lie 2002).

Suomen julkinen sektori omaksuu otostutkimukset

Suomessa otanta- ja haastattelumenetelmien tuntemus kasvoi nopeasti 1940-luvun lopussa ja 1950-luvun alussa. Heikki Waris ja Pekka Kuusi tekivät niihin aikoihin ensimmäiset akateemiset otostutkimukset (ks. Kuusela 2008). Myös julkisella sektorilla menetelmä alkoi olla tunnettu, joskaan Tilastokeskuksessa sitä ei käytetty.

Luultavasti ensimmäinen viranomaisen tekemä otostutkimus oli verorasituskomitean vuonna 1950 toteuttama haastattelututkimus "fyysillisten henkilöiden verorasituksen" selville saamiseksi. Komitean raportissa on varsin seikkaperäinen ja asiantunteva kuvaus otosmenetelmistä. Raportissa käytettiin suomenkielisten termien puuttuessa vielä usein englantia, esimerkiksi otoksen sijasta käytettiin sanaa "sampling". Komitea kuuli asiantuntijoina muun muassa professori A. E. Tudeeria, yliaktuaari E. H. Laurilaa ja Tauno Hellevuota Suomen Gallupista.

Tämän tutkimuksen esikuvana oli monissa maissa tehty kulutustutkimus. Vaatimukseksi astetettiin, että "aineiston tulee mahdollisimman hyvin edustaa läpileikkausta kaikista väestön ja väestöryhmän perheistä". Kirjanpitomenetelmää ei pidetty riittävän nopeana ja luotettavana, ja siksi komitea päätyi käyttämään haastattelumenetelmää, josta oli saatu hyviä kokemuksia muun muassa Yhdysvalloissa, Kanadassa ja Ranskassa.

Suomessa ei ollut tilastoa perhetyypeistä, eikä meillä tiedetty perheitten tai perhetyyppien jakautumista tuloluokkiin. Sen selvittämiseksi komitea teki esitutkimuksen, koska "viime aikoina tapahtunut kehitys sampling-teorian alalla on näet johtanut menetelmiin, joissa tarvitaan etukäteen laadittuja luetteloita tutkimukseen joutuvista henkilöistä tai perheistä nimineen ja osoitteineen." Esitutkimuksessa käytettiin "stratifioitua randomsampling" -menetelmää. Esitutkimuksen aineistosta valittiin satunnaisesti noin tuhannen ruokakunnan "sampling" varsinaiseen kulutustutkimukseen.

Omien haastattelijoiden rekrytointi ja kouluttaminen arvioitiin liian kalliiksi ja hitaaksi. Siksi komitea päätyi käyttämään Suomen Gallupin haastattelijaverkostoa, joka oli siihen aikaan ainoa pysyvä organisaatio Suomessa.

Helsinki etunenässä otostutkimusten käyttäjäksi

Otostutkimukset sisällytettiin julkisiin tilastoihin ensimmäisten joukossa myös Helsingissä. Kettil Bruun teki 1950-luvun alussa Helsingin kaupungin toimeksiannosta kaksi otostutkimusta: ensimmäinen koski Helsingin nuorisoa (Bruun 1952) ja toinen vanhusväestöä (Bruun 1953). Bruunin tutkimukset ajoittuvat samalle ajanjaksolle kuin Heikki Wariksen ja Pekka Kuusen ensimmäiset tutkimukset (ks. Kuusela 2008). Myös Bruun näyttää olleen varsin hyvin perillä surveymetodologiasta ja sen ongelmista.

Nuorisotutkimuksen otannan Bruun pyrki tekemään "umpimähkäisesti", mutta tietoa nuorten kokonaismäärästä Helsingissä ei ollut saatavilla - otos oli poimittava kaksivaiheisesti väestökirjoista. Bruun teki myös katoanalyysin ("poisputoama" oli 9,7 %) ja totesi, että nuorimman ikäryhmän osalta tietoja voidaan pitää suurin piirtein edustavina, mutta vanhemmissa ikäryhmissä kato oli niin suurta, että se saattoi vaikuttaa tuloksiin.

Kettil Bruun analysoi seikkaperäisesti myös kerätyn aineiston luotettavuutta. Tutkimuksen suurimpia virhelähteitä olivat Bruunin mukaan haastattelijoiden kirjaamat epätarkat tai virheelliset vastaukset. (Haastattelijoina toimi 50 teoreettisesti haastattelutyöhön perehtynyttä ylioppilasta.) Haastattelijoiden piti toimittaa aineisto vähintään kahdessa erässä, jotta haastattelijoiden työ voitiin tarkistaa tiedon keruun kestäessä.

Lisäksi haastattelijoiden piti itse arvioida, miten luotettavana he pitivät haastattelua (täysin luotettavia haastatteluja oli 64,7 %). Lisäksi "kuvan saamiseksi arkaluonteisten kysymysten - - vastausten vilpittömyydestä" lomakkeella oli kysymys: "Äänestittekö viime vaaleissa?". Näitä vastauksia oli tarkoitus verrata äänestystietoihin, mutta vertailu osoittautui vaikeaksi ja epäluotettavaksi. Bruun kuitenkin toteaa, että "suurin piirtein lienee aineisto tyydyttävä."

Vanhustutkimuksen menetelmä oli suurin piirtein samanlainen kuin nuorisotutkimuksessakin, ja raportointikin noudatti samoja periaatteita (ks. Bruun 1953).

Työvoimatutkimus oli Tilastokeskuksen ensimmäinen otostutkimus

Tilastokeskuksen ensimmäinen moderni otostutkimus oli vuonna 1958 aloitettu Työvoimatutkimus, joka aluksi tehtiin postikyselynä (ks. Kuusela 2009). Tätä edelsi Lauri Heikinheimon tutkimus metsätyövoiman tutkimusmenetelmistä (Heikinheimo 1954). Tutkimus tehtiin Helsingin yliopistossa, mutta Tilastollisen päätoimiston väestölaskentaosasto ja sen kenttäorganisaatio osallistui näytteen poimintaan ja tiedon keruuseen. Asiantuntijoina tutkimukseen osallistuivat muun muassa professorit Heikki Waris ja Leo Törnqvist.

Ennen varsinaisen aineiston poimintaa Heikinheimo teki kolme esitutkimusta otanta- ja tiedonkeruumenetelmien vertailemiseksi. Varsinkin otantaa koskeva tutkimus oli perusteellinen; sen tärkein tavoite oli otoskoon määrittäminen ennalta määriteltyjen virhemarginaalien puitteissa. Heikinheimo totesi esitutkimusten osoittaneen, että Suomessa on otantatutkimuksia varten käyttökelpoinen luettelo, henkikirjat, joista otos voidaan poimia vaivattomammin kuin esimerkkimaissa Yhdysvalloissa ja Englannissa. Lisäksi hän totesi esitutkimusten osoittaneen, että osittamisella ei saavuteta mainittavaa hyötyä.

Tutkimuksen perusjoukkona olivat kaikki maalaiskunnissa asuneet työikäiset miehet, ja heistä poimittiin kuukauden 1. ja 15. päivinä syntyneet. Pitkän pohdinnan jälkeen Heikinheimo totesi, että käytännössä ei ole mitään syytä epäillä, ettei näin poimittua näytettä voisi pitää todennäköisyysotoksena.

Kaikki kotitaloudet kulutustutkimuksen otokseen vuonna 1966

Tilastokeskus teki ensimmäisen kulutustutkimuksen jo vuosisadan alussa, mutta vasta vuonna 1966 tehtiin ensimmäinen tutkimus, jonka otos edusti maan kaikkia kotitalouksia. Tätä aiemmat tutkimukset oli rajoitettu joihinkin erityisiin väestöryhmiin kuten palkansaajiin tai maaseutuväestöön. Modeenin (1952) mukaan satunnaisotantaa ei Suomessa sovellettu kulutustutkimuksessa käytännöllisten syiden takia, vaikka sitä monessa muussa maassa käytettiinkin ja siitä oli hyviä kokemuksia. Merkittävin käytännön syy oli ongelmat haastattelutyön organisoinnissa. Vuosien 1966 ja 1971 kulutustutkimusten tietojenkeruun hoitivat maatalous- ja kotitalousneuvojat (Marjomaa 2000).

Tilastokeskuksella ei ollut omaa pysyvää haastatteluorganisaatiota vielä 1970-luvun alussa, ja siksi tiedonkeruut oli hoidettava erilaisilla väliaikaisilla järjestelyillä. Esimerkiksi vuoden 1971 kotitaloustiedustelun (kulutustutkimuksen) tarpeisiin rekrytoitiin 250 haastattelijaa. Kuluttajahintaindeksiä varten hintatietoja hankki 70 asiamiestä.

Työvoimatutkimuksen kadon tutkimiseksi tehtiin haastattelututkimus, johon tarvittiin 350 maatalouskeskusten toimihenkilöä (Marjomaa 2000). Haastattelijoiden tarve lisääntyi jatkuvasti 1970-luvulla. Lopulta vuonna 1975 Tilastokeskukseen perustettiin haastatteluorganisaatio, mikä helpotti oleellisesti otosmenetelmän käyttöönottoa.

  1. Ensimmäiset osittaistutkimukset
  2. Otostutkimukset tulevat väestölaskennan korvikkeiksi
  3. Suomen julkinen sektori omaksuu otostutkimukset
  4. Helsinki etunenässä otostutkimusten käyttäjäksi
  5. Työvoimatutkimus oli Tilastokeskuksen ensimmäinen otostutkimus
  6. Kaikki kotitaloudet kulutustutkimuksen otokseen vuonna 1966
  7. Yksityiset tutkimuslaitokset tienraivaajina

Yksityiset tutkimuslaitokset tienraivaajina

Suomessa otostutkimusten yleistymistä luultavasti haittasi yliopisto-opetuksen puuttuminen. Suomen ensimmäiset akateemisten otostutkimusten tekijät hankkivat tietonsa Yhdysvalloista (ks. Kuusela 2008). Georg Lutherin (1993) mukaan Helsingin yliopistossa alettiin järjestää tilastotieteen peruskursseja 1940-luvun puolivälin tienoilla. Näillä kursseilla käsiteltiin tilastotieteen perusasioita, mutta ei otantateoriaa. Suomen Tilastoseura järjesti ensimmäisen otantateorian kurssin vasta vuonna 1950. Kouluttajiksi kutsuttiin asiantuntijoita ulkomailta.

Tilastovirastoissa on aina 1800-luvulta lähtien ollut paljon surveymenetelmään epäilevästi suhtautuvia. Ensimmäinen viralliseen tilastoon kuuluva otostutkimus aloitettiin Suomessakin vasta vuonna 1958. Gunnar Modeenin (1952) kommentti viittaa epäsuorasti siihen, että otostutkimusten verkkainen tulo Suomen virallisen tilaston osaksi johtui viraston epäilevästä asenteesta: " - - haastattelu- ja tutkimusmenetelmää - - on käytetty suhteellisen menestyksellisesti Yhdysvalloissa ja Kanadassa. Siellä onkin suuren yleisön suhtautuminen tällaisiin kyselyihin suopea." Myös haastatteluorganisaation puuttuminen hidasti menetelmän käyttöönottoa.

Toisaalta kehityskulku on lähes kaikissa maissa ollut samankaltainen. Ensin surveytutkimukset on otettu käyttöön yksityisissä mielipidetutkimuslaitoksissa, niiden jälkeen akateemiset tutkijat ovat alkaneet soveltaa menetelmää ja viimeiseksi - usein pitkän ajan jälkeen - julkinen sektori on alkanut kerätä tietoja otostutkimuksilla.

Lähteet:

Bruun, K. 1952.Nuorisotutkimus vuonna 1951. Tilastollisia kuukausitietoja Helsingistä 1952 nro 10-11. Helsingin kaupungin tilastotoimisto.
Bruun, K. 1953. Vanhustutkimus vuonna 1952. Tilastollisia kuukausitietoja Helsingistä 1953 nro 5-6. Helsingin kaupungin tilastotoimisto.
Fyysillisten henkilöiden verorasitus vuonna 1949. Komitean mietintö 8/1951.
Hansen, M. 1987.Some History and Reminiscences on Survey Sampling. Statistical Science 2/1987.
Heikinheimo, L. 1954. Metsätyövoiman tutkimusmenetelmä. Acta forestelia Fennica 63. Helsinki.
Kiaer, A. N. 1895. Observations et expériences concernant des dénombrements représentatives. Bulletin of the International Statistical Institute 9, 176-183.
Kuusela, V. 2008. Surveyn alkutaival tieteelliseksi tutkimusmenetelmäksi. Hyvinvointikatsaus 4/2008.
Kuusela, V. 2009. Suuri lama teki työvoimatutkimuksesta otostutkimusten edelläkävijän. Hyvinvointikatsaus 1/2009.
Lie, E. 2002. The Rise and Fall of Sampling in Norway, 1875-1906. Science in Context, 15, 385-409.
Luther, G. 1993. Suomen tilastotoimen historia vuoteen 1970. Tilastokeskus, Helsinki.
Marjomaa, P. 2000. Tilastokeskus 1971-2000. Tilastokeskus, Helsinki.
Modeen, G. 1952. Elinkustannusindeksi. Sosiaalipoliittisen yhdistyksen julkaisuja 4. Tammi, Helsinki.

Hyvinvointikatsauksen artikkeleita ja muita kirjoituksia saa siteerata lähde mainiten. Kokonaisen kirjoituksen lainaamiseen tulee saada kirjoittajan lupa. Kirjoittajat kirjoittavat omissa eivätkä Tilastokeskuksen nimissä.


Päivitetty 30.9.2009