Julkaistu: 16.2.2003

Prosenttijakauman käyttö vertailussa

Vertailun mahdollistaminen on tilastotaulukon keskeisin tehtävä. Täsmällinen vertailu on mahdollista tehdä vain jakamalla havaitut ilmiöt mahdollisimman yksikäsitteisiksi ominaisuuksiksi, joita yksi kerrallaan voidaan vertailla. Vertailun täsmällisyys on siten kokonaiskuvan vastakohta. Mitä kokonaisvaltaisempaa vertailua tehdään sitä vähemmän täsmällistä vertailu voi olla.

Yksinkertaisin menetelmä erikokoisten ryhmien vertailemiseksi on prosenttijakaumien vertailu. Taulukkoja tehtäessä prosenttilaskun suunnan valitseminen tuntuu joskus olevan vaikeata. Se on kuitenkin tietojen vertailun kannalta olennaista. Väärin valittu prosenttijakauman suunta peittää havaitut erot.

Seuraavassa esitän kuvitteellisen esimerkin lomakohteen x turisteista tiettynä ajankohtana.

Esimerkkitaulukosta näemme heti, että lomakohde on nuorison suosiossa ja että havainto on suurin piirtein sama kaikissa kansallisuuksissa (taulukko 1). Äkkiä katsoen näyttää siltä että eniten matkailijoita on tullut Ruotsista.

Taulukko 1. Matkailijoiden kansallisuus ja ikä lomakohteessa x

  15-24-vuotiaat 25-34-vuotiaat 35-44-vuotiaat 45-54-vuotiaat
suomalaiset 370 30 20 21
ruotsalaiset 570 57 48 43
norjalaiset 320 37 32 45

Jos haluamme vertailla tarkemmin ryhmiä tarvitsemme avuksi prosenttijakaumia. Jos haluamme saada tarkan kuvan eroavatko kansallisuudet ikärakenteeltaan toisistaan, meidän on laskettava eri ikäryhmien osuudet kussakin kansallisuusryhmässä. Eli on laskettava taulukosta vaakaprosentit (taulukko 2).

Taulukko 2.Matkailijoiden ikä kansallisuusryhmittäin lomakohteessa x

  15-24-vuotiaat 25-34-vuotiaat 35-44-vuotiaat 45-54-vuotiaat YHTEENSÄ
suomalaiset 84 7 5 5 100%
ruotsalaiset 79 8 7 6 100%
norjalaiset 74 9 7 10 100%

Kun prosentit on laskettu vaakasuoraan, voimme havaita, että eri kansallisuusryhmät tutkittavassa ryhmässä ovat ikärakenteeltaan melko samanlaisia. Huomaamme kuitenkin että suomalaiset ovat nuorimpia ja norjalaiset vanhimpia. Eri kansallisuusryhmien osuudesta eri ikäryhmissä emme kuitenkaan voi sanoa mitään tämän taulukon perusteella.

Seuraavassa taulukossa prosentit on laskettu pystysuuntaan (taulukko 3).

Taulukko 3.Matkailijoiden kansallisuus ikäryhmittäin lomakohteessa x

  15-24-vuotiaat 25-34-vuotiaat 35-44-vuotiaat 45-54-vuotiaat
suomalaiset 29 24 20 19
ruotsalaiset 45 47 48 39
norjalaiset 25 29 35 41
YHTEENSÄ 100% 100% 100% 100%

Pystysuoraan lasketut prosentit taas ovat tarpeen jos haluamme tietää mikä on eri kansallisuuksien merkitys eri ikäryhmissä. Tämän taulukon tietoa voitaisiin käyttää esimerkiksi kun tuotetaan eri ikäryhmille informaatiota ajanviettomahdollisuuksista eri kielillä. Tämä jakauma osoittaa että ruotsalaisten osuus on suurin muissa paitsi 45-54-vuotiaiden ikäryhmässä. Siis vanhimmassa ikäryhmässä tarvitaan ruotsinkielistä aineistoa vähemmän.

Pystyprosentteja esittävä taulukko ei kerro mitään ikäryhmien keskinäisestä merkityksestä eikä myöskään kansallisuuksien ikärakenteiden vertailu ole mahdollista.

Vertailua varten prosenttijakaumat on aina laskettava siten, että vertailu tapahtuu kahden eri kantaluvusta lasketun prosenttijakauman kesken. Saman prosenttijakauman osuuksia ei kannata vertailla, koska ne ovat toisistaan loogisesti riippuvaisia.

Sääntö kuuluu: prosentit on laskettava selittävän muuttujan luokissa. Jos haluamme selittää iän avulla jotakin ilmiötä, meidän tulee tarkastella tämän ilmiön prosenttijakaumia eri ikäryhmien sisällä. Jos taas selitämme kansallisuudella jotakin on prosentit laskettava kansallisuusryhmittäin.

Jussi Melkas


Päivitetty 16.2.2003

Lisätietoja:
sähköposti: tietoaika@tilastokeskus.fi