Julkaistu: 15.5.2002

Taulukko on täynnä tietoa

Taulukko on tilaston perusosa. Taulukko saa kuitenkin monet ymmälleen. Se johtuu siitä että taulukkoon on pakattu niin paljon tietoa. Jo suhteellisen yksinkertainenkin taulukko tuottaa tekstiksi kirjoitettuna enemmän kuin nuo kuuluisat 1 000 sanaa.

Taulukko vaatii sekä laatijaltaan että lukijaltaan paljon. Taulukko vaatii aina tulkitsijaltaan abstraktiokykyä ja matematiikan perustaidot. Laatijan taas on osattava työskennellä johdonmukaisesti ja havainnollisuutta kunnioittaen.

Tilastojulkaisujen taulukot voi luokitella kahteen päätyyppiin. On taulukoita jotka pyrkivät osoittamaan olennaisuuksia, kokoamaan yhteen tai löytämään riippuvuuksia. Toisaalta on taulukoita, jotka pyrkivät esittämään aineiston rakenteellisesti kuvattuna. Ensin mainitut taulukot ovat kooltaan suppeita ja ne esitetään yleensä tekstin yhteydessä. Nämä taulukot ovat ajattelutavaltaan lähellä tilastografiikkaa ja niiden laatua arviotaessa voi soveltaa monia samoja kriteerejä kuin tilastografiikassa. Viime mainitut ovat yleensä julkaisun liitteenä. Erilaiset vuosikirjat koostuvat lähes pelkästään viimeksi mainitun tyyppisistä taulukoista. Vuosikirjojen taulukoissa taulukkoa joudutaan kuitenkin tiivistämään niin paljon kuin mahdollista.

Tekstitaulukko ei saa olla liian laaja

Tekstin yhteydessä esitettyjen taulukoiden yleisin ongelma on se, että ne ovat liian laajoja. Mitään absoluuttista kokorajaa tekstitaulukoille ei kannata antaa, mutta yli 30 luvun taulukot tekstin yhteydessä ovat kovin laajoja niin typografian kuin havainnollisuudenkin kannalta. Tekstitaulukon maksimikokoa tulee arvioida myös painotekniikan kannalta: taulukon ja siihen liittyvän tekstin osan tulisi mahtua samalle sivulle tai ainakin samalle aukeamalle.

Taulukko on yhdistelyä ja luokittelua. Taulukossa havaintoaineisto on esitetään tärkeiksi katsottujen muuttujien mukaan luokiteltuna. Taulukkoon on yleensä koottu useita muuttujia sen mukaan, mitä taulukon laatija on pitänyt tärkeänä. Taulukkoon kootuilla muuttujilla tulee olla jokin keskinäinen yhteys, joka ei ole itsestään selvä (triviaali).

Luokittelun ristiriitaiset vaatimukset

Luokittelu tulee valita niin, että se on asian ja käyttäjän kannalta tarkoituksenmukainen. Tarkoituksenmukaisuus käyttäjän kannalta merkitsee sitä, että luokittelu toimii myös erilaisissa käyttötarkoituksissa. Luonnollisesti tämä vaatimus pätee vahvemmin aineiston esittelytaulukoihin, joissa voidaan käyttää kohtuullisen yksityiskohtaisia luokituksia. Asian kannalta luokitus on tarkoituksenmukainen, jos aineisto jakautuu eri luokkiin riittävän tasaisesti ja jos käytetään sellaisia luokkia, joita on käytetty muissakin tilastoissa ja tutkimuksissa, esimerkiksi Tilastokeskuksen laatimia standardiluokituksia. Nämä vaatimukset ovat usein ristiriidassa, joka taulukon laatijan on osattava ratkaista.

Taulukon muuttujat eivät saa olla satunnaisesti valittuja. Kun muuttujat kootaan samaan taulukkoon on taustalla aina ajatus, että niillä on jokin yhteys. Ei ole järkeä taulukoida esimerkiksi siviilisäätyä ja koulutusalaa ristiin ellei tavoitteena ole osoittaa että eri alojen ihmisten perhesuhteet eroavat toisistaan. Toisaalta yhteys ei saa olla liian vahvakaan. Jos sukupuolijakauma ja synnytysten lukumäärä laitetaan samaan taulukkoon on tuloksena taulukko, jossa puolet soluista on tyhjiä.

Prosenttilasku on aina vaikeata

Oma ongelmansa taulukoissa on prosenttilasku. Prosenttiluvut ovat sinänsä tärkeä elementti taulukon luettavuuden kannalta - juuri niiden avulla saadaan eri kokoiset ryhmät vertailukelpoisiksi. Prosenttilukujen yhteydessä tulee aina esittää prosenttien kantaluku, siis se luku josta prosenttiosuudet on laskettu.

Myös prosenttilaskun suunnan valinta on usein vaikeaa. Prosentit tulee laskea käyttämällä ns. selittävän muuttujan luokkia kantalukuina. Jos haluamme osoittaa, että ikä vaikuttaa asenteisiin, meidän tulee laskea asenteiden prosenttijakauma kussakin ikäryhmässä erikseen.

Taulukon luettavuuden kannalta on tärkeää myös otsikoida taulukko oikein. Taulukko tulee voida ymmärtää, vaikkei ympäröivää tekstiä olisikaan lukenut.

Ehrenbergin ohjeet

Varsinkin tekstitaulukoiden havainnollistamiseen antavat seuraavat A.S.C. Ehrenbergiin artikkeliin (The Problem of Numeracy, The American Statistician, May 1981, Vol. 35, No 2) pohjautuvat ohjeet apua:

  • pyöristä kahteen merkitsevään numeroon
  • tee sanallinen yhteenveto (esimerkiksi kuvatekstin tapaan taulukon alle)
  • esitä rivien ja sarakkeiden keskiarvot ja summat, kun se on loogista ja helpottaa vertaamista
  • asettele muuttujat niin, että vertailu on mahdollista suorittaa riveillä sarakkeittain (vaakasuoraan)
  • järjestä rivit ja sarakkeet suuruusjärjestykseen kuvattavan asian suhteen, jos se ole ristiriidassa muuttujien logiikan kanssa
  • älä tunge taulukkoa liian pieneen tilaan

Jussi Melkas


Päivitetty 15.5.2002

Lisätietoja:
sähköposti: tietoaika@tilastokeskus.fi