Julkaistu: 28.1.2005

Sattumapeleistä keskiarvoihmiseen

Matemaattisen tilastotieteen historia ennen 1800-lukua oli todennäköisyyslaskennan ja normaalikäyrän historiaa. Normaalikäyrä oli syntynyt binomijakauman rajatapauksena. Sattumapelien tulokset noudattivat binomijakaumaa ja todennäköisyyslaskennan esihistoria oli sattumapelien matematiikkaa. Kukin peli oli satunnaiskoe, joka voi tuottaa joko suotuisan tai epäsuotuisan tuloksen. Kun kokeiden määrä oli tarpeeksi suuri, suotuisten tapausten jakauma alkoi noudattaa normaalijakaumaa. Normaalikäyrä siis esitti keskiarvotuloksen ympärille kertyvää virhejakaumaa, joka pelivälineen ollessa virheetön oli määrättävissä etukäteen, apriori. Koska tällaisissa symmetrisissä sattumapeleissä tulokset olivat toisistaan riippumattomia, mikä tarkoittaa että saadulla tuloksella ei ollut vaikutusta seuraavaan tulokseen, nämä virheet keskiarvotuloksesta jakautuivat tasaisesti keskiarvon molemmin puolin.

Kun astronomit ja maanmittaajat 1700-luvulla ottivat käyttöön pienimmän neliösumman menetelmän monien samasta ilmiöstä saatujen mittaustulosten yhdistämiseksi, normaalikäyrä tuli esittämään näiden mittaustulosten virhejakaumaa. Koska mittaustulokset olivat toisistaan riippumattomia, oli aivan luontaista käyttää jakaumaa tapaukseen, missä esiintyi mittausvirheitä, jotka jakautuivat normaalisti mittaustulosten keskiarvon ympärille vaikka eivät noudattaneetkaan binomijakaumaa.

Belgialainen matemaatikko Adolphe Quetelet ihastui tähän ilmiöön. Hän näki, että epätäydellisistä yksittäisistä mittauksista syntyi pienimmän neliösumman menetelmää ja normaalikäyrää käyttäen aivan uusi todellisuus, yleinen elementti, joka oli paras mahdollinen aproksimaatio yksittäisille virheellisille mittaustuloksille. Häneltä ei myöskään jäänyt huomaamatta, että tietyt biologiset ja sosiaaliset ilmiöt näyttivät noudattavan samaa virhekäyrää. Quetelet rakensi ns. keskiarvoihmisen käsitteen, ideaalisen mallin, johon luonto pyrkii päätyen kuitenkin aina enemmän tai vähemmän siitä poikkeavaan lopputulokseen. Sosiaalisessa elämässä vallitsi siis kaksi eri todellisuutta, mikrososiaalinen ja makrososiaalinen. Quetelet alkoi mukautua ajatukseen, että jokaisessa ihmisessä on eräitä yleisiä ominaisuuksia ja täydellisen ihmisen täytyy täydellisesti muistuttaa makrososiaalista ihmistyyppiä. Tästä ajatuksesta syntyi Quetelet'n keskiarvoihminen, joka on oma kokonaisuutensa eikä mikrososiaalisten tekijöiden summa.

Kuten sanottu, Quetelet havaitsi, että astronomien ja geodeetikkojen virhekäyrä näytti soveltuvan myös inhimillisten ominaisuuksien jakauman kuvaajaksi. Se voima, mikä pienimmän neliösumman menetelmällä ja normaalikäyrällä oli astronomian kehittymiselle, innosti Quetelet'n kuuluisan keskiarvoihminen käsitteen luomiseen. Vain keskiarvo voi esittää yhteiskunnallista ihannetta politiikan, estetiikan ja moraalin alueilla. Keskiarvo on kuin häränsilmä tikanheitossa. Kaikki poikkeamat siitä ovat pienempiä tai isompia virheitä. Näin normaalikäyrän virhejakauma-ominaisuus toistuu Quetelet'llä - samoin kuin se oli alkuaan DeMoivren binomijakaumaan perustuvassa normaalikäyrässä sekä astronomien ja geodeetikkojen mittavirheitä kuvaavassa normaalikäyrässä.

Quetelet'n työ alkoi siitä, että hän tutki 5 738 skotlantilaisen sotilaan rinnanympäryksen ja 100 000 ranskalaisen asevelvollisen pituuden jakaumaa. Hän teki myös 8 192 pituuden mittausta yhdelle ja samalle henkilölle. Tämä viimeinen kuvastanee astronomien ja geodeetikkojen mittausvirhejakaumaa. Quetelet havaitsi, että sekä sotilaiden rinnanympäryksen että asevelvollisten pituuden jakaumat näyttivät samalta kuin mittausvirheiden jakauma. Tästä hän päätyi oletukseen, että nämä ilmiöt noudattavat virhejakaumaa, normaalikäyrää. Hänen havaintonsa siis perustui sattuman matemaattiseen teoriaan, mutta hän uskoi sen laajemman sovellusalueen liittyvän orgaaniseen luontoon.

Pian Quetelet havaitsi olemassa olevista tilastoista, että sosiaaliset tapahtumat noudattavat tietyssä paikassa ajallisesti tiettyä säännönmukaisuutta. Eräs tällainen säännönmukaisuushan oli keksitty jo 1600-luvulla, kun havaittiin että poikalapsia syntyi säännöllisesti hieman enemmän kuin tyttölapsia. Mainittu säännönmukaisuus noudattaa samanlaista virhejakaumaa kuin biologiset ominaisuudet. On olemassa keskiarvo, napakymppi tai häränsilmä, jonka ympärille tapahtumat, kuten syntymien, avioliittojen ja itsemurhien määrät jakautuivat; poikkeamat joka suuntaan ovat virheitä. Liiallisuus ja puutteellisuus ovat tiettyjen rajojen välissä olevia virheitä, ja yhteiskunnan tulee pienentää näiden rajojen etäisyyttä toisistaan.

Voidaan sanoa, että vaikka matemaattinen tilastotiede varsinaisesti syntyi vasta myöhemmin, niin Quetelet joka tapauksessa kehitti tilastotieteen yleiseksi tutkimusmenetelmäksi, joka soveltuu paitsi sosiaalitieteisiin myös lukuisiin muihin tieteisiin. Itse hän luetteli sovellusalueita kuten: meteorologia, fysiikka, kemia, kasvitiede, maatalous, eläintiede ja humanistiset tieteet. Luonnollisesti hänen sosiaalisessa teoriassaan oli lukuisia heikkouksia, joista mainittakoon se, että hän ei koskaan tarkkaan selittänyt, mitä keskiarvon ylittäminen henkisissä kyvyissä, moraalissa ja terveydessä oikeastaan tarkoitti. Kaikista puutteellisuuksista huolimatta Quetelet'llä on ollut suuri vaikutus paitsi tilastotieteen ja sosiaalitieteiden kehitykseen myös tilastotoimen ja kansainvälisen tilasto-organisaation kehitykseen; mutta näistä jatkossa enemmän.

Ismo Teikari


Päivitetty 28.1.2005