Julkaistu: 25.11.2004

Pienimmän neliösumman menetelmä I
Miten Tornionjokilaakso liittyy tilastotieteen historiaan

Vuonna 1671 Pariisin tiedeakatemia lähetti astronomiryhmän Cayenne-saarelle Etelä-Amerikassa. Ryhmän johtajalla Jean Richerillä oli heilurikello matkassaan. Hämmästyksekseen hän huomasi, että kello jätätti kaksi ja puoli minuuttia päivässä. Hän ei keksinyt ilmiölle syytä, mutta 15 vuotta myöhemmin Isaac Newton kertoi sen. Gravitaatio on Cayenne-saarilla erilainen kuin Pariisissa, ja tämä ero vaikuttaa heilurin liikenopeuteen. Tästä seuraa, ettei maa voi olla aivan pallon muotoinen, jos painovoima kohdistuu kohden maan keskustaa. Newton laski, että maapallon litistyneisyys napojen kohdalla oli 1/230 ympyrän kaaresta.

Myöhemmin tämän ilmiön selvittämiseksi tehtiin paljon mittauksia, muun muassa vuonna 1735 Ranskan akatemia lähetti tutkimusretken Peruun lähelle päiväntasaajaa ja Tornionjokilaaksoon pohjoiselle napapiirille sekä Hyväntoivonniemelle. Tornionjokilaaksoon lähetettiin Pierre Louis Moreau de Maupertuis, joka teki siellä mittauksia vuosina 1736-1737. Mittausvälineenä oli ns. kvadrantti, millä tehtiin maantieteellisen leveysasteen määrityksiä. Tornion pituusaste määritettiin Upsalaan nähden. Torniota käytettiin sitten lähtöpisteenä muille pituusasteen määrityksille, joita tehtiin Ruotsin itäosissa ja Suomessa. (Lisätietoja de Maupertuis'n retkestä löytyy nettisivuilta http://www.rovaniemi.fi/lapinkavijat/maupertuis/maapallomuoto.html sekä http://www.rovaniemi.fi/lapinkavijat/maupertuis/mittauspaikat.html.)

Vuonna 1755 englantilainen jesuiitta Christopher Maire ja dalmatialainen jesuiitta Roger Boscovich suorittivat mittauksia Rooman läheisyydessä. Myöhemmin Boscovich tutki viidessä eri paikassa tehtyjä mittauksia. Näistä muodostui kymmenen paria, ja hän rakensi yhtälön kullekin. Kukin yhtälö kuvasi kahden paikan välisen pinnan kaarevuutta ja poikkeamaa ympyrän kaarevuudesta.

Miten tämä kaikki liittyy tilastotieteeseen? Boscovich lähti etsimään vastausta kysymykseen, joka oli jo monet kerrat tullut vastaan niin astronomeille kuin geodeetikoille. Oli runsaasti mittaustuloksia, mutta ratkaisematta oli kysymys: "Miten näitä mittaustuloksia pitäisi hyödyntää, jotta saataisiin todennäköisimmin oikea ratkaisu tuloksista, jotka on saatu hyvin eritasoisista mittauslaitteista ja eri aikoina".

Mittaustuloksia Boscovichilla ei tosin ollut niin paljon kuin astronomeilla oli käytettävissään. Ongelma kuitenkin oli sama, ja sitä hän lähti ratkaisemaan kokoamalla mittaustulokset eri paikkakunnilta yhteen niin, että saataisiin maapallon napojen litistyneisyydelle keskimääräinen mahdollisimman oikea tulos, joka minimoisi eri mittaustuloksiin liittyvän mittausvirheen.

Boscovich rakensi eri paikkakunnilla tehdyistä mittaustuloksista viiden yhtälön ryhmän. Kuhunkin yhtälöön sisältyi kahden muuttujan arvo sekä kaksi tuntematonta parametriä. Kaksi muuttujaa olivat kahden paikkakunnan välisen kaaren pituus sekä tämän kaaren keskipisteessä sijaitsevan leveysasteen asteluku. Menetelmää, jota hän käytti, kutsutaan "pienimmän absoluuttisen poikkeaman" (least absolute deviation) menetelmäksi. Boscovichilla oli siis viisi yhtälöä, jotka yksinkertaistaen voidaan esittää muodossa

mikä suuresti muistuttaa regressiomallia, missä olemassa olevat mittaustulokset ovat y ja x. Saadakseen laskettua keskimääräinen litistyneisyyden Boscovichin oli yhtälöistä ratkaistava tuntemattomat parametrit a ja b. Laskemalla ensin keskiarvot x:lle ja y:lle hän sai näiden mittaustuloksena syntyneiden havaintojen pisteparven keskikohdan, josta geometrisesti edeten hän sai ratkaistua arvon b:lle, siten että poikkeamien itseisarvojen summa

oli mahdollisimman pieni. Monien suuritöisten operaatioiden jälkeen hän sai litistyneisyydelle luvun 1/255, joka osoitti pienempää poikkeamaa ympyrästä kuin mitä Isaac Newton oli laskenut aikaisemmin. Todellisuudessa, viimeaikaisiin mittauksiin perustuen, ero ympyrän kaaresta on vielä pienempi kuin mihin Boscovich oli päätynyt.

Menetelmä, jota Boscovich käytti, oli pitkä askel kohti pienimmän neliösumman menetelmää. Neliöimällä poikkeamat saatiin nimittäin myöhemmin menetelmä, joka nykyisillä tietokoneilla on helppo suorittaa. Lisäksi näin saaduilla tuloksilla on hyviä ominaisuuksia, joita ei saada itseisarvoja käyttämällä. Gauss käytti ilmeisesti ensimmäisenä tällaista neliöintiä vuonna 1795. Hänestä riippumatta Legendre julkaisi ensimmäisenä menetelmän vuonna 1809. Siitä lähtien menetelmä on ollut tärkeä väline astronomien ja geodeetikkojen keskuudessa. 1900-luvun puolella menetelmä tuotiin yhteiskuntatieteisiin ja on tänäkin päivänä tärkein väline, kun kaoottiselta näyttävään kahden tai useamman muuttujan arvoista muodostuvaan pisteparveen halutaan järjestystä. Pienimmän neliösuman menetelmällä estimoidaan kertoimet, jotka antavat pisteparven läpi kulkevan suoran, joka kertoo, miten mallissa oleva selitettävä muuttuja (y) ja selittävät muuttujat (x) riippuvat toisistaan.

Ismo Teikari


Päivitetty 25.11.2004