Tietoaineistojen laatukriteerit

Laatukriteerien avulla voidaan kuvata ja arvioida tietoaineistojen laatua. Ne auttavat myös käyttäjää arvioimaan, onko tietoaineisto tarpeeksi laadukasta aiottuun käyttötarkoitukseen. Pidemmällä tähtäimellä laatukriteerit tukevat tietoaineistojen ja tietovarantojen laadun parannuksessa. Kriteerit ovat ensimmäinen ja merkittävin osa TiHA-hankkeen yhteydessä kehitettävää Tiedon laatukehikkoa.

11 tiedon laatukriteeriä neljässä ryhmässä. Oikeellisuus, tarkkuus, ajantasaisuus, johdonmukaisuus. Kattavuus, täydellisyys. Ymmärrettävyys, suositustenmukaisuus. Jäljitettävyys, koneluettavuus, oikea-aikaisuus.

Laatukriteerien kehittäminen

Tietoaineistojen laatukriteerejä työstetään koko julkishallinnon käyttöön. Tavoitteena on julkaista niitä koskeva julkisen hallinnon suositus vuoden 2021 lopulla.

Laatukriteerejä on kehitetty yhteistyössä Laatukehikko-hankkeen osallistujien kesken. Alustaviin kriteereihin kerättiin palautetta helmikuussa 2021 avoimella kommentointikierroksella, kevätkauden 2021 pilotoinnilla ja erilaisissa tilaisuuksissa. Kevään pilotointikierroksella luotiin myös laatukriteerien mittaristoluonnos. 

Tiedon laatukriteerit ja mittaristo -kokonaisuuden lausuntokierros toteutettiin syys–lokakuussa lausuntopalvelu.fi:n kautta. Tämän lisäksi mittariston toimivuutta on testattu käytännössä pilotoinnin kautta lokakuun aikana. Kiitoksia kaikille lausujille ja pilotoijille!

Lausuntoyhteenveto (pdf) on julkaistu 22.11.2021. Lausunnoista ja pilotoinnin kautta nousseet muutostarpeet tullaan huomioimaan suosituksessa.

Lausuntoyhteenveto on koottu syys–lokakuun lausuntokierroksen lausunnoista.

Tietoaineistojen laatukriteerien luonnos

Laatukriteerit on tarkoitettu joustavaksi työkaluksi; kaikki kriteerit tai varsinkaan mittarit eivät välttämättä ole merkityksellisiä kaikissa tilanteissa tai tietoaineistoissa. Lisäksi on hyvä huomata, että käyttötarkoitus määrittää sen, millaista tasoa laatukriteerin kuvaaman laadun osalta tavoitellaan.

Laatukriteerit mittareineen muodostavat hierarkkisen rakenteen, mutta laatukriteerit ja mittarit vaikuttavat ja linkittyvät paljon toisiinsa. Laadun parannus jonkin laatukriteerin suhteen voi jopa heikentää toisen laatukriteerin avulla kuvattua tiedon laatua, esimerkiksi jos tavoitellaan tietoaineiston täydellistä kattavuutta tai ominaisuustietojen erityisen hyvää tarkkuutta niin tiedon ajantasaisuus yleensä heikkenee.
Laatukriteerit, ja erityisesti näiden mittarit, kohdistuvat rakenteiseen dataan.

Tietoaineistojen laatukriteerit ja mittarit (luonnos) on kuvattu oheisessa tiedostossa. Alla on myös tiivistelmä sisällöstä. 

Tiivistelmä tietoaineistojen laatukriteerien luonnoksesta 

Tietoaineistojen laatukriteerit on järjestetty tiedonkäyttäjän näkökulmaa ajatellen neljän kysymyksen alle: Mitä tieto koskee? Miten tieto kuvaa todellisuutta? Miten hyvin tieto on kuvattu? Miten tietoa voi käyttää?

Mitä tieto koskee?

 

Mitä tieto koskee? -ryhmään kuuluvat Kattavuus ja Jäljitettävyys.

Kattavuus

Synonyymit: täydellisyys

Kuvaus: Kattavuus kuvaa tietoaineiston tavoitellun ajallisen ja alueellisen kattavuuden sekä tavoitellut kohdeyksiköt ja ominaisuustiedot. Toisaalta kattavuus kertoo miltä osin tietoaineisto sisältää tavoiteltuja tietoja. 

Esimerkit: Tietoaineisto kattaa määritellyn tarkastelualueen yksiköt, esimerkiksi kaikki Suomen yritykset. Alueellinen kattavuus kertoo, ovatko kaikki käsiteltävät alueet mukana, esimerkiksi kaikki Suomen kunnat tai kattaako tietoaineisto Ahvenanmaan. Ylipeitto kertoo, että tietoaineistossa on siihen kuulumattomia yksiköitä. Alipeitto kertoo, että tietoaineistosta puuttuu siihen kuuluvia yksiköitä. Vastuskato on alipeittoa. Toisaalta kattavuus kertoo myös sisältääkö tietoaineisto kaikki määritellyt ominaisuustiedot tietoaineistossa oleville kohdeyksiköille, esimerkiksi tietoaineistossa olevien Suomen kuntien väkiluku- ja pinta-alatiedot tai onko kaikilla yrityksillä tiedossa esimerkiksi osoite- tai liikevaihtotieto.

Mittarit: Ajallinen tavoitekattavuus, Alueellinen tavoitekattavuus, Tavoitekohdeyksiköt, Tavoiteominaisuudet, Puuttuvat kohdeyksiköt, Ylimääräiset kohdeyksiköt, Puutteelliset kohdeyksiköt, Puutteelliset ominaisuustiedot

Jäljitettävyys

Synonyymit: kiistämättömyys

Kuvaus: Jäljitettävyys kertoo siitä, että tietoaineistoon ja sen tietoihin tehdyt muutokset voidaan jäljittää. Tiedon alkuperä tunnetaan.

Esimerkit: Tiedon alkuperä ja muutostapahtumat on kuvattu, muutosten aikaleimat ovat saatavilla. Tieto voidaan todistaa kiistämättömäksi, tietoaineiston tiedot voidaan todentaa uudelleen.

Mittarit: Tiedon elinkaari, Tietolähde, Muutosten hallinta

Miten tieto kuvaa todellisuutta?

Miten tieto kuvaa todellisuutta? -ryhmään kuuluvat Ajantasaisuus, Oikeellisuus, Tarkkuus ja Johdonmukaisuus
Ajantasaisuus

Kuvaus: Ajantasaisuus kuvaa tietoaineiston tietojen aikaulottuvuutta. Ajantasaisuus on sitä parempi mitä lähempänä tiedon viiteajankohta on nykyhetkeä. Viiteajankohta on se ajankohta, jota tieto koskee.

Esimerkit: Tietoaineiston tietoon liittyvä viiteajankohta on kerrottu tiedon yhteydessä. Sen avulla pystytään päättelemään tiedon tuoreus. Viiteajankohta voi olla esimerkiksi vuoden alun ja lopun välinen aika tai yhden tietyn päivän tilanne. Tiedon tuotannossa tarkastellaan erilaisia tiedon tarkastus- ja muutosajankohtia.

Mittarit: Viiteajankohta, Luontiajankohta, Tarkistusajankohta, Muutosajankohta, Tiedon muokkaaminen päättynyt

Johdonmukaisuus

Synonyymit: säännönmukaisuus, tiedon looginen eheys

Kuvaus: Johdonmukaisuus kertoo siitä, että tietoaineisto on yhtenäinen ja ristiriidaton. Johdonmukaisuudella voidaan kuvata myös eri tietoaineistojen keskinäistä johdonmukaisuutta.

Esimerkit: Esimerkiksi seuraavat tilanteet eivät ole johdonmukaisia: asuinrakennuksella ei ole yhtään asuntoa tai henkilön avioliiton solmimispäivä on aikaisempi kuin syntymäpäivä. Johdonmukaisuutta voidaan tarkistaa tarkistussäännöillä/laatusäännöillä.

Mittarit: Tieto loogisuustarkastettu

Oikeellisuus

Synonyymit: virheettömyys

Kuvaus: Oikeellisuus kuvaa sitä, miten tietoaineiston tiedot vastaavat todellisuutta. Tiedon oikeellisuutta tarkastelemalla voidaan saada kiinni myös systemaattisia vääristymiä tietoaineistossa.

Esimerkit: Se tieto, mikä operatiiviseen päätökseen päätyy, on käytännössä paras käsitys siitä, mikä tieto on oikea. Tieto on oikeellista esimerkiksi tilanteessa, jossa verotuksessa kerrottu palkka on sama kuin todellisuudessa maksettu palkka.

Mittarit: Menetelmällisesti tuotetut arvot, Virheelliset ominaisuusarvot, Väärinluokittelu

Tarkkuus

Synonyymit: harhattomuus

Kuvaus: Tarkkuus kuvaa sitä, miten hyvin tietoaineiston tiedot vastaavat sitä mitä tavoitellaan. Tarkkuus kuvaa sitä, kuinka hyvin tieto osuu oikeaan.

Esimerkit: Esimerkkejä tarkkuudesta ovat mitattujen arvojen hajonta ja tietoaineiston poikkeavien havaintojen osuus sekä lisäksi luokittelun osuvuus ja mittaustaso esim. desimaalit, ajan tai koordinaattien mittaustaso.

Mittarit: Hajonta, Poikkeavat havainnot

Miten hyvin tieto on kuvattu?

Miten hyvin tieto on kuvattu? -ryhmään kuuluvat Ymmärrettävyys ja Suositustenmukaisuus.
Ymmärrettävyys

Synonyymit: tulkittavuus, käsitettävyys

Kuvaus: Ymmärrettävyys kuvaa sitä, miten kattavasti tietoaineistolla on sellaisia metatietoja, jotka auttavat tiedon ymmärtämisessä sitä käytettäessä.

Esimerkit: Tietoaineisto ja sen ominaisuustiedot on kuvattu metatietokuvauksessa riittävällä tasolla siten, että tietosisällön ja merkityksen ymmärtäminen helpottuu. Ominaisuustiedoissa käytetyt koodistot on kirjattu ja ne ovat datan kanssa yhteneväiset. Koodistojen kuvaukset ovat saatavilla esimerkiksi linkkien kautta. Olennaiset käsitteet on kuvattu ja linkit tarpeellisiin sanastoihin on liitetty metatietokuvauksiin. 

Mittarit: Aineistokuvaus, Käsitteiden määritelmät, Ominaisuuksien tietokuvaukset, Ymmärrettävyyden asiakaspalaute

Suositustenmukaisuus

Synonyymit: yhteensopivuus, semanttinen yhteentoimivuus, yhdenmukaisuus

Kuvaus: Suositustenmukaisuus kertoo siitä, että tietoaineisto ja sen ominaisuustiedot noudattavat tunnettuja standardeja, käytäntöjä ja säädöksiä ja ne on kerrottu tietoaineiston yhteydessä.

Esimerkit: Kansallista yhdenmukaisuutta tukee muun muassa yhtenäisten kansallisten sanastojen ja koodistojen käyttö tietoaineistojen tietoja suunniteltaessa. Kansainvälistä yhdenmukaisuutta tukevat esimerkiksi EU:n vahvistamat standardiluokitukset ja ISO-kielikoodisto.

Mittarit: Standardienmukaisuus, Käytetyt standardit

Miten tietoa voi käyttää?

Miten tietoa voi käyttää? -ryhmään kuuluvat Koneluettavuus, Käyttöoikeudet ja Täsmällisyys.
Koneluettavuus

Kuvaus: Koneluettavuus kuvaa, onko tietoaineisto rakenteistettu siten, että sitä voidaan käsitellä koneellisesti ja käsittely on mahdollista eri tietojärjestelmissä.

Esimerkit: Tietoaineisto on rakenteisessa formaatissa, esim. csv, json, xml. Tietoaineiston rakenne on kuvattu, esim. skeema.

Mittarit: Tietoaineiston tietomalli, Kohdeyksikön pysyvä tunniste, Koneluettavuuden asiakaspalaute

Täsmällisyys

Synonyymit: oikea-aikaisuus

Kuvaus: Täsmällisyys tarkoittaa sitä, että tietoaineisto on käytettävissä ilmoitettuna ajankohtana ja riittävän tiheästi tietoaineistossa tapahtuviin muutoksiin nähden.

Esimerkit: Tietojen julkistamisaika ja julkistamistiheys on ilmoitettu. Julkistamisaikataulujen muutoksista kerrotaan etukäteen.

Mittarit: Määräpäivien noudattaminen, Päivitystiheys, Päivityksessä muuttuneet ominaisuustiedot

Käyttöoikeudet

Kuvaus: Käyttöoikeudet kuvaa sitä, miten tietoaineiston käyttöoikeus on määritelty ja mitä aineistolla voi tehdä eli mihin käyttötarkoituksiin tietoaineistoa voi hyödyntää. 

Esimerkit: Esimerkiksi tietoaineisto on tietyin rajoituksin käytettävissä tieteelliseen tutkimukseen. Avoin data on lisensoitu.

Mittarit: Käyttöoikeus, Käytön rajoitukset


Taustatietoja

Taustatietoja tietoaineistojen laatukriteereistä saat oheisista tiedostoista:

Kysy lisätietoja

Essi Kaukonen
Tiedon laatukehikko, projektipäällikkö
essi.kaukonen@stat.fi

Janika Tarkoma
Tiedon laatukehikko, mittariston pääsuunnittelija
janika.tarkoma@stat.fi