Tietoaineistojen laatukriteerit

Laatukriteerien avulla voidaan kuvata ja arvioida tietoaineistojen laatua. Ne auttavat myös käyttäjää arvioimaan, onko tietoaineisto tarpeeksi laadukasta aiottuun käyttötarkoitukseen. Pidemmällä tähtäimellä laatukriteerit tukevat tietoaineistojen ja tietovarantojen laadun parannuksessa. Kriteerit ovat ensimmäinen ja merkittävin osa TiHA-hankkeen yhteydessä kehitettävää Tiedon laatukehikkoa.

11 tiedon laatukriteeriä kolmessa ryhmässä. Virheettömyys, tarkkuus, kattavuus, ajantasaisuus, johdonmukaisuus. Alkuperäisyys, metatietojen ymmärrettävyys, suositustenmukaisuus. Koneluettavuus, käyttöoikeudet, Oikea-aikaisuus

Tiedon laatukriteerit lanseerattu

Tiedon laatukehikko -hankkeen tuottama tiedon laatukriteerien ja mittariston suositusehdotus lanseerattiin Miten tunnistat tiedon laadun? -webinaarissa 10.3.2022. Lanseeratun suositusehdotuksen työstö varsinaiseksi julkisen hallinnon suositukseksi jatkuu, mutta tiedon laadun tarkastelun näkökulmat on nyt tunnistettu. 

Yhteistyöverkosto edistämään laatukriteerien käyttöönottoa

Tiedon laatukriteerien lanseeraustilaisuudessa avattiin mahdollisuus ilmoittautua mukaan laatukriteerien käyttöönottoa edistävään yhteistyötoimintaan. Lue lisää verkostosta ja ilmoittaudu mukaan.

Tutustu tiedon laadun merkitykseen ja määrittelyyn eOppiva-kurssilla

Tiedon laatukehikon käyttöönottoa edistämään on tuotettu eOppiva-kurssi, joka kuuluu Tiedon äärellä – tehoa tiedon käyttöön -koulutuskokonaisuuteen, joka sisältää hyödyllistä materiaalia tiedon avaamisen tueksi:

Tiedon laatuun keskittyvän koulutuksen suoritettuasi tunnet laadun määrittelevät eri näkökulmat ja saat ohjeita laatuarvioinnin aloittamiseksi. Kurssin syventävän tehtävän kautta voit tutustua laatukriteerien lisäksi konkreettisesti laadun mittaamiseen.

Laatukriteerien kehittäminen

Tietoaineistojen laatukriteerejä on työstetty hyödynnettäväksi koko julkishallinnon käyttöön.

Laatukriteerejä on kehitetty yhteistyössä Laatukehikko-hankkeen osallistujien kanssa. Alustaviin kriteereihin kerättiin palautetta helmikuussa 2021 avoimella kommentointikierroksella, kevätkauden 2021 pilotoinnilla ja erilaisissa tilaisuuksissa. Kevään pilotointikierroksella luotiin myös laatukriteerien mittaristoluonnos. 

Tiedon laatukriteerit ja mittaristo -kokonaisuuden lausuntokierros toteutettiin syys–lokakuussa lausuntopalvelu.fi:n kautta. Tämän lisäksi mittariston toimivuutta testattiin käytännössä pilotoinnin kautta lokakuun aikana.

Lausuntoyhteenveto (pdf) julkaistiin 22.11.2021.

Vuoden 2022 alussa laatukriteerejä ja mittaristoa muokattiin lausunnoista ja pilotoinnin kautta nousseiden muutosehdotusten pohjalta. Muutokset painottuivat konkretian ja esimerkkien lisäämiseen sekä pilotoinnin tuomien käytännön kokemusten perusteella tehtyyn mittariston täsmennykseen. 

Ehdotus tietoaineistojen laatukriteereiksi

Laatukriteerit on tarkoitettu joustavaksi työkaluksi; kaikki kriteerit tai varsinkaan mittarit eivät välttämättä ole merkityksellisiä kaikissa tilanteissa tai tietoaineistoissa. Lisäksi on hyvä huomata, että käyttötarkoitus määrittää sen, millaista tasoa laatukriteerin kuvaaman laadun osalta tavoitellaan.

Laatukriteerit mittareineen muodostavat hierarkkisen rakenteen, mutta laatukriteerit ja mittarit vaikuttavat ja linkittyvät paljon toisiinsa. Laadun parannus jonkin laatukriteerin suhteen voi jopa heikentää toisen laatukriteerin avulla kuvattua tiedon laatua, esimerkiksi jos tavoitellaan tietoaineiston täydellistä kattavuutta tai ominaisuustietojen erityisen hyvää tarkkuutta niin tiedon ajantasaisuus yleensä heikkenee.
Laatukriteerit, ja erityisesti näiden mittarit, kohdistuvat rakenteiseen dataan.

Tietoaineistojen laatukriteerit ja mittarit (ehdotus suositukseksi) on kuvattu oheisessa tiedostossa. Alla on myös tiivistelmä sisällöstä. 

Tiivistelmä tietoaineistojen laatukriteerien luonnoksesta 

Tietoaineistojen laatukriteerit on järjestetty tiedonkäyttäjän näkökulmaa ajatellen kolmen kysymyksen alle: Miten tieto kuvaa todellisuutta? Miten tieto on kuvattu? Miten tietoa voi käyttää?

Miten tieto kuvaa todellisuutta?

Miten tieto kuvaa todellisuutta? -ryhmään kuuluvat virheettömyys, tarkkuus, kattavuus, ajantasaisuus, johdonmukaisuus.

Virheettömyys

Synonyymit: oikeellisuus

Kuvaus: Virheettömyys kuvaa sitä, miten tietoaineiston tiedot vastaavat todellisuutta. Tiedon virheettömyyttä tarkastelemalla voidaan saada kiinni myös systemaattisia vääristymiä tietoaineistossa.

Esimerkit: Se tieto, mikä operatiiviseen päätökseen päätyy, on käytännössä paras käsitys siitä, mikä tieto on oikea. Tieto on oikeellista esimerkiksi tilanteessa, jossa verotuksessa kerrottu palkka on sama kuin todellisuudessa maksettu palkka.

Mittarit: Menetelmällisesti tuotetut arvot, Virheelliset ominaisuusarvot, Väärinluokittelu

Tarkkuus

Synonyymit: harhattomuus

Kuvaus: Tarkkuus kuvaa sitä, miten hyvin tietoaineiston tiedot vastaavat sitä mitä tavoitellaan. Tarkkuus kuvaa sitä, kuinka hyvin tieto osuu oikeaan.

Esimerkit: Esimerkkejä tarkkuudesta ovat mitattujen arvojen hajonta ja tietoaineiston poikkeavien havaintojen osuus sekä lisäksi luokittelun osuvuus ja mittaustaso esim. desimaalit, ajan tai koordinaattien mittaustaso.

Mittarit: Keskihajonta, Poikkeavat havainnot

Kattavuus

Synonyymit: täydellisyys

Kuvaus: Kattavuus kuvaa tietoaineiston tavoitellun ajallisen ja alueellisen kattavuuden sekä tavoitellut kohdeyksiköt ja ominaisuustiedot. Toisaalta kattavuus kertoo miltä osin tietoaineisto sisältää tavoiteltuja tietoja. 

Esimerkit: Tietoaineisto kattaa määritellyn tarkastelualueen yksiköt, esimerkiksi kaikki Suomen yritykset. Alueellinen kattavuus kertoo, ovatko kaikki käsiteltävät alueet mukana, esimerkiksi kaikki Suomen kunnat tai kattaako tietoaineisto Ahvenanmaan. Ylipeitto kertoo, että tietoaineistossa on siihen kuulumattomia yksiköitä. Alipeitto kertoo, että tietoaineistosta puuttuu siihen kuuluvia yksiköitä. Vastuskato on alipeittoa. Toisaalta kattavuus kertoo myös sisältääkö tietoaineisto kaikki määritellyt ominaisuustiedot tietoaineistossa oleville kohdeyksiköille, esimerkiksi tietoaineistossa olevien Suomen kuntien väkiluku- ja pinta-alatiedot tai onko kaikilla yrityksillä tiedossa esimerkiksi osoite- tai liikevaihtotieto.

Mittarit: Ajallinen tavoitekattavuus, Alueellinen tavoitekattavuus, Tavoitekohdeyksiköt, Tavoiteominaisuuksissa puutteita, Puuttuvat kohdeyksiköt, Ylimääräiset kohdeyksiköt, Puutteelliset kohdeyksiköt, Puutteelliset ominaisuustiedot

Ajantasaisuus

Kuvaus: Ajantasaisuus kuvaa tietoaineiston tietojen aikaulottuvuutta. Ajantasaisuus on sitä parempi mitä lähempänä tiedon viiteajankohta on nykyhetkeä. Viiteajankohta on se ajankohta, jota tieto koskee.

Esimerkit: Tietoaineiston tietoon liittyvä viiteajankohta on kerrottu tiedon yhteydessä. Sen avulla pystytään päättelemään tiedon tuoreus. Viiteajankohta voi olla esimerkiksi vuoden alun ja lopun välinen aika tai yhden tietyn päivän tilanne. Tiedon tuotannossa tarkastellaan erilaisia tiedon tarkastus- ja muutosajankohtia.

Mittarit: Viiteajankohta, Luontiajankohta, Tarkistusajankohta, Muutosajankohta

Johdonmukaisuus

Synonyymit: säännönmukaisuus, tiedon looginen eheys

Kuvaus: Johdonmukaisuus kertoo siitä, että tietoaineisto on yhtenäinen ja ristiriidaton. Johdonmukaisuudella voidaan kuvata myös eri tietoaineistojen keskinäistä johdonmukaisuutta.

Esimerkit: Esimerkiksi seuraavat tilanteet eivät ole johdonmukaisia: asuinrakennuksella ei ole yhtään asuntoa tai henkilön avioliiton solmimispäivä on aikaisempi kuin syntymäpäivä. Johdonmukaisuutta voidaan tarkistaa tarkistussäännöillä/laatusäännöillä.

Mittarit: Tieto loogisuustarkastettu

Miten tieto on kuvattu?

Miten tieto on kuvattu? -ryhmään kuuluvat jäljitettävyys, metatietojen ymmärrettävyys, suositustenmukaisuus.

Alkuperäisyys

Synonyymit: jäljitettävyys, kiistämättömyys

Kuvaus: Alkuperäisyys kertoo siitä, että tietoaineistoon ja sen tietoihin tehdyt muutokset voidaan jäljittää. Tiedon alkuperä tunnetaan.

Esimerkit: Tiedon alkuperä ja muutostapahtumat on kuvattu, muutosten aikaleimat ovat saatavilla. Tieto voidaan todistaa kiistämättömäksi, tietoaineiston tiedot voidaan todentaa uudelleen.

Mittarit: Tietolähde, Tiedon elinkaari, Muutosten hallinta

Metatietojen ymmärrettävyys

Synonyymit: tulkittavuus, käsitettävyys

Kuvaus: Metatietojen ymmärrettävyys kuvaa sitä, miten kattavasti tietoaineistolla on sellaisia metatietoja, jotka auttavat tiedon ymmärtämisessä sitä käytettäessä.

Esimerkit: Tietoaineisto ja sen ominaisuustiedot on kuvattu metatietokuvauksessa riittävällä tasolla siten, että tietosisällön ja merkityksen ymmärtäminen helpottuu. Ominaisuustiedoissa käytetyt koodistot on kirjattu ja ne ovat datan kanssa yhteneväiset. Koodistojen kuvaukset ovat saatavilla esimerkiksi linkkien kautta. Olennaiset käsitteet on kuvattu ja linkit tarpeellisiin sanastoihin on liitetty metatietokuvauksiin. 

Mittarit: Aineistokuvaus, Käsitteiden määritelmät, Ominaisuuksien tietokuvaukset, Ymmärrettävyyden asiakaspalaute

Suositustenmukaisuus

Synonyymit: yhteensopivuus, semanttinen yhdenmukaisuus, yhdenmukaisuus

Kuvaus: Suositustenmukaisuus kertoo siitä, että tietoaineisto ja sen ominaisuustiedot noudattavat tunnettuja standardeja, käytäntöjä ja säädöksiä ja ne on kerrottu tietoaineiston yhteydessä.

Esimerkit: Kansallista yhdenmukaisuutta tukee muun muassa yhtenäisten kansallisten sanastojen ja koodistojen käyttö tietoaineistojen tietoja suunniteltaessa. Kansainvälistä yhdenmukaisuutta tukevat esimerkiksi EU:n vahvistamat standardiluokitukset ja ISO-kielikoodisto.

Mittarit: Noudatettavat säädökset ja standardit

Miten tietoa voi käyttää?

Miten tietoa voi käyttää? -ryhmään kuuluvat koneluettavuus, käyttöoikeudet, oikea-aikaisuus.

Koneluettavuus

Kuvaus: Koneluettavuus kuvaa, onko tietoaineisto rakenteistettu siten, että sitä voidaan käsitellä koneellisesti ja käsittely on mahdollista eri tietojärjestelmissä.

Esimerkit: Tietoaineisto on rakenteisessa formaatissa, esim. csv, json, xml. Tietoaineiston rakenne on kuvattu, esim. skeema.

Mittarit: Tietoaineiston tietomalli, Kohdeyksikön pysyvä tunniste, Koneluettavuuden asiakaspalaute

Käyttöoikeudet

Kuvaus: Käyttöoikeudet kuvaa sitä, miten tietoaineiston käyttöoikeus on määritelty ja mitä aineistolla voi tehdä eli mihin käyttötarkoituksiin tietoaineistoa voi hyödyntää. 

Esimerkit: Esimerkiksi tietoaineisto on tietyin rajoituksin käytettävissä tieteelliseen tutkimukseen. Avoin data on lisensoitu.

Mittarit: Käyttöoikeus, Käytön rajoitukset

Oikea-aikaisuus

Synonyymit: täsmällisyys

Kuvaus: Täsmällisyys tarkoittaa sitä, että tietoaineisto on käytettävissä ilmoitettuna ajankohtana ja riittävän tiheästi tietoaineistossa tapahtuviin muutoksiin nähden.

Esimerkit: Tietojen julkistamisaika ja julkistamistiheys on ilmoitettu. Julkistamisaikataulujen muutoksista kerrotaan etukäteen.

Mittarit: Määräpäivien noudattaminen, Päivitystiheys, Päivityksessä muuttuneet ominaisuustiedot

Kysy lisätietoja

Yleiset tiedustelut: tiedonlaatu@stat.fi

Mervi Haakana
Laatukehikko, projektipäällikkö
mervi.haakana@stat.fi

Janika Tarkoma
Tiedon laatukehikko, mittariston pääsuunnittelija
janika.tarkoma@stat.fi