Suomen virallisen tilaston julkaisuohje

Ohjeistus on laadittu Suomen virallisten tilastojen (SVT) tuottajien yhteistyönä, ja Suomen virallisen tilaston neuvottelukunta on hyväksynyt sen 13.2.2023.


Sisällysluettelo

Alkusanat

Suomen virallinen tilasto (SVT) on kokoelma yhteiskuntaa kuvaavia tilastoja. Kokoelmaan kuuluu noin 250 tilastoa, joita tuottaa kaikkiaan 12 organisaatiota. Viralliset tilastot kuvaavat yhteiskuntaa eri näkökulmista ja tarjoavat laadukasta ja luotettavaa tietoa päätöksenteon ja lainvalmistelun tueksi sekä yhteiskunnan kehityksen seurantaan.

Virallisten tilastojen tekijät ovat sitoutuneet tuottamaan tilastot yhdessä sovituin laatukriteerein, jotka perustuvat Euroopan tilastojen käytännesääntöihin. Tilastojen laadun takeena toimivat yhteiset tavat julkaista tilastot avoimesti ennakkoon ilmoitettuna ajankohtana puolueettomasti ja objektiivisesti.

Tämä julkaisuohje ohjaa ja yhtenäistää Suomen virallisten tilastojen julkaisemista. Julkaisuohjetta voidaan soveltaa myös muihin tilastoihin ja tilastojulkaisuihin. Ohjeistus on laadittu Suomen virallisten tilastojen (SVT) tuottajien yhteistyönä, ja Suomen virallisen tilaston neuvottelukunta on sen hyväksynyt kokouksessaan 13.2.2023.

Luvussa 1 käsitellään julkaisutoimintaa ohjaavaa kansainvälistä ja kansallista lainsäädäntöä, ohjeita ja hyviä käytäntöjä. Luvussa 2 kuvataan SVT-sarjojen merkitystä ja sisältöä. Luvuissa 3–6 on tilastojen ja aineistojen julkistamiseen liittyviä ohjeita. Tarkentavia ohjeita annetaan liitteissä.

1 Keskeisiä säädöksiä ja ohjeita

1.1 Tilastojulkaisemisen perusperiaatteet

Keskeiset julkaisutoimintaa koskevat kansainväliset ohjeet perustuvat YK:n tilastotoimen perusperiaatteisiin ja Euroopan tilastojen käytännesääntöihin (Code of Practice, CoP). Käytännesäännöt koskevat tilastoviranomaisten riippumattomuutta ja vastuita sekä prosessien ja julkaistavan tiedon laatua. Käytännesäännöt ovat yhteensopivat YK:n tilastokomission hyväksymien virallisten tilastojen periaatteiden kanssa ja täydentävät niitä. Käytännesäännöt ovat myös yhteensopivat Euroopan laatupalkintoperiaatteiden (EFQM) kanssa.

Tilastoviranomaiset ja muut viranomaiset, jotka laativat Euroopan tilastojärjestelmän mukaisia tilastoja (ESS-tilastoja), noudattavat Euroopan tilastojen käytännesääntöjä ja niitä täydentävää laadunvarmistuskehikkoa (Quality Assurance Framework of the European Statistical System, ESS-QAF).

Euroopan tilastojen käytännesäännöt sisältävät seuraavat julkaisemista koskevat periaatteet:

  • Periaate 6: Puolueettomuus ja objektiivisuus
    Tilastoviranomaiset kehittävät, tuottavat ja jakelevat Euroopan tilastoja tieteellistä riippumattomuutta noudattaen objektiivisella, ammattimaisella ja avoimella tavalla, jossa kaikkia käyttäjiä kohdellaan tasavertaisina.
  • Periaate 13: Oikea-aikaisuus ja täsmällisyys
    Euroopan tilastot julkaistaan oikea-aikaisesti ja täsmällisesti.
  • Periaate 15: Saatavuus ja selkeys
    Euroopan tilastot esitetään selkeässä ja ymmärrettävässä muodossa, julkaistaan sopivalla ja tarkoituksenmukaisella tavalla ja ne sekä niitä tukeva metatieto ja ohjeet ovat tasapuolisesti saatavilla.

Periaatteiden mukaan tilastotiedot on julkaistava samanaikaisesti kaikille käyttäjille. Julkistamispäivät ja -ajat ilmoitetaan etukäteen julkistamiskalenterissa. Tilastoon liittyvät metatiedot, laaturaportit ja ohjeet ovat saatavilla tilaston kotisivulta tilaston tuottajan verkkopalvelussa.

1.2 Lainsäädäntöä

Käytännesääntöjen lisäksi julkaisutoimintaa koskevia velvoitteita on myös EU:n muissa säädöksissä ja kansallisessa lainsäädännössä. Keskeiset vaatimukset sisältyvät saavutettavuusdirektiiviin (EU 2016/2102) ja avoimen datan direktiiviin (EU 2019/1024). Kansallisesti saavutettavuusdirektiivi on toimeenpantu lailla digitaalisten palvelujen tarjoamisesta (306/2019). Laki edellyttää, että viranomaisten tuottamat verkkopalvelut ovat saavutettavia.

Kansainvälisessä WCAG-ohjeistuksessa (Web Content Accessibility Guidelines) määritellään tarkemmin yksityiskohtaiset vaatimukset verkkojulkaisemisen saavutettavuudelle. Tämän ohjeen julkaisuaikaan laki vaati noudattamaan WCAG 2.1 -kriteeristön A- ja AA-tason kriteerejä. Jos kriteeristöstä julkaistaan uusi versio ja se tulee lain mukaan noudatettavaksi, on tilastojulkaisemisessa huomioitava uuden kriteeristön vaatimukset.

Avoimen datan direktiiviin sisältyy tarkempi Euroopan komission täytäntöönpanoasetus arvokkaista tietoaineistoista (EU 2023/138). Asetus määrittää arvokkaisiin tietoaineistoihin kuuluvat tilastoaineistot. Muille tilastoaineistoille vaatimukset ovat lähinnä suosituksia.

Komission täytäntöönpanoasetuksen mukaan arvokkaat tietoaineistot on tarjottava käytettäviksi seuraavasti:

  1. Tietoaineistojen on oltava saatavilla
    • liitteessä mainituin aikavälein (esimerkiksi kuukausittain, neljännesvuosittain, vuosittain),
    • Creative Commons BY 4.0 lisenssin tai vastaavan tai vähemmän rajoittavan avoimen lisenssin ehtojen mukaisesti,
    • CSV-, XML-, SDMX-, JSON-muodossa tai muussa julkisesti dokumentoidussa, unionin tai kansainvälisesti tunnustetussa avoimessa, koneellisesti luettavassa muodossa,
    • ohjelmointirajapinnan (API, Application Programming Interface) kautta tai useampana kerralla ladattavana tiedostona.
  2. Tietoaineistoja kuvaavan metatiedon pitää olla rakenteisessa muodossa ja sisältää vähintään kuvaus tilastotiedoista, tilastollisista käsitteistä, menetelmistä sekä tiedon laadusta.
  3. Tietoaineistot on kuvattava kattavalla ja julkisesti saatavilla olevalla verkkodokumentaatiolla, jossa kuvataan ainakin tietorakenne ja semantiikka.
  4. Tietoaineistoissa on käytettävä unionin tunnustamia tai kansainvälisesti tunnustettuja ja julkisesti dokumentoituja kontrolloituja sanastoja ja taksonomioita, jos sellaisia on saatavilla.

Asetuksessa (3 artikla) määritetään, että arvokkaiden tietoaineistojen tulee olla saatavilla koneellisesti luettavassa muodossa ohjelmointirajapintojen (API) kautta. APIn käyttöehdot ja sen suorituskykyyn, kapasiteettiin ja saatavuuteen liittyvät palvelunlaatukriteerit on kuvattava ja julkaistava APIn yhteydessä.

Käyttöehtojen pitää olla saatavilla ihmisen luettavassa ja koneluettavassa muodossa. Tietoaineistojen metatiedoissa on mainittava, että kyse on arvokkaista tietoaineistoista.

Muita julkaisutoiminnan kannalta relevantteja säädöksiä ovat kielilaki (423/2003), arkistolaki (831/1994) ja tiedonhallintalaki (906/2019). Kielilaki koskee suomen ja ruotsin kieltä. Lain tavoitteena on, että yksilön kielelliset oikeudet toteutetaan ilman, että niihin tarvitsee erikseen vedota. Jokaisella on oikeus käyttää suomea tai ruotsia asioidessaan valtion viranomaisen kanssa. Viranomaisten on otettava huomioon kielilaki myös tilastojen julkaisemisessa (katso luku 6.1).

Arkistolain mukaan arkistonmuodostajan on määrättävä tehtävien hoidon tuloksena kertyvien asiakirjojen säilytysajat ja -tavat sekä ylläpidettävä arkistonmuodostussuunnitelmaa (8 §). Tilastojen painojulkaisut on arkistoitava. Velvoitetta verkkojulkaisujen arkistointiin ei ole, mutta aineiston pitkäaikaissäilytyksellä varmistetaan verkkoaineiston käytettävyys riittävän pitkäksi ajaksi. Opetus- ja kulttuuriministeriössä on valmisteilla hallituksen esitys eduskunnalle arkistolain ja Kansallisarkistosta annetun lain muuttamisesta.

Tiedonhallintalaki (21 §) edellyttää tietoaineistojen säilytystarpeen määrittämistä. Jos tietoaineistojen tai asiakirjojen säilytysaikaa ei ole laissa määritetty, on tiedonhallintayksikön säilytysaikaa määritettäessä otettava huomioon muun muassa tietoaineiston alkuperäisen käyttötarkoituksen mukainen tarpeellisuus viranomaisen toiminnassa. Säilytysajan päättymisen jälkeen tietoaineistot on arkistoitava tai tuhottava.

2 SVT-tilasto- ja julkaisusarjat

Laadukkaille ja jatkuvassa tuotannossa oleville tilastoille ja erillisille tilastojulkaisuille voidaan myöntää laatuleimana Suomen virallisen tilaston status. SVT-statuksen saaneiden tilastojen tilastotietoja julkaistaan SVT-tilastosarjana verkossa (html-sivut, tietokannat, pdf-tiedostot). Erilliset julkaisut (vuosikirjat, kokoomajulkaisut tai vastaavat) julkaistaan SVT-julkaisusarjassa.

Suomen virallisen tilaston neuvottelukunta on hyväksynyt laatukriteerit, jotka Suomen virallisten tilastojen on täytettävä. Kriteerit on yhdenmukaistettu Euroopan tilastojen käytännesääntöjen kanssa. Kriteerien tarkoitus on kehittää ja ylläpitää SVT-tilastojen käytettävyyttä yhteiskunnan tietotarpeisiin.

Suomen viralliseen tilastoon kuuluvan tilaston on täytettävä seuraavat kriteerit:

  • puolueettomuus ja läpinäkyvyys
  • laadun hallinta
  • tietosuoja
  • tehokkuus
  • relevanssi
  • tarkkuus ja luotettavuus
  • ajantasaisuus ja oikea-aikaisuus
  • yhtenäisyys ja vertailukelpoisuus
  • saatavuus ja selkeys.

Tarkemmin kriteerien sisältöä kuvataan Tilastokeskuksen verkkosivulla SVT-laatukriteerit.

2.1 SVT-hakumenettely

SVT-statusta haetaan tilastolle SVT-neuvottelukunnalta. SVT-status voidaan myöntää, kun tilaston tietoja on julkaistu vähintään yhden kerran. Hakemuksessa on kuvattava tilaston tuotantomenetelmä, metatietodokumentaatio sekä se, miten tilaston tuottamisessa on otettu huomioon SVT-laatukriteerit. Lisäksi hakemukseen on liitettävä tilaston laaturaportti. SVT-statuksen hakulomake on saatavilla Tilastokeskuksesta.

Myös erilliselle julkaisulle (vuosikirjat, kokoomajulkaisut tai vastaavat) voidaan hakea SVT-statusta, jos valtaosa julkaisun tilastotiedoista on SVT-tilastoja. SVT-julkaisusarjan julkaisuille on luonteenomaista säännöllinen ilmestyminen. SVT-julkaisusarjassa ei julkaista tutkimusraportteja. Hakumenettely on samanlainen kuin tilastolla, mutta hakemuksessa kuvataan julkaisun sisältö, aikajänne ja jatkuvuus sekä se, kuinka suuri osa julkaisusta käsittelee SVT-tilastojen tietoja.

SVT-neuvottelukunta ylläpitää listaa SVT-tilastosarjaan hyväksytyistä tilastoista ja SVT-julkaisusarjaan hyväksytyistä julkaisuista. SVT-statuksen saanut tilasto ja julkaisu käyttävät SVT-tunnusta.

2.2 SVT-tunnus ja sen käyttö

Kun tilasto on hyväksytty SVT-tilastoksi, voidaan sen yhteydessä käyttää SVT-logoa. SVT-logosta on saatavilla eri käyttötarkoituksiin sopivia versioita.

Suomen virallisen tilaston kolmikielinen logo on seuraavanlainen:
Tekstit Suomen virallinen tilasto, Finlands officiella statistik, Official Statistics of Finland. Kirjaimet SVT ympyrän sisällä.

Logosta on myös erilliset kieliversiot:

SVT-logo suomeksi. Teksti Suomen virallinen tilasto. Sen vieressä ympyrän sisällä kirjaimet SVT.

SVT-logo ruotsiksi. Teksti Finland officiella statististik. Tekstin vieressä ympyrän sisällä kirjaimet FOS

SVT-logo englanniksi. Teksti Official Statistics of Finland. Tekstin vieressä ympyrän sisällä kirjaimet OSF.

Julkaisuissa (esimerkiksi vuosikirjat) käytetään logoa teksteineen etukannessa ja nimiösivulla.

SVT-tilastojen kotisivuilla ja SVT-julkaisujen verkkosivulla käytetään pelkkää SVT-tunnusta ja sen kieliversioita:

Ympyrän sisällä kirjaimet SVT.

Ympyrän sisällä kirjaimet FOS.

Ympyrän sisällä kirjaimet OSF.

SVT-tunnuksen väri noudattaa tilaston tuottajan visuaalista ilmettä. Näin ollen organisaatio voi mukauttaa logon värin omaan verkkopalveluun sopivaksi ja väri voi poiketa yllä olevista malleista.

2.3 ISSN- ja ISBN-tunnusten hakeminen

ISSN-tunnus identifioi jatkuvasti ilmestyvät tilastot. SVT-tilastolle voidaan hakea ISSN-tunnus Kansalliskirjastosta.

Suomen virallisen tilaston julkaisusarjan ISSN-tunnukset ovat:

  • 1796-0479 (verkkojulkaisu)
  • 1795-5165 (painettu).

SVT-julkaisusarjan julkaisut voivat samanaikaisesti kuulua myös johonkin muuhun julkaisusarjaan, esimerkiksi tilastontuottajan omaan sarjaan, jolla on oma ISSN-tunnus.

Yksittäiselle julkaisulle voi hakea ISSN-sarjatunnuksen lisäksi myös ISBN-tunnuksen. ISBN-tunnusta ei tarvita, jos tilastojulkaisun erillisillä osilla ei ole omia nimekkeitä. Jos yksittäiset osat katsotaan itsenäisiksi julkaisuiksi, voi niille hakea ISBN-tunnukset. ISBN-tunnus haetaan sekä verkkojulkaisulle että painetulle julkaisulle, jos molemmat ilmestyvät.

Kaikki tunnukset merkitään julkaisun kaikkiin versioihin, paitsi kieliversiokohtaiset tunnukset merkitään vain kyseiseen kieliversioon.

Suomenkieliseen tilastojulkaisuun merkitään suomenkielisen version ISBN-tunnukset ja kaikkien sarjojen ISSN-tunnukset esimerkiksi näin:

  • ISBN xxx-xxx-xxx-xxx-x (pehmeäkantinen)
  • ISBN xxx-xxx-xxx-xxx-x (PDF)
  • ISSN xxxx-xxxx = Suomen virallinen tilasto (painettu)
  • ISSN xxxx-xxxx = Suomen virallinen tilasto (verkkojulkaisu)
  • ISSN xxxx-xxxx = Alasarjan nimeke (painettu)
  • ISSN xxxx-xxxx = Alasarjan nimeke (verkkojulkaisu).

3 Tilastotiedon julkistaminen

3.1 Julkistamiskalenteri

Suomen virallisten tilastojen julkistamispäivät ja -ajat ilmoitetaan ennalta julkistamiskalenterissa tilaston tuottajan verkkosivuilla. Julkistamiskalenteria ylläpidetään suomen-, ruotsin- ja englanninkielisistä julkistuksista. Tilastot julkistetaan pääsääntöisesti samaan kellonaikaan. Tästä voidaan poiketa esimerkiksi tiedotustilaisuuden tai muun tiedon jakeluun liittyvän syyn takia.

Julkistusten merkittävistä tarkennuksista, julkistamisen ajankohdan muuttumisesta ja muista muutoksista ilmoitetaan tiedon käyttäjille etukäteen julkistamiskalenterissa tai muulla sopivalla tavalla. Julkistetut tilastot ovat yhtäläisesti ja samanaikaisesti kaikkien käytössä. Tilaston tuottaja vastaa omien tilastojensa julkistamiskalentereista ja seuraa niiden pitävyyttä.

Julkistamiskalenteri laaditaan syksyllä seuraavaksi vuodeksi tilastontuottajalle sopivimmalla tarkkuustasolla (esimerkiksi päivä-, viikko- tai kuukausitasolla). Koska syksyllä on vaikea antaa tarkkoja julkistuspäivämääriä, on suositeltavaa ilmoittaa lopulliset päivämäärät tiedon käyttäjille viimeistään kuukautta ennen julkistusta.

3.2 Embargo

Embargo on tilastontuottajan ja käyttäjän välinen järjestely, jossa käyttäjä voi tutustua aineistoon ennen sen julkistamista yleisölle. Tietojen käyttäjä sitoutuu siihen, että se pitää saadut tiedot salassa tilastontuottajan määrittämään julkistusajankohtaan asti. Embargo perustuu vahvaan luottamukseen ja ammattietiikkaan.

Euroopan tilastojen käytännesääntöjen mukaan tilastotietoja voidaan poikkeustapauksissa luovuttaa ennen julkistamista esimerkiksi median edustajille, tilastoja tuottaville organisaatioille tai komissiolle. Embargon on oltava rajoitettua, perusteltua, valvottua ja julkistettua. Kukin tilastontuottaja määrittelee tilanteet, joissa tietoja voidaan luovuttaa embargona. Embargo-käytännöstä kerrotaan tilastontuottajan verkkosivuilla.

4 Muutokset julkaistuissa tilastoissa

Aiemmin julkistettua tilastotietoa saatetaan joutua muuttamaan. Muutokset voidaan jakaa kahteen ryhmään: tietojen tarkentumiseen ja virhetilanteisiin.

4.1 Tietojen tarkentuminen

Julkistettujen tilastotietojen tarkentuminen eli revisio on osa normaalia tilastotuotantoa. Revisio merkitsee yleensä käytettävissä olevien tietojen laadun parantumista tai merkittävää menetelmämuutosta, jossa korjataan aikasarjaa myös taaksepäin.

Tilastotietojen tarkentumisen syy on useimmiten aineiston täydentyminen. Tällöin uusi, revisioitu tilastoluku perustuu laajempaan tietopohjaan.

Tilaston tietojen tarkentuminen voi liittyä myös käytettävään laskentamenetelmään, kuten lukujen vuosittaiseen täsmäytykseen tai painorakenteen päivitykseen. Tiedot voivat tarkentua myös perusvuoden ja luokitusten muutoksen takia. Kansantalouden tilinpidossa merkittävät revisiot tehdään tilinpidon käsikirjoja päivitettäessä.

Tilaston tietojen tarkentumisen syistä kerrotaan tarkemmin tilaston omassa dokumentaatiossa. Kuvauksesta pitää ilmetä myös revisioiden suuruusluokka sekä se, kuinka kauan tiedot tarkentuvat ensimmäisen julkistuskerran jälkeen ja tarkentuvatko jotkin tiedot muita enemmän.

Jos tilaston tiedot tarkentuvat merkittävästi tavallista enemmän, kerrotaan sen syistä erikseen julkistuksessa.

Revisiotaulukot voidaan julkaista tietokantataulukoina tai muina taulukoina. Verkkosivuilla julkaistavissa revisiotaulukoissa voidaan kuvata yleensä vain keskeisimpien tietojen revisioitumista. Tietokannan revisiotaulukoissa voidaan kuvata tietojen tarkentumista kattavammin. On suositeltavaa tuottaa revisiotaulukot kiinteänä osana tietokannan normaalia ylläpitoa. Revisiotaulukot päivittyvät tilastojen julkaisusyklien mukaisesti esimerkiksi kuukausitilastoissa kuukausittain.

4.2 Virhetilanteet

Tilastojulkistamisen virheitä ovat muun muassa julkistusten teksteissä, kuvioissa tai taulukoissa esitetyt virheelliset luvut tai väärien käsitteiden käyttö. Toisin kuin tietojen tarkentuminen, virhetilanteet ovat odottamattomia poikkeamia normaalista tilastotuotannosta.

Virheet korjataan ja niistä tiedotetaan tilaston käyttäjille avoimesti ja mahdollisimman nopeasti. Tilaston julkaisija kertoo merkittävistä virheistä samassa laajuudessa ja samojen kanavien kautta kuin alkuperäisten tietojen julkistamisessa.

Korjauksista ilmoitetaan muutostiedotteilla tai vastaavilla, jotka linkitetään korjattuun julkistukseen.
Tietokantataulukoiden tai muiden taulukoiden virheiden korjauksista tai muista olennaisista muutoksista tiedotetaan muutostiedotteella tai vastaavalla. Tiedot muutoksista ovat erityisen tärkeitä rajapintakäyttäjille. Tilastotietokannoissa ylläpidetään vain tuoreimpia, ajantasaisia tietoja myös aiempien ajankohtien tiedosta (sisältäen aiempien aikasarjatietojen mahdolliset revisiot tai korjaukset).

Tilastojulkistuksissa tai verkkosivuilla sekä tietokantataulukoissa esiintyvät kirjoitus- ja muut muotovirheet korjataan mahdollisimman nopeasti. Niistä ei tehdä erillistä merkintää verkkosivuille eikä niistä julkaista muutostiedotetta.

5 Verkkojulkaiseminen

5.1 Tilastojen kotisivut

Tilastokeskuksen verkkopalvelun Tilastotieto-osioon on koottu aiheittain kaikki Suomen virallisen tilaston tilastot. Aiheluokitus on SVT-neuvottelukunnan vahvistama virallinen luokitus.

Kaikilla SVT-tilastoilla on Tilastokeskuksen verkkosivuilla tilaston kotisivu, josta on linkit tilastontuottajien tarjoamiin tilaston perustietoihin (tilaston kotisivu, julkistamiskalenteri ja tietokantataulukot). Jokaisella SVT-tilastolla pitää olla verkossa kotisivu tilastontuottajan omassa verkkopalvelussa.

Kotisivu on julkaistava kolmikielisenä (suomi, ruotsi ja englanti). Kukin tilastontuottaja vastaa sisällön oikeellisuudesta sekä käännöksistä.

Suomen virallisen tilaston kotisivulla käytetään SVT-tunnusta (katso luku 2.2).

Tilaston kotisivulla esitetään tai sille on linkitetty vähintään seuraavat sisällöt:

  • tilaston nimi
  • tilaston kuvaus
  • tilaston tuorein julkistus (lyhyt tiedote tai vastaava)
  • tilaston tietokantataulukot tai vastaavat julkistuksiin liittyvät tilastotaulukot
  • julkistamiskalenteri
  • tilaston dokumentaatio eli metatiedot (katso tarkemmin luku 5.2)
  • tilaston asiantuntijoiden yhteystiedot
  • tiedot muutoksista tilastossa (muutostiedotteet tai vastaavat) säilytetään tilastontuottajan käytänteiden mukaisesti.

5.2 Metatieto

Käytettyjä tietolähteitä, menetelmiä ja menettelytapoja koskevan tiedon pitää olla julkisesti saatavilla. Tietojen merkittävistä tarkennuksista tai menetelmien muutoksista ilmoitetaan ennalta tilaston kotisivulla.

Tilastoviranomaiset hallinnoivat ja jakavat tilastoihin liittyviä metatietoja eurooppalaisten standardien mukaisesti (esimerkiksi SIMS-standardin mukainen laaturaportti). Käyttäjille tiedotetaan tilastoprosesseissa käytetyistä menetelmistä ja hallinnollisten tietoaineistojen ja muiden tietojen käytöstä ja integroinnista sekä tuotettujen tilastotietojen laadusta Euroopan tilastojen laatukriteerien mukaisesti.

Tilastojen ja niihin liittyvän metatiedon esitys- ja säilytysmuotojen pitää olla sellaisia, että ne helpottavat tilastojen oikeaa tulkintaa ja merkityksellisten vertailujen tekemistä. Metatiedot ovat tilastotuotannon perusta ja välttämätön edellytys tilastotietojen käytölle ja tulkinnalle. Julkaisuvaiheessa tilastojen metatietoja ryhmitellään erilaisiin metatietotyyppeihin tai -ryhmiin tilastotietojen käytön tukemiseksi.
Tilastollisia metatietoja ovat muun muassa

Metatietojen julkaisemisen laajuuteen ja ryhmittelyyn vaikuttavat muun muassa julkaistun tilastotiedon tuotantomenetelmät, tietosisällöt, tietomuodot (esimerkiksi APIt) sekä käyttäjien tarpeet. Metatietojen laajuus voi vaihdella tilaston tuottajasta ja tilastosta riippuen.

5.3 Tietokantajulkaiseminen

Tilastotietojen julkaisemisessa ja käytössä tilastotietokantojen merkitys on nykyisin keskeinen. Tietokantataulukot ovat monikäyttöisempiä ja usein laajempia kuin julkaisutaulukot. Tietokantataulukot tarjoavat käyttäjälle mahdollisuuden muokata ja rajata tietoja haluamallaan tavalla muuttujavalintojen avulla. Näin tietokantataulukoita voi käyttää myös tietojen analysointivälineenä. Tilastotietokannoissa tarjotaan käyttäjälle myös mahdollisuus ladata hänen muokkaamansa taulukko jatkokäyttöä varten useissa eri tiedostomuodoissa. Tilastotietokannan käyttöliittymää sekä tietokantataulukoita koskevat myös yleiset saavutettavuusvaatimukset (katso tarkemmin luku 7.3).

Tilastotietokantoja voidaan käyttää myös ohjelmallisesti ohjelmointirajapintojen (API) kautta. Erityisesti API-käyttäjille on tärkeää, että tietojen käyttöehdot ovat selkeitä ja mahdollistavat tietojen käytön mahdollisimman joustavasti. Avoimen tiedon jakelussa suositellaan käytettäväksi standardeja Creative Commons -lisenssejä. API-rajapintojen rakentamisesta ja ylläpidosta on julkaistu julkisen hallinnon API-periaatteet (katso tarkemmin luku 5.5). Verkkosivuilla julkaistut taulukot ja kuviot sekä pitkiä aikasarjatietoja sisältävät indikaattorikuviot ja -taulukot kannattaa kytkeä rajapintojen kautta tilastotietokantaan aina kun mahdollista. Näin tiedot ovat verkkosivuilla ja tietokannassa yhtenäisiä ja myös verkkosivuilla suoraan tietokannasta päivittyvinä ajantasaisia.

Tilastotietokannoissa julkistettavista uusista tilastotiedoista pitää kertoa käyttäjille etukäteen samoin periaattein kuin perinteisistä tilastojulkistuksista. Jos tilastotietokannassa julkistetaan uutta tilastotietoa ilman erillistä tilastojulkistusta (tiedote tai vastaava), on ajankohta ilmoitettava julkistamiskalenterissa etukäteen tietokantajulkistuksena. Tilastotietokannassa ylläpidetään tyypillisesti aikasarjatietoja, ja tietokantaan lisätään uusimmat tiedot aiempien tietojen lisäksi. Tietokannassa aiempia tietoja tarkennetaan (revisioidaan) ja mahdollisia virheitä korjataan niin, että myös aiemmat tilastotiedot tietokantataulukossa ovat aina viimeisimmän ajankohdan mukaisia (katso tarkemmin luku 4).

5.4 Avoin data ja API-periaatteet

Suomen virallisen tilaston avoimen datan jakelua ja sähköistä tietojen luovuttamista ohjaavat julkisen hallinnon API-periaatteet. Periaatteiden tarkoitus on edistää julkisen hallinnon tietojen tarjoamista ja hyödyntämistä ohjelmointirajapintojen avulla sekä lisätä asiakaslähtöisyyttä, yhteistyötä, semanttista ja teknistä yhteensopivuutta, uudelleenkäytettävyyttä, tietoturvan ja tietosuojan huomioimista sekä laatua ohjelmointirajapintojen kehityksessä.

Ohjelmointirajapinnat eli APIt ovat dokumentoituja rajapintoja, joiden avulla ohjelmistot, sovellukset tai järjestelmät voivat vaihtaa keskenään tietoa tai toiminnallisuuksia. API-periaatteiden mukaan ohjelmointirajapintojen käsittelemän tiedon kuvaamisessa tulisi ottaa käyttöön tarvittavat tietomallit ja metatiedot. Kuvaamisessa voidaan hyödyntää yleisiä tai yhteisiä sanastoja, koodistoja, tietomalleja, tietorakenteita, luokitteluja ja laatukriteerejä. (Tiedonhallintalautakunnan suositus teknisistä rajapinnoista ja katseluyhteyksistä (VM, 2021:21)

Julkisen hallinnon API-periaatteiden mukaan esimerkiksi

  • tarjotaan avointa dataa pääsääntöisesti ohjelmointirajapintojen kautta
  • kehitetään ohjelmarajapintoja tarvelähtöisesti
  • kehitetään ohjelmointirajapinnat avoimilla ja teknologiariippumattomilla standardeilla ja protokollilla
  • kuvataan ohjelmointirajapintojen käsittelemät tiedot yhteisten ja yleisten tietomallien mukaisesti.

Tilaston julkaisemisesta vastaava taho on aineistojen tuottaja ja tekijänoikeuden haltija, ellei tuotteen, tiedon tai palvelun yhteydessä erikseen toisin ilmoiteta.

Suomen virallisen tilaston avoimen datan aineistoja ja verkkopalvelujen julkisia sisältöjä koskee Creative Commons Nimeä 4.0 -käyttölupa. Se antaa oikeuden kopioida, muokata ja jakaa aineistoja edelleen joko alkuperäisessä tai muutetussa muodossa. Aineistoja voi myös yhdistää muihin aineistoihin ja käyttää sekä kaupallisiin että epäkaupallisiin tarkoituksiin.

5.5 Saavutettavuus

Verkossa tilastot on tarjottava saavutettavassa muodossa. Tilastosisältöjä pitää olla mahdollista käyttää, vaikka käyttäjällä olisi jokin toimintarajoite, kuten näkövamma. Julkaisemisessa on siis otettava huomioon esimerkiksi heikkonäköisyys ja sisältöjen käyttäminen erilaisilla apuvälineillä.

Saavutettavuuskriteerien täyttämisen lisäksi laki digitaalisten palvelujen tarjoamisesta edellyttää, että viranomaisten verkkosivulla on saavutettavuusseloste. Saavutettavuusselosteessa kuvataan, miltä osin verkkopalvelut täyttävät saavutettavuuskriteerit ja miltä osin sivut eivät ole saavutettavat.

Saavutettavuusselosteen on sisällettävä ainakin

  • tiedot siitä, miltä osin palvelu ei ole saavutettava ja miksi ei
  • ohjeet siitä, miten käyttäjä voi saada ei-saavutettavan sisällön vaihtoehtoisessa muodossa
  • yhteystieto palautteen antamista varten
  • linkki valvontaviranomaisen verkkosivustolle, jossa palvelun käyttäjä voi tehdä saavutettavuuskantelun tai -selvityspyynnön.

Tilastokuvioiden ja -taulukoiden saavuttavuudesta on lisätietoa luvussa 7.

6 Yleisiä ohjeita

6.1 Kielisuositus

SVT-julkaisuohje määrittelee seuraavat minimisuositukset eri kieliversioiden käytölle:

  • Tilaston kotisivun perustiedot julkaistaan kolmikielisenä.
  • Julkistamiskalenteri julkaistaan kolmikielisenä.
  • Laaturaportit tai vastaava dokumentaatio julkaistaan kolmikielisenä.
  • SVT-tilastojulkistukset julkaistaan suomeksi, keskeisiltä osin ruotsiksi ja tarvittavilta osin englanniksi tilaston sisällöstä ja tilaston jakelusta osana Euroopan tilastojen tilasto-ohjelmaa (ESS).
  • Tilastojulkaisut julkaistaan suomeksi sekä tarvittavilta osin ruotsiksi ja/tai englanniksi.
  • Tilastotaulukot laaditaan yksikielisinä, mahdolliset kieliversiot tehdään erillisinä taulukoina.
  • SVT-tilastojen jakeluun käytettävät tilastotietokannat suositellaan toteutettavaksi suomeksi, ruotsiksi ja englanniksi.

6.2 Viittausohje

Tilastojen julkaisemisen yhteydessä on suositeltavaa julkaista ohje Suomen virallisen tilaston tietoihin viittaamisesta. Painojulkaisuissa ohjeteksti sisällytetään julkaisuun, esimerkiksi otsikolla ”Viittaaminen tämän tilaston tietoihin”. Verkossa ohjeeseen voidaan linkittää tilaston verkkojulkaisusta.

Esimerkki:

Viittaukseen kirjoitetaan ensimmäiseksi ”Suomen virallinen tilasto (SVT)”. Verkko-osoite viitteessä voi ohjata tilastojulkistukseen tai tilaston kotisivulle.

6.3 Henkilönimien käyttö

Suomen virallisissa tilastoissa ei käytetä tekijätietona henkilönnimeä. Tilaston asiantuntijoiden yhteystiedot julkaistaan tilaston kotisivulla sekä julkaisun yhteydessä.

6.4 Julkaistun tiedon pitkäaikaissäilytys

Julkaistujen tietojen pitkäaikaissäilytys tarkoittaa, ettei aineistoa siirretä heti sen julkaisun jälkeen arkistoon vaan säilytetään pitkäaikaisesti alkuperäistä käyttötarkoitusta varten (esimerkiksi tilastotiedon käyttäminen). Julkistettujen tilastotietojen pitkäaikaisella säilyttämisellä ei ole lainsäädännössä (esimerkiksi arkistolaki, tiedonhallintalaki) määritelty määräaikaa. Viraston on itse määritettävä säilytysaika, jonka jälkeen aineistot voidaan tuhota tai siirtää arkistoon.

Tilastokeskuksella tai muilla SVT-tuottajilla ei ole Kansallisarkiston antamaa päätöstä verkkopalvelussa julkaistun aineiston säilytysajoista. Virastot voivat itsenäisesti päättää pitkäaikaissäilytyksen kestosta ja aineiston saatavuudesta säilytyksen aikana.

Kansalliskirjasto tallettaa kotimaista julkaisutuotantoa kulttuuriaineistolain (laki kulttuuriaineistojen tallettamisesta ja säilyttämisestä 1433/2007) mukaisesti yhteistyössä julkaisualan toimijoiden kanssa.
Verkkoaineistoja on tallennettu vuodesta 2006, jolloin se mahdollistettiin tekijänoikeuslaissa (404/1961 16 b §). Verkkoarkistoon on tallennettu edustavasti ja monipuolisesti verkon sisältöä mutta se ei ole täydellinen tallenne menneestä internetistä. Verkkoarkisto karttuu kerran vuodessa tehtävällä Suomi-keräyksellä, jatkuvilla keräyksillä (verkkolehdet ja Twitter-sisällöt) sekä teemakeräyksillä. Tilaston tuottajien tuottama tilastotieto on osa Kansalliskirjasto verkkoarkistoa.

Tiedonhallintalaki määrittää tietojen säilyttämistä. Tietojen säilyttämiselle pitää olla hyväksyttävä peruste, kuten asiakirjan pysyvä käyttötarve asiakkaan etujen, oikeuksien tai velvollisuuksien todentamiseksi (tiedonhallintalaki (TiHL) 906/2019, HE 284/2018 vp, sivu 98). Säilytysajan päättymisen jälkeen tietoaineistot on arkistoitava tai viipymättä tuhottava tietoturvallisella tavalla (TiHL 906/2019, 21 §). Tiedonhallintalain 19 § mukaan viranomaisen laatimat asiakirjat säilytetään sähköisesti.

7 Liitteet

7.1 Tilastokuviot

Hyvä tilastokuvio liittää kaikki esitetyt tiedot kontekstiinsa. Kuvaava otsikko ja muut oheistiedot kuten asteikko, akselit ja selitteet tukevat asiayhteyden muodostamista. Kun lisäksi kaikki kuvioelementit (viivat, osat, sektorit) on nimetty selkeästi ja poikkeavuudet on tuotu esiin, auttavat ne tekemään oikeansuuntaisia tulkintoja.

Kuvio rakentuu seuraavista osista:

  • otsikko
  • akselit, asteikot, asteikkomerkinnät
  • apuviivat
  • kuvioelementit ja ikonit
  • selite
  • tietolähde ja alaviitteet.

Tarkemmat ohjeet hyvien tilastokuvioiden tekemiseen ovat Tilastokuviot tutuksi -oppaassa.

Verkossa julkaistavien tilastokuvioiden pitää olla saavutettavia. Huomiota on syytä kiinnittää erityisesti seuraaviin asioihin:

  1. Kuvioiden värikontrastien on oltava riittäviä. (WCAG-kriteeri 1.4.11)
  2. Kuvion sisältö on kuvailtava tekstivastineessa (alt-teksti) tai sitä ympäröivässä tekstissä tai muussa helposti löydettävissä sijainnissa. Pelkkä kuvion otsikko ei ole riittävä alt-teksti. Jos tekstin kirjoittaminen ei ole mahdollista esimerkiksi automaattipäivitteisyyden takia, on tarjottava kuvion sisältämä tieto saavutettavana taulukkona. (WCAG-kriteeri 1.1.1)
  3. Interaktiivisia visualisointeja pitää olla mahdollista käyttää näppäimistöllä. (WCAG-kriteeri 2.1.1).

Visualisointeihin liittyy muitakin kriteereitä, tyhjentävä lista riippuu tapauksesta.

7.2 Tilastotaulukot

Taulukoita voidaan julkaista

  • valmiina taulukoina esimerkiksi tilastojulkistuksissa, verkkosivuilla sekä julkaisuissa
  • dynaamisina tietokantataulukoina, joissa käyttäjät voivat muokata taulukoiden sisältöä ja laajuutta haluamallaan tavalla.

Tilastotaulukoiden tietosuojasta on huolehdittava organisaatioiden omien ohjeiden mukaisesti.

Tilastotaulukoiden tietosuojaukseen on lisäksi saatavilla SVT-neuvottelukunnan tietosuojasuositus sekä Tilastokeskuksen tarkemmat ohjeet.

Virallisen tilaston julkaisujen taulukoissa käytetään seuraavia merkintöjä:

  • 0,0 suure pienempi kuin puolet käytetystä yksiköstä
  • . tieto on epälooginen esitettäväksi
  • .. tietoa ei ole saatu, se on liian epävarma esitettäväksi tai se on salassapitosäännön alainen
  • .... tai – ei yhtään havaintoa
  • * ennakkotieto

Lisäksi:

  • Prosenttilukujen perustana oleva kantaluku on aina ilmoitettava taulukossa.
  • Samoin indeksien perusvuosi tai -ajankohta.

Verkossa taulukot on julkaistava saavutettavassa muodossa. Taulukoiden pitää olla luettavissa ja ymmärrettävissä myös mobiililaitteilla.

Saavutettavuusohjeiden mukaan tehdyt taulukot ovat myös helpommin ymmärrettäviä kaikille käyttäjille. Huomiota on syytä kiinnittää erityisesti seuraaviin asioihin, joista moni liittyy WCAG-kriteeriin 1.3.1:

  1. Taulukoiden riviotsikot on merkittävä riviotsikoiksi ja sarakeotsikot sarakeotsikoiksi.
  2. Tarpeettoman monimutkaisia taulukoita on syytä välttää. On parempi tarjota tietoja monena pienenä taulukkona kuin yhtenä laajana ja monimutkaisena taulukkona.
  3. Yhdistettyjä soluja on syytä välttää käyttöympäristöissä, joissa taulukon rakennetta ei voida merkitä saavutettavasti.
  4. Monitasoisia otsikoita ja taulukon keskellä olevia otsikkorivejä on syytä välttää käyttöympäristöissä, joissa taulukon rakennetta ei voida merkitä saavutettavasti.
  5. Taulukoiden korjaukset on merkittävä saavutettavasti. Korjauksen merkitseminen pelkällä värillä (esimerkiksi punainen numero taulukkosolussa) ei ole saavutettava tapa.
  6. Jos taulukon otsikko on kiinteästi osa taulukkoa, se on merkittävä taulukon koodissa caption-elementtiin.
  7. Puuttuva tieto on merkittävä taulukkoon.

7.3 Tilastotietokannat

Julkaistavien tilastotietokantojen pitää olla saavutettavia. Myös niiden pitää täyttää WCAG-kriteerien A- ja AA-taso. Tässä ohjeessa mainitaan kriteerien vaatimuksista muutama keskeinen.

Tilastokuvioita ja -taulukoita koskevat ohjeet (luvut 7.1 ja 7.2) koskevat myös tilastotietokannoissa julkaistavia kuvioita ja taulukoita, silloinkin kun ne muodostetaan automaattisesti tilastotietokannan sisällöistä.

Tilastotietokantojen käyttöliittymiä koskevat muun muassa seuraavat vaatimukset:

  1. Kaikkia toiminnallisuuksia pitää olla mahdollista käyttää näppäimistöllä, ilman hiirtä.
    • Esimerkki: Käyttäjän pitää päästä kaikkiin tietokannan valikoihin ja pois valikoista näppäinkomentojen avulla.
  2. Tietokannan toiminnoista ja toimintojen tilasta pitää välittyä tieto myös apuvälineille kuten ruudunlukijalle.
    • Esimerkki (toiminnot): Jos ruudunlukuohjelman käyttäjä valitsee pudotusvalikosta jotakin, käyttäjän pitää saada tieto, mikä valikon nimi on, mitä valikosta voi valita ja mitä on valittu.
    • Esimerkki (toiminnon tila): Jos ruudunlukuohjelman käyttäjä käyttää tietokannassa jotakin hakutoimintoa, eikä haku lataa koko sivua uudelleen, ruudunlukuohjelmalle pitää välittyä tieto haun tuloksista.
  3. Jos ruudunlukuohjelman käyttäjä tekee tietokannassa valintoja ja ne päivittävät automaattisesti sivun sisältöä, käyttäjälle pitää kertoa automaattisesta päivittymisestä etukäteen. (WCAG 3.2.2)
  4. Tilastokuvioiden värikontrastien lisäksi myös kaikkien tietokannan tekstien ja toiminnallisten elementtien, kuten painikkeiden, kontrastien pitää olla riittäviä. (WCAG 1.4.1, 1.4.11)
  5. Tietokannan sisältö pitää merkitä koodissa niin, että apuvälineet, kuten ruudunlukija, pystyvät tunnistamaan esimerkiksi sivun rakenteen ja otsikkotasot. (WCAG 1.3.1)
  6. Tietokannan toiminnoissa ja ohjeistuksessa ei saa nojata pelkkään aistihavaintoon [yllä, alla, sininen, punainen].

Eri kielet on merkittävä monikielisissä sisällöissä, jos sellaisia on pakko tehdä.

8 Lisätietoa