5. Big data

Big data ei ole yksiselitteinen käsite ja siksi se on määritelty kyselyyn vastaajien ohjaamiseksi. Saadut tilastoluvut antavat hyvän käsityksen big datan käytön yleisyydestä, mutta käsitteen hankaluuden vuoksi saatuihin tilastolukuihin sisältyy jonkin verran epävarmuutta.

Kyselyä varten big data ja sen analysointi määriteltiin kyselyyn seuraavasti:

Big data syntyy erilaisista sähköisistä toiminnoista ja koneiden välisestä kommunikaatiosta (esim. data, jota syntyy tuotantoprosesseista tai sosiaalisen median käytöstä).

Big datalla on tyypillisesti seuraavia ominaisuuksia:

  • Dataa on hyvin suuria määriä

  • Datan muoto vaihtelee ja se voi olla rakenteellista tai ei-rakenteellista (esim. tekstiä, loki-tietoja, koordinaatteja, sensoridataa, klikkausdataa (clickstream data), kuvia, ääntä)

  • Dataa kertyy, muuttuu ja tulee saataville nopeasti

Big data -analyysilla tarkoitetaan tässä tekniikoiden, teknologian ja ohjelmatyökalujen käyttöä big datan analysointiin. Analysoitava big data voi olla kerätty yrityksen omista lähteistä tai muista datalähteistä.

Big dataa on käyttänyt hyväksi 19 prosenttia yrityksistä. Toimialoittain big dataa on yleisimmin käytetty informaation ja viestinnän toimialalla 42 prosentissa yrityksistä ja harvimmin vähittäiskaupan toimialalla 10 prosentissa yrityksistä. Pienimmistä 10–19 henkilöä työllistävistä yrityksistä 16 prosenttia ja suurimmista vähintään 100 henkilöä työllistävistä yrityksistä 34 prosenttia on käyttänyt big dataa.

Kysytyistä big datan lähteistä yleisimmin yritykset käyttivät sosiaalisen median tuottamaa dataa (9%). Dataa yrityksen omista älylaitteista tai sensoreista käytti kahdeksan prosenttia ja sijaintitietoja kannettavista laitteista seitsemän prosenttia yrityksistä.

Toimialoittain eri big datan lähteitä tarkasteltaessa yleisimmin sosiaalisen median dataa on käytetty informaation ja viestinnän (25%) sekä ammatillisen, tieteellisen ja teknisen toiminnan (22%) toimialoilla, dataa yrityksen omista älylaitteista tai sensoreista informaation ja viestinnän (17%), ammatillisen, tieteellisen ja teknisen toiminnan (13%) sekä teollisuuden (12%) toimialoilla ja sijaintitietoja kannettavista laitteista kuljetuksen ja varastoinnin (16%), informaation ja viestinnän (14%) sekä ammatillisen, tieteellisen ja teknisen toiminnan (13%) toimialoilla. (Liitetaulukko 4).

Big dataa käyttäneistä yrityksistä 68 prosenttia teki itse analyysejä big datasta ja 45 prosenttia käytti analyysien tekemiseen ulkopuolista palveluntarjoajaa. Sekä itse että ulkopuolisen palveluntarjoajan tekemänä analyysejä big datasta teki 23 prosenttia big dataa käyttäneistä yrityksistä.

Yleisimmin big datasta on itse tehty analyysejä informaation ja viestinnän (89%) sekä ammatillisen, tieteellisen ja teknisen toiminnan (82%) toimialoilla ja selvästi harvimmin vähittäiskaupan toimialalla (30%). Vastaavasti big datasta on teetetty analyysejä ulkopuolisilla yleisimmin vähittäiskaupan (65%) sekä majoitus- ja ravitsemistoiminnan (62%) toimialoilla ja harvimmin kuljetuksen ja varastoinnin (29%) sekä informaation ja viestinnän (29%) toimialoilla.


Lähde: Tietotekniikan käyttö yrityksissä 2018, Tilastokeskus

Lisätietoja: Aarno Airaksinen 029 551 3206, yritys.ict@tilastokeskus.fi

Vastaava tilastojohtaja: Mari Ylä-Jarkko


Päivitetty 30.11.2018

Viittausohje:

Suomen virallinen tilasto (SVT): Tietotekniikan käyttö yrityksissä [verkkojulkaisu].
ISSN=1797-2957. 2018, 5. Big data . Helsinki: Tilastokeskus [viitattu: 23.9.2019].
Saantitapa: http://www.stat.fi/til/icte/2018/icte_2018_2018-11-30_kat_005_fi.html