Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Suuret tietovarannot, suuret odotukset

12.1.2023
Twitterissä: @MarkusSovala
Kuva: Risto Wuolle

Suomessa on poikkeuksellisen laadukkaat rekisterit kansalaisista, yrityksistä ja yhteisöistä. Rekisterit kertovat faktoja siitä, mitä me teemme ja miten meillä menee. Rekisterin­pitäjiä on useita, ja kullakin on oma näkymänsä yhteiskuntaan.  

Tilastokeskus on poikkeuksellinen tiedon solmukohta, koska sen haltuun on omien aineistojen lisäksi suotu Suomen tärkeimmät tietovarannot myös muilta rekisterin­pitäjiltä. Tällaista tiedon keskittymää ei ole muualla.

Tiedon keskittäminen mahdollistaa tietojen yhdistämisen. Esimerkiksi tulorekisteri­aineiston ja sähkömarkkina­datan yhdistämällä voimme vastata kysymykseen: kuinka paljon Suomessa on pienituloisia sähkö­lämmitteisessä talossa asuvia kotitalouksia, joilla ei ole kiinteä­hintaista sähkö­sopimusta. Toisistaan irrallaan näillä rekisteri­tiedoilla voitaisiin tarkastella vain tulotasoa tai energian­kulutusta erikseen, ei näiden kahden yhteis­vaikutusta.

Rekisterien pohjalta syntyvä tietovarallisuus on Suomen kilpailuetu. Jos hyödynnämme sitä, pystymme tekemään parempia päätöksiä niin kansalaisten arjessa, yrityksissä kuin ylimmän valtiojohdonkin tasolla.

Tietoon pohjautuvan päätöksenteon merkitys on tiedostettu. Siitä on raportteja ja selontekoja runsaasti, esimerkiksi Sipilän hallituksen aikainen tietopoliittinen selonteko ja Marinin hallituksen aikainen Valtioneuvoston periaatepäätös tiedon hyödyntämiseksi ja avaamiseksi. Teemaa käsitellään myös Julkisen hallinnon strategiassa, Suomen digitaalisessa kompassissa ja Euroopan datastrategiassa. Näissä kaikissa alleviivataan tiedon hyödyntämisen merkitystä. 

Koska Tilastokeskus on ainutlaatuinen tiedon solmukohta, kohdistuu tieto­varantojemme hyödyntämiseen tietenkin suuret odotukset. Niin sisältä kuin ulkoakin.

Haasteen muodostaa suurten odotusten ja supistuvien resurssien yhteen­sovittaminen. Tilasto­keskukselle valtion budjetissa kohdennetut toimintamenot ovat reaalisesti supistuneet, ja on varauduttava siihen että supistuvat jatkossakin. Tilasto­keskuksen budjetissa kilpailevat keskenään tilasto­tuotannon velvoitteiden täyttäminen, järjestelmien uudistamis­tarpeet, henkilöstön jaksaminen ja odotukset tieto­varallisuuden hyödyntämisestä. Kaikkien osa-alueiden priorisoiminen yhtä aikaa on vaikeaa. 

Olemme ottaneet viime vuosina tiedon hyödyntämisessä harppauksia eteenpäin. Ei ehkä yhtä suuria kuin tiedon käsittelyn teknologian kehittyminen olisi mahdollistanut, mutta merkittäviä kuitenkin. Pelkästään Tilastokeskuksen avoimessa StatFin-tietokannassa on julkaistu lähes kahdeksan miljardia havaintoa laadukasta tilastotietoa yli 5 000 tietokanta­kuutiossa, ja niiden määrä on kasvanut vuosittain noin 15 prosentin vauhtia.  

Korona-aikainen tilannehuone raotti näkymää sille, mitä kaikkea Tilastokeskuksen käsittelemien ja yhdistelemien tietoaineistojen avulla on mahdollista tehdä. Nyt ministeriöiden datahuone jatkaa tuota työtä ministeriöiden päätöksenteon tukena. Konseptin muotouduttua olisi luonnollista rakentaa vastaavia reaali­aikaisen data-analyysin mahdollistavia datahuoneita muillekin toimijoille. Datahuone on kuitenkin vain yksi tiedon hyödyntämisen kanava. 

Kansallisen tietovarallisuuden potentiaalin hyödyntämisessä on valtavasti mahdollisuuksia. Maksullista dataa voitaisiin avata yhä enemmän. Etenkin avoimen aluedatan palvelulle olisi suurta kysyntää. Keväällä (toistaiseksi) lakkautettua Findikaattori-palvelua jäivät kaipaamaan sadat tuhannet käyttäjät, ja se ansaitsisi modernisoidun seuraajan. Esimerkkiä voi hakea Virosta, mutta riman voisi nostaa korkeammallekin.

Ministeriöiden datahuoneen ohella kansalais­yhteiskunnalle olisi mahdollista rakentaa oma tilannekuva­palvelu, joka sisältäisi Tilastokeskuksen asiantuntevien data-analyytikoiden kuratoimia reaaliaikaisia ja interaktiivisia indikaattoreita ajankohtaisista aiheista. Norjan Microdata.no-tyyppisellä ”tilastokoneella” käyttäjien olisi mahdollista koostaa Tilastokeskuksen tarkoista tietoaineistoista itse haluamiaan tilastoja, kuitenkaan tinkimättä tieto­turvallisuudesta.

Eri julkisen sektorin toimijoilla on paljon muitakin mittaristo­tarpeita eli tarve visualisoida tilannekuvaa, tavoitteita ja kehitystä kuvaavia indikaattoreita. Sen sijaan, että teemme mittaristoja kukin tahoillamme, olisi järkevää keskittää voimavaroja kansallisen indikaattori­alustan rakentamiseen. Tätä ja monia muita tavoitteita tukisi kansallisen tilastotieto­kannan rakentaminen, jolloin eri tiedontuottajien tuottama tieto olisi saatavilla yhdestä lähteestä, yhtenäisillä metatiedoilla ja rajapinnoilla.

Tässä on mainittu muutamia, muttei tietenkään kaikkia käyttäjätarpeista kumpuavia ratkaisuja, joilla Tilastokeskuksen olisi mahdollista edistää tiedon hyödyntämistä ja saavutettavuutta Suomessa. Näin saisimme Tilastokeskukseen kootun kansallisen tietovarallisuuden paremmin käyttöön. 

Viime aikojen kriisit ovat osoittaneet suomalaisen varautumis­työn arvon ja huolto­varmuuden merkityksen. Tilastokeskus ylläpitää monia yhteiskunnan tieto­infrastruktuurin kannalta kriittisiä järjestelmiä. Ilman kansantalouden tilinpidon lukuja ei ole luottoluokitusta, eikä ilman luottoluokitusta ole valtionlainoja. Ilman hintaindeksien päivityksiä ei ole indeksi­korotuksia. Nämä ja monet muut yhteiskunnan toiminnan kannalta tärkeät tiedot tuotetaan järjestelmillä, jotka vaativat ylläpitoa ja uudistamista. 

Kansallisen tietovarallisuuden hyödyntäminen rakennetaan Tilastokeskuksen tietovaranto­infran päälle, ja infra muodostaa kivijalan, jonka kehittäminen on tiedon hyödyntämisen kannalta äärimmäisen tärkeää. Ilman tietovarantojen kehitystyötä jäävät askeleet Tilastokeskuksen modernisoinnissa ja uusissa tiedon hyödyntämisen tavoissa puolitiehen. Ennen kaikkea on varmistettava, että käytämme uusinta teknologiaa niin, että saamme hyödynnettyä tieto­varallisuutemme potentiaalin tietoturvallisesti. 

Meillä on Suomessa poikkeuksellinen tietovarallisuus, jonka potentiaalin lunastamisessa otamme koko ajan askeleita oikeaan suuntaan. Etenkin epävarmuuden vallitessa ja yhteiskunnan kriisin­kestävyyden merkityksen noustessa, meidän on huolehdittava myös tietoinfran huolto­varmuudesta ja katsottava myös tulevaan.

Nykyteknologialla meidän on mahdollista tuottaa tietoa, jollaista ei ole ikinä ennen pystytty tuottamaan. Tilastokeskus pyrkii kaikin keinoin mahdollistamaan uusia tapoja hyödyntää tietoa kaikilla yhteiskunnan tasoilla. Uskomme, että parempi tieto tuotetaan kaikkien yhteiskunnan tiedontuottajien yhteistyönä.  

 

Kirjoittaja on Tilastokeskuksen pääjohtaja.

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

Artikkeli
19.3.2024
Jaana Huhta

Meneillään olevan verkkouudistuksemme tavoitteena on tarjota tilastoja nykyaikaisemmassa ja helpommin löydettävässä muodossa erilaisille tilastonkäyttäjille. Tilastojen julkistamisen johtotähtenä on: data ensin. Teksti rakentaa tilastoille merkityksen. Jotta kaikki pääsevät yhtä vaivattomasti tilastojen äärelle, tulee kaikessa tilastokirjoittamisessa käyttää selkeää ja ymmärrettävää kieltä.

Blogi
16.2.2024
Markus Sovala

Suomen tilastojärjestelmä ylsi ykkössijalle 186 valtiota kattaneessa vertailussa. Tilastokeskuksen pääjohtaja löytää kolme perustetta Suomen menestykselle Maailmanpankin arviossa.

Blogi
1.9.2023
Maija Metsä

Kesälomani lopulla seurasin sivusilmällä lukiolaisnuoren pakkausruljanssia. Edessä oli vaihto-oppilasvuosi ja lähtöön muutama päivä. Mahtuisiko matkaan myös taskullinen tietoa Suomesta?

Blogi
2.5.2023
Tapio Kuusisto

Talouden keskeiset mittarit näyttävät isoja ja risti­riitaisiltakin vaikuttavia muutoksia. Tilastojen päälinja lienee oikea, mutta lukuihin voi laskennan tarkentuessa tulla revisioitakin, kun talouden rakenteessa on tapahtunut muutoksia. Tarkentumisten suuntaa ei pysty ennakoimaan, se vaihtelee eri vuosien välillä.  

tk-icons