Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Miksi tilastot valmistuvat niin hitaasti? – tilastotuotanto on tasapainoilua tarkkuuden ja ajantasaisuuden välillä

24.8.2020
Twitterissä: @kritaskinen
Kuva: Shutterstock

Koronapandemian myötä Tilastokeskus on nopeuttanut joidenkin tilastojen julkaisua, mikä on ilahduttanut tietojen käyttäjiä. Olemme myös Twitterissä saaneet toiveita siitä, ettei paluuta hitaampien tilastojen aikaan enää tulisi.

Asia ei kuitenkaan ole niin yksinkertainen tilastoijan näkökulmasta. Tilaston tuottajien on tasapainoiltava tilaston tarkkuuden ja ajantasaisuuden välillä ottaen huomioon myös julkaistavien tietojen käyttötarkoitukset. Optimaalisen tasapainon löytämiseksi on hyvä huomioida useita näkökulmia.

Tilaston laatu koostuu monista tekijöistä, joista ajantasaisuus ja tarkkuus ovat tärkeitä kriteereitä. Muita kokonaislaatuun vaikuttavia keskeisiä tekijöitä ovat mm. tilastotietojen relevanssi, vertailukelpoisuus ja yhtenäisyys.

Suurin osa tilaston laadusta määräytyy oikeastaan jo sen perustamisvaiheessa, kun määritellään käsitteitä vastaavat tietolähteet, kulloinkin käytettävät menetelmät ja tilastojulkaisun sisältö. Eri ajanjaksojen välillä tilastoilta toivottua tasalaatuisuutta häiritsevät erilaiset tekijät, jotka liittyvät enimmäkseen tilastossa käytettävien lähdetietojen puutteisiin ja virheisiin.

Koronapandemian aiheuttama talousshokki aiheuttaa lisäongelmia suhdannetilastoille, sillä nopeasti julkaistavien tilastojen metodologia sisältää paljon aiempaan kehitykseen nojaavia elementtejä.

Tämän vuoksi julkaistavien suhdannetietojen validointityö on nyt haastavampaa ja normaaliaikataululla tuotettavienkin tilastojen tarkkuus on vaarassa heikentyä. 

Julkaisuviiveeseen vaikuttavat tietojen kertymisnopeus ja käsittelyyn käytetty aika

Tilastokeskus kerää vain pienen osan tilastoissa hyödynnettävistä tiedoista omien kyselyjen kautta. Valtaosa tilastoista pohjautuu muualla yhteiskunnassa syntyviin hallinnollisiin aineistoihin ja näiden aineistojen kertymisnopeus saattaa muuttua ajassa esimerkiksi suurten rekisteri- ja tietojärjestelmäuudistusten aikana.

Tietojen validointiin kuluva aika puolestaan riippuu pääosin lähdetietojen laadusta. Iso osa tietojen tarkistustyöstä on pystytty automatisoimaan. Jäljelle on kuitenkin jäänyt aikaa vievä puuttuvien tai virheellisiksi epäiltyjen tietojen selvittäminen yhteistyössä tiedonantajien kanssa.

On hyvä muistaa, että lähdeaineistojen tiedot eivät koskaan ole heti tilastointivalmiita. Niiden sisältämien puutteiden ja virheiden korjaamistakaan ei toisaalta kannata jatkaa loputtomiin tilaston ajantasaisuuden kustannuksella. Hyvä tilasto on ajassa tasalaatuinen, ja tilapäisille laatutason poikkeamille tulee olla hyvät perusteet. 

Optimaalisen tietojen täydentämiseen ja tarkistukseen käytetyn ajan määrittely lähtee tilaston käyttötarkoituksesta. Esimerkiksi laajasti yhteiskunnan toimijoiden välisissä sopimuksissa käytettävien hintatietojen tarkkuusvaatimukset eroavat oleellisesti talousennusteiden pohjana käytettävistä ennakollisista taloustiedoista.

Toisaalta myös samalla tilastolla on erilaisia käyttötarkoituksia, joiden tarkkuusvaatimukset voivat erota. Tämän vuoksi monista tilastoista on päädytty julkaisemaan ennakkotilastoja sallien tietojen myöhempi tarkentuminen.

Tasapainoilua eri käyttötarkoitusten välillä harjoitetaan myös julkaisemalla nopeasti karkeampaa tietoa ja yksityiskohtaisemmat tiedot vasta myöhemmin. Esimerkiksi tietyn kuukauden vähittäiskaupasta julkaistaan ennakko vajaan kuukauden viiveellä ja laajemmat kaupan myynnin kuukausittaiset tiedot julkaistaan noin puolentoista kuukauden viiveellä.

Käyttötarkoituksen lisäksi optimaalisen julkaisuajankohdan määrittelyssä tulee joidenkin tilastojen osalta huomioida myös vaatimukset kansainvälisestä vertailtavuudesta.

Esimerkiksi laajat taloustilastojen lukuja heiluttavat monikansallisten yritysten järjestelyt olisi hyvä selvittää yhteistyössä näihin järjestelyihin liittyvien vastapuolimaiden tilastoijien kanssa. Lisäksi EU-maiden kesken on joillekin tilastoille sovittu myöhempää tarkentumista rajoittavia vaatimuksia.

Tilaston julkaisuviive muuttuu ajassa

Myös poikkeusajat vaikuttavat optimaaliseen julkaisuajankohtaan, sillä eri tilastojen tietoihin kohdistuva tarve voi vaihdella merkittävästi ajassa. Esimerkiksi koronapandemian myötä nopeampaa tietoa on kaivattu selvästi aiempaa enemmän mm. kuolleista, lomautetuista ja eri toimialojen yritysten liiketoiminnan kehityksestä.

Nopeuttaakseen poikkeusoloissa tarvittavien tärkeiden tietojen tuotantoa Tilastokeskus voi kohdentaa lisää resursseja tiettyjen tilastojen tuotantoon tai sallia aiempaa epätarkempien ennakkotietojen julkaisemisen. Poikkeusaikojen jälkeen nopeutettujen tilastojen julkaisuviive voi kuitenkin palata aiempaan, kun resurssien käyttöä joudutaan normalisoimaan – tai jos aiempaa epätarkempien tietojen myöhemmästä tarkentumisesta aiheutuu liikaa ongelmia.

Jatkossakin Tilastokeskuksen yleinen tavoite on lyhentää tilastojen julkaisuviiveitä tuotantoprosessien automatisaatioastetta kasvattamalla sekä ottamalla käyttöön uusia aiempaa nopeammin valmistua tietoaineistoja ja uusia tiedonkeruumenetelmiä. Uusista nopeista ja kattavista aineistoista hyvä esimerkiksi on kansallinen tulorekisteri ja tiedonkeruumenetelmistä verkkoharavointi.

Yhteiskunnan kiihtyvä digitalisaatio tarjoaa jatkuvasti uusia mahdollisuuksia tilastojen sisältöjen ja ajantasaisuuden kehittämiseen.

Kristian Taskinen työskentelee kehittämis­­päällikkönä Tilasto­keskuksen talous- ja ympäristö­tilastot -yksikössä.

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

Blogi
21.5.2024
Jukka Hoffren

Tilastot ovat luotettavia kuvauksia yhteiskunnan ilmiöistä mutta myös rajaavat ja muokkaavat käsityksiämme maailmasta ja ihmisistä. Numerot paitsi paljastavat myös kätkevät asioita, siksi tilastojen luku- ja käyttötaito on tärkeä kansalais­taito.

Blogi
3.5.2024
Karen Asplund, Teemu Koskiniemi, Mirjami Rajala, Timo Ristimäki, Elina Somervuori

Tilastokeskus vastaa julkisyhteisöjen velkaa koskevien tietojen tuottamisesta, sisällöstä ja raportoinnista Eurostatille. Tulkintoja ohjaa EU-lainsäädäntö ja komission valvontaprosessi. Tuotamme tilastotietoa säädösten mukaisesti riippumatta siitä, näyttävätkö Suomea koskevat velkaluvut hyviltä tai huonoilta.

Artikkeli
19.3.2024
Jaana Huhta

Meneillään olevan verkkouudistuksemme tavoitteena on tarjota tilastoja nykyaikaisemmassa ja helpommin löydettävässä muodossa erilaisille tilastonkäyttäjille. Tilastojen julkistamisen johtotähtenä on: data ensin. Teksti rakentaa tilastoille merkityksen. Jotta kaikki pääsevät yhtä vaivattomasti tilastojen äärelle, tulee kaikessa tilastokirjoittamisessa käyttää selkeää ja ymmärrettävää kieltä.

Blogi
16.2.2024
Markus Sovala

Suomen tilastojärjestelmä ylsi ykkössijalle 186 valtiota kattaneessa vertailussa. Tilastokeskuksen pääjohtaja löytää kolme perustetta Suomen menestykselle Maailmanpankin arviossa.

tk-icons