Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Yhteistä ymmärrystä metsästämässä – semanttinen yhteentoimivuus palvelee tiedon uudelleenkäyttöä

9.12.2019
Kuva: Shutterstock

Keskustellessamme tutulla porukalla ymmärrämme toisiamme kohtuullisen hyvin. Pystymme päättelemään asiayhteydestä, mitä kulloinenkin puhuja sanoillaan tarkoittaa. Esimerkiksi kun käytämme sanaa kuusi asiayhteydessä metsä, ymmärrämme, että kyseessä on puu.

Kun puhutaan koneluettavuudesta ja tiedon vaihdannasta isommassa mittakaavassa, ei sana kuusi kirjoitettuna aina olekaan samalla tavalla ymmärrettävissä, ellei tiedon mukana kuljeteta myös sen määritelmää, joka kertoo, onko kyseessä esimerkiksi puu vai numero.

Julkishallinnon tehtävänä on auttaa kansalaisia ja muita yhteiskunnan toimijoita niin, että nämä pystyvät hoitamaan heiltä edellytetyt ja heidän toimintaansa tukevat asiat sujuvasti ja turvallisesti. Tiedon hallinnan näkökulmasta tämä vaatii tiedon liukasta liikkumista paikasta toiseen, koneluettavuutta ja tiedon merkityssisältöjen säilymistä samana siirtymistä huolimatta.

Kun tiedon merkitys säilyy samana tiedon siirtyessä toimijalta toiselle, puhutaan semanttisesta yhteentoimivuudesta.

Tilastotoimella on pitkä historia semanttisen yhteentoimivuuden tavoittelussa. Vuosikymmenten kuluessa on luotu yhteisiä luokituksia ja määritelty käsitteitä liittyen väestöön, yrityksiin ja ympäristöön. Yhdessä sovittuihin määritelmiin pohjautuvat tilastot ovat yhdisteltävissä ja vertailukelpoisia yli maarajojen.

Yhteisiä kuvauksia on tehty maailmanlaajuisesti ja Euroopan tasolla. Yhteistyössä on saatu aikaan laajaan ja monimuotoiseen käyttäjäryhmään nähden yllättävänkin hyvin toimivia ratkaisuja, kuten ISCO-ammattiluokitus, jonka avulla ammatteja luokitellaan eri mantereilla Aasiasta Afrikkaan, Eurooppaan ja Amerikkaan yhteiskuntarakenteesta riippumatta.

Kansainväliseen ISCO-luokitukseen perustuvaa kansallista Ammattiluokitusta hyödynnetään Suomessa muuallakin kuin tilastoinnissa, esimerkiksi työvoimahallinnossa. Tämä on hieno asia, sillä alun perin tilastointitarkoituksiin laadittu luokitus ei aina pysty vastaamaan muunlaisiin käyttötarpeisiin.

Sama monikäyttöisyyden haaste koskee kaikkia semanttista yhteentoimivuutta tukevia sisältöjä, joilla pyritään parantamaan tiedon uudelleenkäytettävyyttä.

Tilastokeskuksen lisäksi monet muutkin julkisen hallinnon tahot ovat edistäneet omissa organisaatioissaan ja toimialueillaan tiedon yhteentoimivuutta. Työ on arvokasta, mutta miten saisimme yksittäisen organisaation tuottamat sisällöt muidenkin hyödynnettäväksi kansallisessa mittakaavassa?

Miten saamme yhteiset tietosisällöt yhtenäisiksi digipalveluiden tietovirroissa siten, että kansalaista ei vaivata turhilla tietopyynnöillä? Miten tiedämme, että liikkuva tieto on ymmärretty kaikkialla samalla tavalla? Ja miten saamme laadukasta ja yhdenmukaista tietoa vaikkapa tilastointitarpeisiin?

Yhteentoimivuusalusta on koko julkisen hallinnon yhteinen tietomääritysten julkaisualusta. Se kehitettiin Väestörekisterikeskuksessa Valtiovarainministeriön Yhteinen tiedon hallinta (YTI) -digikärkihankkeen yhteydessä vuosina 2016–2018. YTI-hankkeen päättymisen jälkeen Yhteentoimivuusalustan kehittämistä on jatkettu Väestörekisterikeskuksessa.

Yhteentoimivuusalustalla määritellään yhteisesti käytettävissä olevat julkisen hallinnon tiedot, kuten tietorakenteet, yhteisesti käytössä olevat koodistot ja käytettävien käsitteiden määritelmät. Määrityksiä tuotetaan myös julkiseen hallintoon läheisesti liittyvien tahojen, kuten yrityksien ja kolmannen sektorin, toimesta. Kommentit-työkalu mahdollistaa laajan joukon osallistumisen tietomääritystyöhön.

Mutta mihin yhteentoimivuusalustaa tarvitaan? Eikös meillä jo ole tiedon kokoavia alustoja olemassa ennestäänkin?

Yhteentoimivuusalusta auttaa yhteisen merkityksen luomisessa ja säilyttämisessä. Alustalla voidaan määritellä käsitteille metatietoja terminologisin periaattein. Esimerkiksi käsitteen merkitys ja sen suhteet toisiin käsitteisiin pystytään määrittelemään hyvin tarkasti.

Jokaisella Yhteentoimivuusalustalla määritellyllä käsitteellä on pysyvä tunnus (URI), jonka lisääminen rakenteistettuun tietoon mahdollistaa näiden metatietojen käytön niin kone- kuin ihmisluettavasti. Alusta toimii linkitetyn datan periaattein, joten tiedon merkitys pysyy tietovirroissa muuttumattomana.

Yhteentoimivuusalustan tietosisällöt voidaan ottaa käyttöön avoimien rajapintojen kautta, ja ne ovat myös suoraan katsottavissa yhteentoimiva.suomi.fi:n kautta ilman kirjautumista.

Sisällöt tuotetaan yhteentoimivuusmenetelmän mukaisesti. Tällä varmistetaan niiden yhteismitallisuus. Menetelmän keskiössä on aiemmin määriteltyjen tietomääritysten uudelleen käyttö – sen sijaan että tuotettaisiin jokaiselle organisaatiolle esimerkiksi oma ajoneuvon määritelmä.

Mutta missä ja miten yhteiset tietomääritykset syntyvät? Keiden aloitteesta? Keiden työstäminä? Kenen päätöksestä?

Vuonna 2019 valtiovarainministeriö on lähtenyt edistämään vahvemmin tiedon semanttista yhteentoimivuutta. Viestintää on kohdistettu erityisesti ministeriöihin.

Tavoitteena on, että Yhteentoimivuusalustalle tuotetaan tietoaluekohtaisia sanastoja, koodistoja ja tietokomponentteja. Tietoalueita ovat esimerkiksi rakennettu ympäristö, koulutus ja työ.

Valtiovarainministeriö on koonnut tietoalueita edistäviä henkilöitä yhteen verkostoksi, jossa tunnistetaan ja keskustellaan yhteisesti tietoalueista ja siitä, miten Yhteentoimivuusalustan avulla tuetaan tietoalueiden toimintaa. Tietoalueita ei kuitenkaan ennalta määritellä valmiiksi, vaan ne muodostuvat sopimusvaraisesti. Semanttinen yhteentoimivuus vaatii toiminnan muutosta, joten verkosto on myös mahdollisuus jakaa hyviä käytänteitä.

Tietoaluekohtaiset tietomääritykset vaativat yhteistyötä ja yhteistä sopimista. Tietoalueelta pyydetään tarvittavat organisaatiot, ministeriöt ja sisältöalueen asiantuntijat mukaan. Tietoalue varmistaa, että tietomäärityksillä on omistajat ja sitä kautta ylläpitäjät.

Tietoalueiden lisäksi edistetään kansallisen tason ryhmiä, joista tällä hetkellä ydinsanastoryhmä (YSR) toimii aktiivisesti. Kansallisen tason ryhmät tuottavat kaikille yhteiset tietomääritykset (esimerkiksi henkilö, osoite).

Sekä tietoalueiden että kansallisen tason ryhmien tuottamat tietomääritykset julkaistaan Yhteentoimivuusalustalla. Kaikki määrityksiin liittyvät ylläpitotoimet organisoidaan ja resursoidaan vuonna 2020.

Yhteentoimivuusalustan ja siihen liittyvien toimijaverkostojen yhteistyöllä voimme saavuttaa siilottoman tiedon liikkuvuuden. Yhteisesti ymmärretty tieto toimii pohjana palvelujen digitalisoimiselle, tiedolla johtamiselle ja viime kädessä toistemme ymmärtämiselle.

Tieto on arvokkainta yhteisessä käytössä. Tutustu yhteentoimivuusalustaan ja tule mukaan tiedon kiertotalouteen. Katso Väestörekisterikeskuksen julkaisema video yhteentoimivuusalustasta Youtubessa.

 

 

Jaana Nevalainen työskentelee valtiovarainministeriössä, Petri Tenhunen Väestörekisterikeskuksessa ja Saija Ylönen Tilastokeskuksessa.

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

Blogi
12.1.2023
Markus Sovala

Suomessa on laadukkaat rekisterit. Niistä saatavaa tietoa yhdistelemällä syntyy tieto­varallisuus, joka on Suomen kilpailu­etu. Sitä hyödyntämällä teemme parempia päätöksiä tulevaisuudessa.  

Blogi
28.2.2022
Outi Ahti-Miettinen

YK:n virallisen tilaston periaatteet ohjeistavat tilastoviranomaisia kertomaan tarkasti, miten tilastot on laadittu. Periaatteen avulla voidaan arvioida myös muun yhteiskunnassa syntyvän tiedon luotettavuutta. 

Blogi
5.11.2019
Iiro Jussila

Tieto ja yhteiskunnallinen keskustelu  on tänä vuonna itsenäisyyspäivän vastaanoton teemana. "Tähän hienoon valintaan liittyy vahvaa symboliikkaa, jota korostavat presidentti Niinistön sanat virkaveljelleen Washingtonissa: pitäkää demokratiastanne huolta". Vieraskynässä Iiro Jussila, PTT:n toimitusjohtaja ja Tilastokeskuksen neuvottelukunnan jäsen.

tk-icons