Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Kuinka monta tuomiota annettiin asuntomurroista – määrät tietoon koneoppimisalgoritmilla

16.4.2021
Twitterissä: @kimmohaapakan
Kuva: Shutterstock

Kuinka monta tuomiota Suomessa annettiin taskuvarkaudesta vuonna 2019? Entä myymälävarkaudesta? Tietoja on aiemmin ollut saatavilla vain joiltain osin rikosilmoitusten ja syylliseksi epäiltyjen osalta. Nyt Tilastokeskuksessa on kokeiltu koneoppimista varkausrikosten luokittelemisessa. Tuloksissa yllättää ainakin polttoainevarkauksien suuri määrä.

”A on anastanut asianomistajien B ja C omaisuutta tunkeutumalla heidän osoitteessa X sijaitsevaan asuntoon avoimesta ikkunasta ja ottamalla sieltä iPad-tabletin. Anastettu omaisuus on palautettu asianomistajalle.”

Rikos- ja pakkokeinotilaston perusteella tiedetään, että vuosina 2017-2019 liiketiloihin murtautumisesta epäiltiin keskimäärin noin 1 500 henkilöä vuodessa. Myymälävarkauksista puolestaan epäiltiin vuosittain noin 34 000 henkilöä. Sama henkilö saattaa toki olla epäiltynä useammasta rikoksesta.

Tilastokeskus on hyödyntänyt syyttäjän teonkuvaustekstejä käräjäoikeuksissa vuonna 2019 käsitellyistä rikosasioista. Näiden perusteella liikemurtoja oli 1 150, taskuvarkauksia noin 1 100 ja myymälävarkauksia 13 800.

Suomenkielisten kuvaustekstien avulla koulutettiin koneoppimisalgoritmi luokittelemaan varkausrikokset (varkaus, törkeä varkaus ja näpistys sekä niiden yritykset RL 28:1-3) kansainvälisen rikosluokituksen (ICCS) mukaisiin murto- ja varkausrikoksia koskeviin luokkiin. Koneoppimismenetelmästä kerrotaan lisää tämän artikkelin lopussa.

”A ja B ovat yhdessä ja yksissä tuumin luvattomasti ottaneet käyttöönsä C henkilöauton. Auto on löytynyt vaurioituneena.”

Lisäksi mukaan otettiin luvattomat käytöt (RL 28:7-9) sekä moottoriajoneuvon käyttövarkaudet (RL 28:9a-9c). Näiden rikostyyppien luokitteluun ei käytetty koneoppimista, vaan tekstihakua, jolla pääteltiin, oliko kyseessä esimerkiksi moottorikulkuneuvon luvaton käyttö vai muun omaisuuden luvaton käyttö.

Runsaat 23 000 syytetekstiä, vajaat 9 000 päärikosta

Käräjäoikeuksissa käsiteltiin vuonna 2019 yhteensä 23 700 syyksiluettua varkauteen, luvattomaan käyttöön tai moottoriajoneuvon käyttövarkauteen liittyvää syytettä. Tarkastelun ulkopuolelle rajattiin ruotsinkieliset teonkuvaukset, jolloin lopullinen aineisto oli 23 400 syytettä. Vain 8 800 tapauksessa kyseessä oli tuomion päärikos. (Taulukko 1)

Erilaisia murtorikoksia oli yhteensä vajaat 2 200. ICCS-luokituksessa aidatulle piha-alueelle tunkeutumista tai ns. häkkivarastomurtoa ei lasketa varsinaiseksi murtorikokseksi, vaan ne ovat varkauksia.

Taulukko 1. Syyksiluettujen rikosten ja päärikostuomioiden määrä 2019
  Syyksiluettuja
rikoksia
yhteensä
Tuomion
päärikos
 
Yhteensä 23 380 8 790
0501 Murto 2 170 810
05011 Murto liiketilaan 1 150 430
05012 Murto yksityiseen asuintilaan 920 340
050121 Murto vakinaiseen yksityisasuntoon 750 310
050122 Murto ei-vakinaiseen yksityisasuntoon 160 30
05013 Murto julkiseen tilaan 70 20
05019 Muu murto 30 10
0502 Varkaus 21 220 7 980
05021 Moottoriajoneuvon tai sen osien varkaus 1 350 410
050211 Moottoroidun maakulkuneuvon varkaus 980 270
050212 Moottoroidun maakulkuneuvon luvaton käyttöönotto 180 70
050213 Moottoroidun maakulkuneuvon osien varkaus 60 20
050219 Muu moottoroidun kulkuneuvon tai sen osien varkaus 130 50
05022 Yksityisen omaisuuden varkaus 3 610 1 120
050221 Yksityisen omaisuuden varkaus henkilöltä 1 080 290
050222 Yksityisen omaisuuden varkaus ajoneuvosta 690 140
050229 Muu yksityisen omaisuuden varkaus 1 850 690
05023 Liikeyrityksen omaisuuden varkaus 16 110 6 390
050231 Myymälävarkaus 13 810 5 630
050239 Muu liikeyrityksen omaisuuden varkaus 2 300 760
05024 Julkisen omaisuuden varkaus 60 30
05026 Palveluvarkaus 20 20
05029 Muu varkaus 70 20
Lähde: Tilastokeskus, Syytetyt, tuomitut ja rangaistukset -tilasto

Murroista runsaat puolet tehtiin liiketiloihin. Yksityisasuntoihin tehtyjä murtoja oli noin 900 ja niistä neljä viidestä tehtiin vakituisesti asuttuihin asuntoihin. Julkisiin tiloihin eli terveysasemille, kouluihin tms. tehtyjä murtoja käsiteltiin vajaassa 70 syytteessä.

Varkaussyytteitä oli runsaat 21 200, ja niistä kaksi kolmesta koski myymälävarkauksia. Taskuvarkauksia eli yksityisomaisuuden varkauksia henkilöltä käsiteltiin noin 1 100. Ajoneuvosta varastettua yksityisomaisuutta koskevia syytteitä oli vajaat 700. Näistä monissa oli varastettu polttoainetta autosta.

Palveluiden eli esimerkiksi sähkön tai veden varastamista koskevia syytteitä oli parikymmentä.

”A on anastanut tuntemattomaksi jääneen omistajan Jopo-polkupyörän, joka on löydetty hänen hallustaan”

Polkupyörävarkauksia (tai niiden osien varkauksia) käsiteltiin vajaassa 700 syytteessä (kuvio 1). Jopo-varkauksia käsiteltiin noin sadassa syytetekstissä. Polkupyörävarkauteen syyllistyneillä oli taustalla myös muita varkausrikoksia sekä esimerkiksi huumausainerikollisuutta.

Kuvio 1. Anastettua omaisuutta 2019
Kuvion keskeinen sisältö on kuvattu tekstissä.
Lähde: Tilastokeskus, Syytetyt, tuomitut ja rangaistukset -tilasto

Noin kolmasosassa eli 5 000 myymälävarkaustapauksessa oli varastettu alkoholia. Vajaassa 300 myymälävarkaustapauksessa oli maininta, että tuomittu oli varustautunut jonkinlaisella foliovuoratulla kassilla hälyttimien hämäämiseksi. Runsaassa 50 tapauksessa oli puolestaan maininta, että tuomittu oli varustautunut magneetilla hälyttimen poistamiseksi.

Alkoholia varastettiin myymälöistä niiden aukioloaikoina, mutta myös murtorikosten yhteydessä.

”A on yhdessä toisen henkilön kanssa anastanut Y-kadulla sijaitsevasta kioskista B Oy:n irtainta omaisuutta. Vastaajat ovat ottaneet kadulta mukaansa liikennemerkin ja kantaneet sen yhdessä kioskin eteen. Tämän jälkeen vastaajat ovat päättäneet rikkoa liikennemerkillä kioskin ikkunan ja anastaa sieltä alkoholia. Toinen henkilö on rikkonut ikkunan, mennyt ikkunasta sisään kioskiin ja anastanut sieltä ainakin kuusi alkoholijuomaa. Tämän jälkeen vastaajat ovat jatkaneet yhdessä matkaa X suuntaan, jonka läheiselle kalliolle he ovat menneet nauttimaan anastamiaan oluita ja josta poliisi on heidät ottanut kiinni. Vastaajat ovat menettelyllään aiheuttaneet asianomistajalle taloudellista vahinkoa.”

Polttoainevarkauksista oli kyse miltei 2 000 tapauksessa. Osassa polttoainevarkauksia oli ensin otettu ajoneuvo luvatta käyttöön tai varastettu se ja sen jälkeen tyhjennetty polttoaine tankista. Myös huoltoasemalla tankkaaminen ja maksamatta jättäminen olivat yleisiä.

” A, B, C ja D ovat yhdessä anastaneet E omaisuutta ottamalla ensin luvattomasti käyttöönsä osoitteessa Y pysäköitynä olleen E:n omistaman henkilöauton tunkeutumalla ajoneuvoon ikkunalasin rikkomalla ja rikkomalla virtalukon ajoneuvon käynnistämiseksi. Tekijät ovat kuljettaneet ajoneuvon Z sillan alle, jossa he ovat anastaneet ajoneuvosta polttoaineen. Anastettu omaisuus on jäänyt kateisiin ja teosta on aiheutunut murtovahinkoja. A on ollut teon tehdessään alle 18-vuotias.”

Kyseinen rikos on ICCS-luokituksella yksityisomaisuuden varkaus ajoneuvosta. Tässä tapauksessa syyte on tullut osalle tekijöistä myös moottoriajoneuvon käyttövarkaudesta.

Työkaluja ja rakennustarvikkeita varastetaan työmailta, yrityksien ajoneuvoista sekä yksityishenkilöiden varastoista. Kupariputkia ja muita kuparitarvikkeita mainittiin vajaassa sadassa tapauksessa.

Omaisuuslajien määrät ovat vain suuntaa antavia, sillä ne on haettu sanahakuina tekstistä käyttämällä yleisiä hakusanoja. Yhdellä rikoksella on voitu viedä useampia esineitä.

Murtokeikat nuorten hommia

Yleisin ikä tuomituilla oli 19 vuotta (taulukko 2). Sen ikäisiä tuomittuja oli yhteensä 1 100, joista miehiä 800. Seuraavaksi eniten oli 27-vuotiaita. Heitä oli runsaat 900, joista 800 miehiä.

Taulukko 2. Syyksiluetut varkausrikossyytteet ikäluokittain 2019
  15–17 18–20 21–24 25–29 30–39 40+     Yhteensä
Yhteensä 760 2 860 2 880 4 260 7 370 5 250 23 380
0501 Murto 110 390 320 380 550 410 2 170
05011 Murto liiketilaan 80 190 180 160 320 220 1 150
05012 Murto yksityiseen asuintilaan 30 180 130 210 210 160 920
05013 Murto julkiseen tilaan, 05019 Muu murto 10 20 10 10 30 30 100
0502 Varkaus 650 2 470 2 560 3 880 6 820 4 840 21 220
05021 Moottoriajoneuvon tai sen osien varkaus 80 220 170 200 500 180 1 350
05022 Yksityisen omaisuuden varkaus 140 590 480 680 1 090 630 3 610
050221 Yksityisen omaisuuden varkaus henkilöltä 60 130 130 190 310 270 1 080
050222 Yksityisen omaisuuden varkaus ajoneuvosta 30 240 90 90 170 70 690
050229 Muu yksityisen omaisuuden varkaus 60 220 270 400 600 300 1 850
05023 Liikeyrityksen omaisuuden varkaus 430 1 640 1 900 2 980 5 170 3 990 16 110
050231 Myymälävarkaus 380 1 190 1 520 2 650 4 550 3 530 13 810
050239 Muu liikeyrityksen omaisuuden varkaus 50 460 370 330 620 460 2 300
05024 Julkisen omaisuuden, 05026 Palveluiden, 05029 Muun omaisuuden varkaus 0 10 20 20 60 40 150

Lähde: Tilastokeskus, Syytetyt, tuomitut ja rangaistukset -tilasto

Nuorista 15–20-vuotiaista tuomituista noin 14 prosenttia oli syyllistynyt murtorikokseen. Sen sijaan yli 40-vuotiaista tuomituista alle 8 prosenttia oli syyllistynyt murtorikokseen.

Alle 21-vuotiailla myymälävarkauksien osuus tuomioissa on alle 45 prosenttia, mutta yli 40-vuotiailla niiden osuus on lähes 70 prosenttia.

Murtorikoksista tuomituista 88 prosenttia oli miehiä. Varkauksista tuomituista 76 prosenttia oli miehiä. Tuomituista naisista kolme neljästä tuomittiin myymälävarkaudesta ja 10 prosenttia yksityisen omaisuuden varkaudesta. Miehistä myymälävarkaudesta tuomittiin 60 prosenttia ja yksityisomaisuuden varkaudesta 17 prosenttia.

Murrosta vankeutta, myymälävarkaudesta sakkoja

Varkausrikos, luvaton käyttö tai moottorikulkuneuvon käyttövarkaus oli tuomion päärikos kaikkiaan 8 800 tapauksessa. Näistä tuomioista 80 prosenttia oli sakkotuomioita.

Yksityiseen asuntoon tehdystä murrosta selvisi sakoilla runsaat 10 prosenttia tuomituista (kuvio 2). Tämä saattaa johtua siitä, että ICCS-luokituksessa murroksi lasketaan myös harhauttamalla asuntoon ”tunkeutuminen”.

Kuvio 2. Rangaistukset päärikoksittain 2019
Kuvion keskeinen sisältö on kuvattu tekstissä.
Lähde: Tilastokeskus, Syytetyt, tuomitut ja rangaistukset -tilasto

Sakkotuomioiden suuri osuus selittyy sillä, että lähes 60 prosenttia tuomioista tuli näpistyksestä, josta voidaan tuomita vain sakkoon.

Tuomioon vaikuttaa myös henkilön muu rikoshistoria. Vuonna 2019 noin 7 000 henkilöllä oli syyksiluettuja varkausrikoksia. Nämä runsaat 7 000 henkilöä olivat tuomiotietojen mukaan syyllistyneet yhteensä lähes 53 500 rikokseen. Eli harva oli syyllistynyt ainoataan yhteen tekoon. Yleisimmin oli syyllistytty useisiin varkausrikoksiin, mutta erilaisia huumausainerikoksia oli myös noin 5 000. Huumeiden käyttöä on mahdollisesti rahoitettu varkausrikoksilla.

Varkausrikoksien tarkempi luokittelu auttaa ymmärtämään tuomioiden vaihtelua: suurenkin rahasumman varastaminen henkilöltä mielletään yleensä vähemmän törkeäksi kuin asuttuun asuntoon murtautuminen. Tämä nähdään myös kuviosta 2. Toki taustalla vaikuttaa myös henkilön muu rikollisuus.

Eri ikäiset tekevät myös erityyppisiä varkausrikoksia. Nuorilla murtorikosten osuus on suurempi kuin vanhemmilla tekijöillä.

Alkoholivarkaudet ovat tunnettu ilmiö, mutta niiden määrä on silti yllättävän suuri. Toinen yllättävä varkauskohde on polttoaine. Toki nämä voivat olla sellaisia varkaustyyppejä, jotka on helpompi selvittää ja joista jää helpommin kiinni.

Näe metsä puilta – kuinka teksti luokiteltiin

Syyttäjän teonkuvausteksti on lyhyt kuvaus siitä, mitä rikoksessa on syyttäjän mukaan tapahtunut. Kyseessä ei ole varsinainen tuomioteksti. Kuvauksien pituus vaihteli yhdestä lauseesta useisiin kymmeniin. Vuoden 2019 teonkuvausteksteistä poimittiin suomenkieliset kuvaukset varkausrikoksista: varkaus, törkeä varkaus ja näpistys sekä niiden yritykset (RL 28:1-3).

Aineistoon tuli yhteensä noin 23 600 teonkuvaustekstiä. Näistä valittiin rikostyyppien osuuksilla painottaen satunnaisesti runsaan 2 000 kuvauksen otos, joka luokiteltiin käsin kansainvälisen rikosluokituksen (ICCS) mukaisiin varkaus- ja murtoluokkiin (ICCS 0501 ja 0502 alakohtineen).

Esimerkiksi julkisiin tiloihin kohdistuneita murtoja (ICCS 050130) tai palveluiden varkauksia (050260) oli aineistossa vain muutamia. Näiden rikostyyppien määrää kasvatettiin tekemällä tekstihakuja, joiden avulla aineistosta poimittiin lisää luokiteltavia kuvauksia. Näin muodostettu 2 100 havainnon otos jaettiin opetus- ja testiaineistoiksi 75/25 suhteella.

Koneoppimismalli tehtiin R-ohjelmistolla, ja suomenkieliset tekstit purettiin sanojen perusmuotoihin eli jokainen kuvausteksti purettiin yksittäisiksi sanoiksi ja sanoista otettiin perusmuoto eli lemma. Lisäksi tekstistä poistettiin välimerkit, numerot, pronominit ja konjunktiot, joita ei tässä analyysissa koettu tarpeelliseksi.

Lopulliseksi koneoppimisalgoritmiksi valikoitui satunnaismetsä (Random Forest). Mallin parametrit haettiin ristiinvalidoinnilla ja vinoutunut otos huomioitiin painottamalla harvinaisempia luokkia. Koko mallin tarkkuus (accuracy) oli 78,9 % mitä voi pitää luonnollisen kielen luokittelussa varsin hyvänä. Joidenkin luokkien kohdalla päästiin testiaineistossa yli 90 prosentin sensitiivisyys ja spesifisyysarvoihin.

Sensitiivisyys kuvaa mallin kykyä tunnistaa ”positiiviset” eli luokkaan kuuluvat arvot ja spesifisyys kykyä tunnistaa luokkaan kuulumattomat eli ”negatiiviset” arvot. Tällaisia hyvin tunnistettuja luokkia olivat esimerkiksi myymälävarkaus (ICCS 050231) ja yksityisen omaisuuden varkaus henkilöltä (ICCS 050221).

Toisaalta joidenkin harvinaisempien luokkien, kuten julkisen omaisuuden varkauden (ICCS 050240), kohdalla sensitiivisyys oli vain 15 prosenttia. Sen sijaan spesifisyys oli 99 prosenttia. Testiaineistossa oli seitsemän tähän luokkaan kuuluvaa havaintoa, ja näistä malli ennusti vain yhden kuuluvaksi kyseiseen luokkaan. Toisaalta malli ennusti tähän luokkaan kaksi havaintoa, jotka eivät todellisuudessa siihen kuuluneet.

Luokittelu tehtiin myös lineaarisella tukivektorimallilla (Support Vector Machine). Tukivektorimalli pärjäsi hieman satunnaismetsää huonommin ja sen tarkkuus oli 74 prosenttia. Mallin ennustekyky oli huonompi etenkin harvinaisempien luokkien kohdalla.

Valmiiksi luokiteltua aineistoa kasvattamalla päästäisiin todennäköisesti parempaan lopputulokseen, mutta aineiston luokittelu ”käsin” vie myös aikaa. Onko oheinen kuvaus yritys- vai yksityisomaisuuden varkaus:

A ja B ovat yhdessä anastaneet yritys C:n, (yksityishenkilöiden) D:n, E: ja F:n omaisuutta X sijaitsevista C:n tiloista ja pakettiautosta syytekohdassa 1 kuvatun teon yhteydessä. A ja B ovat anastaneet C:n omistamia autonavaimia, työkaluja, elektroniikkaa ja alkoholijuomia, D: omistamia vaatteita ja kassin, E:n omistamia vaatteita, makuupussin, alkoholijuomia ja kassin sekä E: omistamia kalastusvälineitä, vaatteita, elektroniikkaa, retkeilyvarusteita, auton varaosia ja autonavaimet.”

Teot on pyritty luokittelemaan törkeyden mukaan tai sen mukaan, mitä siinä on ensimmäisenä kuvattu. Tässä on kuvattu yritysomaisuuden varkautta.

Tilastotuotantoon?

Vaikka malli ei pääse täydelliseen tarkkuuteen, on sen tuoma lisätieto hyödyllistä tilastoinnin kannalta. Yli 20 000 syytetekstin joukkoon mahtuu monenlaista eri tekoa, ja näihin on nyt saatu hieman enemmän jaottelua pelkän rikoslain kohdan lisäksi.  

Koneoppimismenetelmän voisi ottaa lähitulevaisuudessa mukaan myös normaaliin tilastotuotantoon tuomaan tarkempaa tietoa rikosnimikekohtaisen luokittelun oheen. Tarkempaa tietoa voisi tuottaa esimerkiksi pahoinpitelyn tekotavasta tai -paikasta, tai vaikka ympäristörikoksista. Sitä varten prosessia pitää kuitenkin vielä kehittää.

 

Kirjoittajat työskentelevät yliaktuaareina Tilastokeskuksen Tieto- ja tilastopalvelut osastolla. Kimmo Haapakangas vastaa Rikos- ja pakkokeinotilastosta, Salla Tuominiemi Syytetyt, tuomitut ja rangaistukset -tilastosta.

Lue samasta aiheesta:

Blogi
17.11.2023
Kimmo Haapakangas

Ulkomaalais­taustaisten osuus alle 18-vuotiaiden nuorten tekemistä ryöstöistä ja pahoin­pitelyistä on noussut isoissa kaupungeissa, niin myös osuus nuorista. Määrällisesti pienen joukon tekemiset pilaavat enemmistön maineen.

Artikkeli
9.6.2023
Kimmo Haapakangas, Markus Kaakinen

Ryöstöistä ja pahoinpitelyistä epäillyt ovat vuodesta 2019 alkaen jälleen lisääntyneet kaikissa alle 21-vuotiaiden ikäryhmissä. Alle 15-vuotiailla vakavien rikosten osuus on kasvanut. Nuorten ryhmissä tekemät väkivaltarikokset ovat olleet jonkin verran yleisempiä pääkaupunkiseudulla, mutta laajemmin nuorten rikosten taustalla ei ole havaittavissa aiempaa suurempia ryhmiä taikka siihen viittaavaa systemaattista muutosta.  

Blogi
1.12.2022
Markus Korhonen, Anna Mustonen

Ensi vuoden alussa toimintansa aloittavat hyvinvointialueet tuovat paitsi muutoksia kansantalouden tilinpidon tilastojulkaisuihin myös epävarmuutta muutosvaiheen tilastotietoihin. Ensimmäisen kerran uutta sektoriluokitusta käytetään kesäkuussa 2023 julkaistavassa Julkisyhteisöjen tulot ja menot neljännesvuosittain -tilastossa.

Artikkeli
11.4.2022
Kimmo Haapakangas, Matti Näsi, Marjut Pietiläinen

Lähisuhdeväkivalta ei erityisesti lisääntynyt ensimmäisenä koronavuonna, kertovat poliisin tietoon tulleisiin rikoksiin pohjautuvat tilastot. Uhreista suurin osa oli naisia. Rikosuhritutkimuksen mukaan väkivaltakokemukset ovat koronarajoitusten myötä vähentyneet. Kevään 2020 koronatilanne heijastui osin vastaajien kokemuksiin parisuhdeväkivallasta.

Artikkeli
10.5.2021
Mika Ronkainen

Tilastokeskuksen rakennusten ja asuinolojen tilastoissa otetaan toukokuussa 2021 käyttöön Rakennusluokitus 2018. Uudessa luokituksessa myös erityisryhmien asuminen lasketaan osaksi asuinrakennuksia. Samalla kesämökkien laskentatapa uudistuu. Suomen kymmenen mökkirikkainta kuntaa säilyvät samoina, mutta niiden keskinäinen järjestys hieman muuttuu.

tk-icons