Näkyvyyden arviointi neuroverkon avulla kelikamerakuvasta

Kehitimme yhteistyössä Ilmatieteen laitoksen (FMI) tekoälyyn pohjautuvan teiden näkyvyyden arviointityökalun kelikameroiden kuvia hyödyntäen. Arviointiin käytettiin esimerkiksi pysäytyskuvia tiesääasemasta tai kelikameroista sekä videokuvaa auton kojelaudan kamerasta. Syväoppimista eli neuroverkkotekniikkaa käytettiin arvioimaan näkyvyyden tasoa kelikameratietojen ja kuvien avulla.

Tutkimuksen tarkoituksena oli luokitella havaittu näkyvyys kolmeen luokkaan: normaali, huono ja erittäin huono. Samalla selvitettiin näkyvyysluokkien kriteerit: lumisade, pilvisyys ja lumen tuiskuaminen/pöllymäinen tien pinnalla. Myös sateen (lumi- tai vesisade) tunnistamiseen käytettiin säähavaintoja. Meteorologisesta näkökulmasta erittäin heikko näkyvyys tarkoittaa, että vaakasuuntainen näkyvyys on 1000 metriä tai vähemmän. Huono näkyvyys ja jäinen kitkapinta ovat haastava yhdistelmä liikenneturvallisuuden kannalta.

Syväoppimisen ja neuroverkkojen soveltaminen

Nykyisin termejä tekoäly (Articial Intelligence), koneoppiminen (Machine Learning) ja syväoppiminen (Deep Learning) käytetään hyvin sekavasti. Käytimme tutkimuksessa syväoppimisen algoritmeja, tarkemmin ottaessa monikerroksisia neuroverkkoja tunnistamaan näkyvyyttä kuvista. Kone- ja syväoppimisalgoritmeja voidaan käyttää jonkin funktion likimääräisen mallin rakentamiseen, kuten kuvan näkyvyyden poimimiseen.

Tutkimuksessa käytettiin konvoluutioneuroverkkoja (Convolutional Neural Network) ennustamaan yhtä skalaaria (näkyvyyttä) neuroverkolle syötetystä kuvasta. Konvoluutioneuroverkot ovat yksi yleisimmin käytetyistä neuroverkkomalleista kuvantunnistuksessa ja muissa kuvapohjaisissa regressio-tehtävissä. Konvoluutioneuroverkkojen tärkein etu on kyky tunnistaa samat piirteet, esimerkiksi objektit, riippumatta niiden sijainnista kuvassa. Tutkimuksessa käytettiin useita erilaisia konvoluutioneuroverkkoja ja niiden erilaisia variaatioita. Kaikki koostuivat useista konvoluutiokerroksista (Convolutional Layer) ja koontikerroksista (Pooling Layer) ja jokaisessa verkossa oli myös kaksi täysin yhdistettyä kerrosta (Fully Connected Layer) lopussa. Kahdessa verkoista kuvan koko oli 192 x 192 pikseliä, kun kahdessa muussa 96 x 96 pikseliä. Suurempi kuvakoko antoi verkolle mahdollisuuden tunnistaa pienemmät ominaisuudet kuvasta helpommin. Lisäksi yksi verkko molemmista kuvan kokoluokista sisälsi jäännöskerrokset (Residual Layer) jokaisen konvoluutiokerroksen jälkeen. Nämä kerrokset paransivat ennustustarkkuutta pienellä määrällä, mutta vaikeuttivat verkon opetusta.

Epävarmuustekijän arviointi

Näkyvyyden ennustamisen lisäksi neuroverkosto yrittää arvioida omia vahvuuksiaan ja heikkouksiaan. Tämä suoritetaan toisella konvoluutiollisella neuroverkolla, joka toimii rinnakkain kuvan tunnistusverkon kanssa. Näin saadaan verkosta toinen ulostulo, epävarmuus, joka pyrkii mittaamaan verkon varmuutta näkyvyysennustuksesta. Epävarmuustekijä voi kuitenkin olla epätarkka itsessään: neuroverkko voi yli- tai aliarvioida omia kykyjään. Epävarmuuden arviointiverkko vakauttaa myös verkon koulutusvaihetta.

Opetusprosessi

Neuroverkon opettamiseen valittiin kuvatietokanta erilaisista näkyvyystilanteista. Pieni osa tätä tietokokonaisuutta otettiin arviointitietueeksi, jota käytettiin verkon suorituskyvyn arvioimiseen. Syötteenä verkolle käytettiin vain kuvaa: mitään muita muuttujia ei hyödynnetty näkyvyyden ennustamiseen.

Koska opetusjoukon koko on rajallinen, ylioppimisen välttämiseksi useita kuvien muokkaustekniikoita käytettiin opetusjoukon laajentamiseen. Työkaluja, kuten kuvien rajausta, pehmentämistä, pyöristämistä, kääntämistä, kontrastin säätöä ja satunnaisen kohinan lisäämistä käytetään muuttamaan alkuperäisiä opetusjoukon kuvia. Kaikki verkot koulutettiin Adam-optimointialgoritmilla oletusasetuksilla. Kaikki kerrokset käyttivät Rectified Linear Unit- aktivointifunktiota. Viimeisellä täysin yhdistetyllä kerroksella ei käytetty aktivointia.

Kuva 1. Eri näkyvyysluokitukset, jotka perustuvat kelikameroiden kuvien neuroverkko-analyysiin. Kuvassa a) Hyvän näkyvyys, b) Erittäin huono näkyvyys (lumisade), c) Huono näkyvyys (lumisade) ja d) Erittäin huono näkyvyys (lumisade).

Maantiekamerakuva-analyysit esitetään kuvissa 1a-1d. Vasemmalla puolella olevat prosentuaaliset arvot osoittavat suhteellisen näkyvyyttä, kun 100 tarkoittaa hyvää näkyvyyttä ja 0 erittäin huonoa näkyvyyttä. Yläosan prosentuaalinen arvo on keskimäärin neljä eri prosenttiarvoa, jotka on analysoitu käyttämällä eri neuroverkkotekniikkaa.

-Rantonen Mika, lehtori, Jyväskylän ammattikorkeakoulu, IT-instituutti, www.jamk.fi/tekoaly