Tekoäly viestin luotettavuuden arvioitsijana

New Yorkin entinen kaupunginjohtaja Rudy Giuliani vetosi heinäkuussa 2016 äänestäjiin sanomalla, että kansalaiset kokevat turvattomuutta Yhdysvalloissa ja toivoi Donald Trumpin tekevän Yhdysvalloista turvallisen jälleen. Paradoksi oli siinä, että väkivaltatilastojen mukaan rikollisuus ei aiemmin ole ollut niin alhaisella tasolla kuin Giulianin puheen aikoihin. Esimerkiksi Ronald Reaganin presidenttikauden lopussa murhia tehtiin huomattavasti enemmän kuin nykyisin.

Millainen viesti sitten on luotettava? Tähän kysymykseen keskitymme ”Tekoäly viestin luotettavuuden arvioitsijana” –tutkimuksessa. Eri intressiryhmät kehystävät viestinsä emotionaalisesti siten, että se aktivoi ihmisiä tehokkaasti. Riippumatta viestin sisällöstä, emotionaalisesti kehystetty viesti vetoaa ihmisiin voimakkaammin kuin faktapohjainen viesti. Aiemmin on tutkittu viestien suosiota niiden emotionaalisen sisällön ja rakenteellisten seikkojen perusteella. Tässä tutkimuksessa sitä vastoin tarkastelemme viestejä niiden luotettavuuden perusteella. Tieteenfilosofi ja kognitiotieteilijä Paul Thagardin koherenssiteorian keskeinen oletus on, että ihminen rakentaa ymmärrystään maailmasta tukeutumalla abduktiiviseen päättelyyn. Se, millaista informaatiota yksilöt ja ryhmät käyttävät päättelyssään, erottaa pätevän ja epäpätevän päättelyn toisistaan. Mielenkiintoisia kysymyksiä ovat, eroavatko luotettavat viestit samalla tavoin rakenteeltaan epäluotettavista viesteistä? Sisältävätkö luotettavat viestit enemmän tieteellisen päättelyn aineksia kuin epäluotettavat viestit? Mitkä piirteet ovat tyypillisiä epäluotettaville viestille?

Vaikka tekoälyn mahdollisuudet ovat lähes rajattomat, emme pärjää ilman ihmisten tekemää arviota tekstien luotettavuudesta. Ensimmäisessä vaiheessa poimimme lehdistä, blogikirjoituksista ja muusta Internet-materiaalista runsaan joukon erilaisia ruuan terveellisyyttä käsitteleviä tekstejä ja pyydämme opiskelijoita arvioimaan tekstien luotettavuutta niiden sisällön perusteella. Analysoimme opiskelijoiden vastaukset ja muodostamme opetusaineiston tekoälyn kouluttamista varten. Tavoitteena on tekoälyohjelma, joka pystyy arvioimaan tekstien luotettavuutta ihmisten antamien arvioiden pohjalta.

Rakennamme tekoälyohjelman soveltamalla koneoppimismenetelmiä ja tekstianalyysiä. Tekoälyn opettaminen on periaatteessa suoraviivaista. Tekoälyohjelma ”lukee” osan teksteistä sekä niille annetut luotettavuusarviot, jonka jälkeen se arvioi luotettavuuden lopuille teksteille. Näitä arvioita verrataan ihmisten antamiin arvioihin ja näin saadaan selville, miten hyvin tekoälyohjelma onnistuu tehtävässä. Tekoälyohjelma pyrkii löytämään teksteistä sellaiset keskeiset piirteet, jotka erottavat luotettavat ja epäluotettavat tekstit toisistaan. Tämän jälkeen ohjelmaa kehitetään mm. muokkaamalla oppimisalgoritmeja, lisäämällä räätälöityjä piirteitä ja optimoimalla mallin parametreja. Tutkimuksen tässä vaiheessa meillä on aineisto, jonka perusteella voimme arvioida, millaisia piirteitä luotettavaan viestiin sisältyy. Mielenkiinnolla odotamme, kuinka hyvin luotettavan tekstin sisältö ja rakenne vastaa Thagardin esittämiä kriteerejä pätevälle päättelylle. Lisäksi odotamme, että löydämme myös uusia piirteitä, jotka ovat tyypillisiä luotettaville teksteille. Tällä tavoin saamme uutta tietoa siitä, millainen on luotettava viesti suhteessa epäluotettavaan viestiin.

Tutkimuksen keskeinen tavoite on tekoälyohjelman versio 1.0, joka osaa erottaa luotettavat tekstit epäluotettavista. Vuoden 2018 aikana selviää, miten hyvin ohjelmamme pärjää ihmiselle viestin luotettavuuden arvioinnissa.

Työryhmä:
Janne Kauttonen, FT, tutkija, NeuroLab, Laurea-ammattikorkeakoulu
Jenni Hannukainen, FM, tutkija, NeuroLab, Laurea-ammattikorkeakoulu
Jyrki Suomala, KT (dosentti), yliopettaja, NeuroLab, Laurea-ammattikorkeakoulu
Pia Tikka, TaT (dosentti), professori, Tallinnan yliopisto