Kun tekoäly ja ohjelmistorobotit yleistyvät tietotyössä, minkälaista osaamista tarvitaan ihmisiltä? Millaisia tiimejä ihmisistä ja tekoälystä rakentuu? Minkälaisia ovat työyhteisön kulttuuri ja toimintatavat? Kuka käskyttää ja ketä?

Tällaisia kysymyksiä lähdettiin pohtimaan Sytykkeen AI-huippuseminaarissa syyskuussa 2018. Näitä pohdittiin myös IT-kouluttajien huhtikuun 2018 seminaarissa “Tekoäly oppijan sisällä”. Tarjoan tässä artikkelissa synteesin keskustelun jatkamiseksi.

Koneäly ja koneoppiminen

Artificial intelligence eli AI suomentuu monella tavalla. Tekoäly on yleisin termi, mutta koneäly tai tukiäly tuovat kenties paremmin esiin sen vahvuudet ja heikkoudet. Mennään koneälyllä tässä artikkelissa.

Perinteisesti kun koneen pitää tehdä jokin “älykäs” toimenpide, ohjelmoija muuntaa vaatimusmäärittelyn koneen ymmärtämäksi ohjelmakoodiksi, jonka jälkeen kone osaa tehdä sen oikein. Olettaen että koodi tuli kirjoitettua oikein. Ja että ymmärrettiin todella se vaatimusmäärittely. Ja että se vaatimusmäärittely oli virheetön ja kuvasi todella sitä tavoiteltavaa lopputulosta. Monta mahdollisuutta mokata. Siksi ohjelmistojen tekeminen on niin vaikeaa – koska ihmisten välinen viestintä on vaikeaa.

Koneälyn tai tekoälyn tapauksessa algoritmia ei ole kirjoittanut ohjelmoija. Algoritmi, jolla kone ratkaisee tietyn tehtävän, on kehitetty koneoppimisen kautta. Erilaisia koneoppimisen algoritmeja on satoja, niistä ehkä tunnetuin on 1950-luvulta tuttu neuroverkko ja syväoppiminen 3+-kerroksisella neuroverkolla.

Huomasitteko, että algoritmi kehitti toisen algoritmin? Eli kun kone opetetaan vaikkapa erottamaan syöpä tavallisesta luomesta, se opetetaan valokuvilla. Käytettävä oppimisalgoritmi valitaan tilanteen ja materiaalin mukaisesti, vaikkapa CNN (convolutional neural network). Työlään ja raskaan koulutusprosessin jälkeen meillä on koulutettu tekoäly, jolla on sen itse kehkeyttämä algoritmi, jonka avulla se osaa erottaa syövät luomesta, ainakin jossain määrin.

Tätä algoritmia ei ihminen kirjoittanut, vaan kone. Sen vuoksi se ei useinkaan ole luettavissa tai ymmärrettävissä. Se toimii niin hyvin kuin toimii, mutta sitä ei voi helposti ymmärtää. Jokainen koodari tietää, että ihminenkin voi tehdä vaikeaselkoista lähdekoodia ihan laiskuuttaan, joten kun kone rakentaa itselleen päättelysääntöjä, niissä on hyvin vähän ihmiselle ymmärrettävää.

Kone siis voidaan kouluttaa suorittamaan tiettyjä tehtäviä. Hyvä. Mitäs ne ihmiset sitten tekevät?

Katsotaan seuraavaksi kolme roolia, jotka näen ihmisillä olevan tekoälykkäiden ohjelmistorobottien kanssa työskennellessään. Aloitetaan pyramidin huipulta ja edetään kohti yleisempiä rooleja.

Rooli 1: Tekoälytutkijat

Ne sadat erilaiset koneoppimismenetelmät eivät ole syntyneet itsekseen, eikä niitä myöskään koneäly osaa tehdä. Niihin tarvitaan huipputason tekijöitä, jotka hallitsevat matemaattisen ajattelun, tilastotieteen, matriisialgebran, algoritmisuunnittelun ja tietoverkkotopologian. Näitä ihmisiä toivottavasti kouluttautuu maamme yliopistojen tutkijakouluissa. Pääosa heistä myös työskentelee akatemiassa, joskin globaalit tekoälyalustat (Google, Amazon, Facebook, Alibaba) tarvitsevat yhä parempia koneoppimisen algoritmeja, joten kaupallisellakin puolella tekemistä riittää.

Rooli 2: Koneälyn kouluttajat

Jotta koneäly saadaan tekemään jotain liiketaloudellisesti hyödyllistä, on se melkein aina koulutettava tehtävään.

Joihinkin yleisiin tehtäviin saa pilvestä valmiiksi koulutettuja koneälyjä. Ääneen puhutun puheen tunnistaminen tekstiksi, tekstistä merkitysten tunnistaminen (NLP) sekä kuvien ja videoiden sisällön tunnistus ovat tällaisia yleispalveluita. Mutta oikeastaan kaikki muu oman firman bisnekseen liittyvä on sitten itse koulutettava.

Tiettyjä poikkeustapauksia lukuun ottamatta koulutukseen tarvitaan dataa – laadukasta dataa. Jotta kone voi oppia erottamaan syövän luomesta, on sille näytettävä satoja tai tuhansia valokuvia, jotka on siis (toivottavasti virheettömästi) luokiteltu ihmisten toimesta.

Koneälyn koulutustiimi on monialainen ja joutuu tekemään lujasti töitä. Työläin osuus on datan parsiminen ja normalisointi koneoppimiseen kelpaavaan muotoon. Yliopiston tilastotieteen peruskurssi ei riitä, vaan vaaditaan parempaa tilastollista ajattelua.

Datan kasaamisen rinnalla kokeillaan erilaisia koneoppimisen algoritmeja ja tuunataan niiden hyperparametreja, jotta koulutettu kone toimii mahdollisimman hyvin. Tähän tarvitaan ymmärrystä koneoppimisen toimintaperiaatteista, käytännön kokemusta lukuisista eri oppimisalgoritmeista, jonkin verran ohjelmointitaitoja ja IT-tukea.

Koneoppimistiimin on ymmärrettävä kohdealue perusteellisesti. Koulutusta ei voida ulkoistaa AI-firmalle, sillä AI-firman tekijät eivät ymmärrä, mihin tuloksia käytetään ja minkälaiset virheet ovat hyväksyttäviä ja mitkä taas liian kalliita. Siksi koulutusprosessissa on aina oltava kohdealueen asiantuntijat, jotka työskentelevät sekä datan että tulosten parissa. He ovat oman alansa ammattilaisia mutta ymmärtävät riittävästi datasta ja tilastoista voidakseen toimia tiimissä.

Kohdealueen ohella tarvitaan myös eettistä osaamista, eli ymmärrystä tulosten merkityksestä yhteiskuntaan ja ihmisiin. Etenkin vinoumien poistaminen on eettinen edellytys monella alalla, mutta lähes mahdoton tehdä puhtaasti.

Otetaan esimerkki: Jos rekrytointiyrityksen koneäly opetetaan tekemään rekrytointipäätöksiä aiempien päätösten perusteella, koneäly oppii myös aiempien päätösten ikään tai sukupuoleen kohdistuneen syrjinnän. Mutta miten CV:stä siivotaan pois ikä ja sukupuoli? Ansioluettelon pituus korreloi iän kanssa ja ammatit korreloivat sukupuolen kanssa. Vaikka ikä ja sukupuoli piilotettaisiin koneälyltä, älyää se silti oppia, mitkä CV:t hylättiin ja mitkä ei, ja löytää yhteneväisyyksiä uusissa näytteissä ja siten toimii yhtä syrjivästi kuin sitä edeltäneet ihmiset.

Datan kasautuessa voidaan konetta alkaa kouluttaa koe-erissä. Mahdolliset vinoumat ja puutteet toiminnassa edellyttävät sitten datan korjaamista ja algoritmin hyperparametrien säätöä. Koneälyn tuloksia pitää seurata ja mahdollisia virheitä korjata optimoinnilla.

Rooli 3: Koneälyn kollegat

Kaikki meistä ovat tässä roolissa tulevaisuudessa. Teet työtä työyhteisössä, jossa on ihmisälyjen lisäksi koneälyjä. Miten sen koneen kanssa käydään saunassa rentoutumassa? Ja voiko koneen ottaa sivuun ennen asiakastapaamista neuvoja varten? Ja kumpi neuvoo kumpaa?

Ihmisen työskennellessä koneen kanssa on ihmisen ymmärrettävä, missä kone on hyvä ja missä se on taitamaton. Ihmisen ja kone täydentävät toisiaan, paikaten toistensa heikkouksia.

Ihminen pystyy näkemään ja huomioimaan vain rajallisen määrän dataa päätöksiä tehdessään. Koneälyn vahvuus on siinä, että se pystyy ottamaan huomioon kaiken saatavilla olevan datan.

Ihminen voi väsyä, rasittua tai ihan vaan tehdä inhimillisen mokan. Koneäly ei väsy. Se tekee jokaisen syöpädiagnoosin yhtä tarkasti ja tasalaatuisesti.

Koneäly ei ymmärrä, mitä se tekee. Se ei ymmärrä kontekstia. Se tulee välillä tekemään kummallisia, epäinhimillisiä virheitä. Ihmisen on nähtävä nämä tilanteet ja päätettävä jatkosta, kun kone syystä tai toisesta ei olekaan hyödyksi. Kone siis pääsääntöisesti voi antaa suosituksia ja johtopäätöksiä datasta, mutta ihmisen vastuulla on toteuttaa tai hyväksyä päätökset.

Ihmisen ei pidä suhtautua koneälyyn kuin se olisi ylivertainen supernero. Ehkä terveempi suhtautuminen on ajatella koneälyä idiot savante -tyyppisenä korkeasuoriutuvana autistina, joka tekee sitä yhtä asiaa hämmästyttävän hyvin, mutta ei ymmärrä maailman menosta mitään.

Koneäly on se numeroita ja dataa murskaava ja analysoiva osapuoli, mutta älykäs tai viisas päätös tulee ihmiseltä.


Tarmo Toikkanen, Chief Science Officer, LifeLearn. Tarmo on pitkän linjan oppimisen ja teknologian design-tutkija, kouluttaja ja opettajankouluttaja.