Voiko sama data tarkoittaa eri asioita eri ihmisille – ja miksi? Miten kontekstit ja linssit vaikuttavat siihen, miten dataa tulkitaan suhteessa reaalimaailmaan? Entä mitä tapahtuu, kun tekoäly astuu mukaan ja vaatii osansa kontekstiymmärryksestä? Tässä artikkelissa tarkastellaan kontekstien näkyväksi tekemistä osana yhteisen kielen luomista tiedonhallinnan kontekstissa.
Kilpailukyky, federatiivinen lähestyminen dataan ja yhteinen kieli data governancen pohjana
Organisaatioiden kilpailukyky rakentuu yhä enemmän kyvystä hyödyntää dataa päätöksenteossa, toiminnan kehittämisessä ja vastuullisuuden osoittamisessa. Datan arvo ei kuitenkaan synny pelkästään sen olemassaolosta, vaan siitä, miten hyvin se heijastaa reaalimaailmaa ja miten eri toimijat kykenevät tulkitsemaan sitä omista näkökulmistaan. Tässä tulkinnassa konteksti on keskeisessä roolissa: sama data voi merkitä eri asioita tuotannolle, taloudelle tai vastuullisuudelle – ja jopa saman liiketoiminnon sisällä eri rooleille. Tiedonhallinnan viitekehykset tarjoavat työkaluja näiden kontekstien jäsentämiseen ja hallintaan.
Data governancea käsittelevässä väitöskirjassani kävin läpi erilaisia viitekehyksiä tiedonhallinnalle – myös DAMA DMBOKia –, ja toisaalta tarkastelin federatiivista, eli kontekstipohjaista, lähestymistapaa dataan. Minulle federatiivinen lähestymistapa tarkoittaa sitä, että datan syntyessä eri konteksteissa ja liikkuessa yhä uusien kontekstien ja käyttötarkoitusten läpi elinkaarensa aikana pyritään ymmärtämään nämä kontekstit ja niiden aiheuttamat erot datan ja toisaalta tosimaailman tulkinnoissa. Ei siis pakoteta dataa yhden totuuden malliin, vaan sallitaan ja tehdään näkyviksi konteksteista, eli eri linsseistä johtuvat erot. Artikkelin kuvassa olen esittänyt tämän ajatuksen Wandia ja Wangia (1996) mukaillen osana väitöskirjaani.
Eri viitekehykset tarjoavat rakennetta datan hallinnalle, mutta mielestäni yksikään viitekehys ei yleensä sellaisenaan sovellu yhteenkään organisaatioon. Tarvitaan soveltamista, yhteistä kieltä ja ymmärrystä organisaatiosta yleensä, ja organisaation eri osien välillä. Tiedonhallinnan periaatteiden, eli data governancen kannalta on tärkeää ymmärtää, mitä kaikkea dataa organisaatiossa on, syntyy ja käytetään; missä konteksteissa ja millaisilla reunaehdoilla. Näin voidaan rakentaa kokonaiskuva hallittavasta datasta, ja soveltaa viitekehystä kontekstien mukaisesti.
Tässä artikkelissa käsittelen kontekstien merkitystä tiedonhallinnalle: miten kontekstit vaikuttavat datan ja reaalimaailman suhteen tulkintaan ja toisaalta, miten tiedonhallinnan tuominen organisaation eri konteksteihin niiden omalla kielellä edesauttaa toimivan data governancen käytäntöön tuomista. Ja koska tekoälyä ei voi jättää mainitsematta, pohdin myös mitä uutta tekoäly tuo tähän ajatteluuni eri konteksteista tiedonhallinnassa.
Datan ja reaalimaailman välinen suhde eri konteksteissa

Datan tulisi kuvata reaalimaailmaa ja siinä tapahtuvia muutoksia mahdollisimman yksiselitteisesti. Datan pohjalta tulisi pystyä johtamaan ja ohjaamaan, sekä tietysti operoimaan liiketoimintaa. Kuitenkin havaintojen, tulkintojen ja järjestelmien kautta rakentuva suhde datan ja maailman välillä on kaikkea muuta kuin yksiselitteinen. Yllä olevassa kuvassa havainnollistetaan, miten käyttäjän näkökulmasta datassa voi esiintyä puutteita monista eri syistä, jotka kaikki liittyvät kontekstien tulkintaan.
Konteksti vaikuttaa siihen, mitä havaitaan, miten havaintoja tulkitaan ja miten ne esitetään tietojärjestelmissä. Esimerkiksi tuotannon kontekstissa sähkönkulutuksen data voi olla operatiivinen mittari, kun taas vastuullisuuden kontekstissa se voi olla osa hiilijalanjäljen laskentaa. Jos nämä kontekstit eivät ole eksplisiittisesti näkyvissä, syntyy riski väärinymmärryksille ja virheellisille johtopäätöksille.
Erityisen tärkeää kontekstien ymmärtäminen on sellaisen datan osalta, jota käytetään eri konteksteissa eri tarkoitukseen, esimerkkinä klassinen asiakkaan ostohistoriaa koskeva data:
- Markkinoinnissa se auttaa kampanjoiden kohdentamisessa
- Asiakaspalvelussa sen merkitys on tuentarpeen ymmärtämisessä
- Taloushallinnon kontekstissa ostohistoria liittyy laskutukseen tai kannattavuusanalyysiin.
Tiedonhallinnan viitekehyksen, esimerkiksi DAMA Wheelin eri osa-alueet tukevat näiden kontekstien välillä tapahtuvaa navigointia:
- Data governance -periaatteet auttavat määrittämään, kuka vastaa datan tulkinnasta missäkin kontekstissa ja kuka ja miten dataa saa käyttää – esimerkiksi vain laskutusta varten kerättyä dataa ei saa käyttää markkinoinnissa
- Metadatan hallinnan kautta tehdään näkyväksi missä kontekstissa data on kerätty ja mihin tarkoitukseen – esimerkiksi missä kanavassa asiakkaan ostotapahtuma on tehty
- Laadunhallinnassa määritellään, että ostotapahtumasta kirjattu data on riittävän laadukasta myös markkinoinnin kohdentamistarkoituksiin.
Koska nykyisin käytännössä kaikki organisaatiot toimivat monikontekstisissa ympäristöissä, on välttämätöntä, että tiedonhallinnassa tunnistetaan ja kuvataan nämä linssit, joiden läpi reaalimaailmaa tarkastellaan. Vasta silloin voidaan ymmärtää, miksi sama data voi näyttää erilaiselta eri käyttäjille, miksi jonkun mielestä toisen datassa on puutteita tai virheitä – ja miksi yhteinen kieli on välttämätön.
Lisäksi – tässä tulee se kontekstia toisella tapaa – olen työssäni huomannut, että tämä kontekstisidonnaisuus pätee myös tiedonhallintaan itseensä. Kun mille tahansa viitekehykselle perustuva tiedonhallintamalli tuodaan organisaatiossa käytäntöön, se on yleensä dataihmisten kynänjälkeä. Puhutaan erilaisista datatyypeistä, dataan liittyvistä rooleista ja vastuista sekä käytännöistä ja ohjeista. Liiketoiminnan edustaja, joka työssään käsittelee aivan toisenlaisia asioita, turhautuu ja siirtää tiedonhallinnan huomisen murheeksi. Jos kuitenkin on mahdollista tuoda pöydän ääreen kontekstien tulkitsija – tulkki – joka ymmärtää datan ja tiedonhallinnan lisäksi liiketoimintaa ja sen tavoitteita, mittareita ja tarpeita voi keskustelu muuttua hedelmällisemmäksi.
Käytännössä, kun käydään yhdessä läpi vaikkapa tärkeimpiä mittareita ja niihin liittyvää dataa, ja sitä miten vaikkapa DMBOKin mukaiset roolit, vastuut ja osa-alueet asiaan liittyvät, voi käydä niinkin, että tuotannon, talouden tai vaikka asiakaspalvelun ihminen aivan innostuu. Nämä eri linssin kautta tehdyt tulkinnat voi vielä kirjata yhteiseen sanastoon – vaikka datakatalogin business glossaryyn – ja tehdä siten näkyviksi muillekin.
Kontekstien linkittäminen, yhteisen ymmärryksen rakentaminen ja tekoälyn näkymä konteksteihin
Yksi tiedonhallinnan keskeisistä tehtävistä on kontekstien näkyväksi tekeminen ja niiden linkittäminen toisiinsa. Kun kontekstit ovat eksplisiittisesti kuvattuja, voidaan tunnistaa, missä kohtaa tiedon tulkinta muuttuu – ja miksi. Tämä auttaa rakentamaan siltoja eri liiketoimintojen välille ja tukee datan yhteiskäyttöä. Esimerkiksi vastuullisuusraportoinnissa tarvitaan tuotannon, hankinnan ja talouden dataa, mutta alun perin tämä data on toki peräisin aivan eri kontekstista. Tulkinta siis muuttuu, kun data siirtyy vaikkapa tuotannon järjestelmästä raportointitietokantaan.
Tekoäly tuo uusia mahdollisuuksia datan hyödyntämiseen, mutta samalla se nostaa esiin uusia vaatimuksia kontekstien hallinnalle. Jotta tekoäly voi tuottaa luotettavia ja relevantteja tuloksia, sen on kyettävä ymmärtämään, missä kontekstissa data on syntynyt ja mihin tarkoitukseen sitä käytetään. Tämä edellyttää:
- Selkeää, luokittelevaa metatietoa
- Kontekstuaalista mallinnusta
- Yksiselitteistä käyttöoikeuksien määrittelyä konteksteittain
- Ihmisen ohjausta
Ilman näitä tekoäly voi tehdä virheellisiä yleistyksiä tai tulkita dataa väärin. Esimerkiksi ennustemalli, joka ei ota huomioon tuotannon kausivaihtelua, voi johtaa harhaanjohtaviin suosituksiin.
Tekoälyn hyödyntäminen tiedonhallinnassa vaatii siis entistä parempaa kontekstien hallintaa. Se ei poista ihmisen roolia, vaan korostaa sitä: asiantuntijoiden tehtävänä on varmistaa, että tekoäly toimii oikeassa kontekstissa ja tuottaa arvoa organisaatiolle.
Kuka on paikalla, kun data kohtaa todellisuuden?
Datan ja reaalimaailman välinen suhde on monimutkainen ja kontekstisidonnainen. Organisaation kilpailukyky edellyttää, että tämä monimutkaisuus tunnistetaan ja hallitaan organisaation jokaisella tasolla. Tiedonhallinnan viitekehykset – DAMA DMBOK mukaan luettuna – tarjoavat välineitä kontekstien jäsentämiseen, mutta niiden hyödyntäminen vaatii dialogia ja yhteistä kieltä. Yhteisen ymmärryksen rakentaminen ei ole vain tekninen tehtävä, vaan myös kulttuurinen.
Kontekstien näkyväksi tekeminen ja linkittäminen tukee datan yhteis- ja uudelleenkäyttöä, parantaa päätöksenteon laatua ja mahdollistaa tekoälyn hyödyntämisen vastuullisesti. Tiedonhallinnan asiantuntijoilla on keskeinen rooli tässä työssä – ei vain teknisinä toteuttajina, vaan yhteisen ymmärryksen rakentajina.
Lähteet:
- Nokkala, Tiina (2020). Governance of Platform Data: From Canonical Data Models to Federative Interoperability. Turun yliopiston julkaisuja. Sarja E, Oeconomica; nro 63. Turun kauppakorkeakoulu. Saatavilla: https://www.utupub.fi/handle/10024/150244
Wand, Y., & Wang, R. Y. (1996). Anchoring data quality dimensions in ontological foundations. Proceedings of the 1996 International Conference on Information Quality (IQ ’96), ACM. Saatavilla: https://doi.org/10.1145/240455.240479
Tiina Nokkala – KTT & Senior Data Advisor – työskentelee data governancen, tiedonhallinnan viitekehysten ja ESG-datan parissa. Hän on tehnyt data governancea käsittelevän väitöskirjan ja toimii rajapinnassa, jossa liiketoiminnan kontekstit ja tiedonhallinnan periaatteet kohtaavat. Tiina on DAMA Finlandin hallituksen varajäsen ja edistää suomenkielisen DAMA-sanaston tuottamista.