Kun aloitin urani datan parissa 19 vuotta sitten, maailma näytti teknologian osalta kovin erilaiselta. Pilviteknologioita ei tunnettu, datamäärät olivat murto-osa nykyisestä ja datan prosessointi oli hidasta ja kallista. Tuntuu melkein uskomattomalta, miten valtavia harppauksia teknologia ja kehitysprosessit ovat ottaneet tämän jälkeen. Mutta kun katson loppukäyttäjien arkea tänään, huomaan, ettei siellä olekaan tapahtunut vastaavaa kehitystä.
Vaikka meillä on nykyään tehokkaat pilvialustat, ketterät kehitysprosessit ja koneoppimista hyödyntävät työkalut, loppukäyttäjät kamppailevat yhä tuttujen, vuosikymmeniä vanhojen kysymysten parissa:
- ”Mitä dataa meillä oikein edes on?”
- ”Voinko luottaa tähän dataan?”
- ”Ovatko nämä kaksi lukua edes verrattavissa?”
- Ja tietenkin: ”Kuka on oikeassa – talousosaston Excel vai analytiikkatiimin dashboard?”
Ironista kyllä, vaikka teknologian kehittäjät ja konsultit mainostavat uusia, entistä upeampia ratkaisujaan, loppukäyttäjän työpöydällä pyörivät edelleen samat Excelit, joiden parissa tuskailtiin jo vuosituhannen alussa. Ikään kuin teknologia olisi kehittynyt loppukäyttäjien ohi, eikä heidän hyväkseen.
On toki myönnettävä, että datan prosessointi ja data putkistojen kehitys ovat nopeutuneet dramaattisesti. Loppukäyttäjät saavat vastauksia entistä nopeammin, ja laskentatehon kasvun ansiosta voimme vastata myös aiempaa monimutkaisempiin kysymyksiin. Mutta mitä hyötyä tästä kaikesta on, jos lopputulos ei loppukäyttäjän näkökulmasta tuota arvoa?
Data Catalog -ratkaisut ovat yksi esimerkki tästä teknologia kuilusta. Muistan innostuneeni näistä ”metadatan buffet-pöydistä” ensimmäisen kerran vuosia sitten. ”Vihdoin jotain joka auttaa myös loppukäyttäjiä!” Mutta, kuten tiedämme, menneet lupaukset eivät ole tae tulevasta hyödystä. Toteutukset jäävät usein puolitiehen, metadata vanhenee käsiin ja loppukäyttäjä palaa lähtöruutuun: ”Onko tämä metadata edes ajan tasalla?”
Jokin siis menee pieleen. Teknologia etenee, mutta käyttökokemus laahaa jäljessä. Uskon, että ongelma on syvemmällä kuin yksittäisessä implementaatioissa. Teknologian sijaan ehkä pitäisikin keskittyä siihen, miten voimme varmistaa käyttäjien hyötyvän siitä kehityksestä, jota ala on kokenut. Meidän pitäisi miettiä, miten rakentaa loppukäyttäjälle selkeämpi reitti – roadmap – ei ainoastaan teknologian käyttöönottoon, vaan myös prosessien rakentamiseen niin, että uudet teknologiat tukevat liiketoiminnan tarpeita ja hyötyjä. Emme tarvitse enää pelkästään tehokkaampia koneita tai uusia järjestelmiä, vaan parempia ja luotettavampia reittejä tiedon luo. Selkeitä merkintöjä kartalle siitä, mistä löytyy mitäkin ja miksi sillä on merkitystä.
Kenen tehtäväksi tämä jää? Datainsinöörien? Liiketoiminnan? IT:n? Ehkäpä kaikkien yhdessä, mutta jonkun on silti omistettava kartta.
En usko, että tämä ratkeaa yhdellä suurella julistuksella. Näen sen arjessa: tiistaiaamuna joku etsii liikevaihdon määritelmää, torstaina toinen miettii, voiko tietyn datan yhdistää asiakkaiden segmentointeihin. Kun kukaan ei omista karttaa, jokainen piirtää oman.
Jos kaikki on kaikkien vastuulla, data jää orvoksi. Valitaan omistajat, sovitaan karttamerkit (terminologia, datamallit, laatukriteerit) ja mitataan arvoa sieltä, mistä se syntyy (päätösten laatu, säästetty työaika, pienentyneet riskit). Ohjataan arvoa FAIR-mittareilla (löydettävyys, saavutettavuus, yhteentoimivuus, uudelleenkäyttö). Arvo kertoo, pääsimmekö perille; FAIR on kompassi, jolla varmistetaan että pysymme reitillä. Kytketään “valmis” siihen hetkeen, kun loppukäyttäjä löytää, ymmärtää ja uskaltaa käyttää.
Ja kyllä, odotan jo innolla, että pääsen käymään nämä samat vanhat kysymykset läpi myös AI‑agenttien kanssa, sillä mistäpä nekään tietäisivät, jos emme me ensin piirrä niille karttaa. Siihen asti agentitkin lukevat talousosaston Exceliä.
Säde Haveri on Data Governance Manager RELEX Solutionsilla, DAMA Finlandin hallituksen jäsen ja yksi Helsinki Data Weekin perustajista, noin 19 vuoden kokemuksella metadatan hallinnasta ja data governance -strategioista.