tech
Mikko Harju

Älykkäämpää kuittien käsittelyä tekoälyn avulla

Kuittien käsittely saattaa äkkiseltään kuulostaa pieneltä operatiiviselta yksityiskohdalta. Kun kuitteja käsitellään eri yrityksiltä, eri muodoissa ja eri kielillä – kyse on kuitenkin nopeasti merkittävästä liiketoiminnan tehokkuuteen vaikuttavasta tekijästä.

Samaan päätelmään oli päätynyt myös pitkäaikainen asiakkaamme Taksikuutio, jonka toiminnan ydintä ovat taksiyritysten ja julkisen liikenteen toimijoiden taloushallinnon palvelut. Tältä pohjalta heidän järjestelmiensä on kyettävä lukemaan ja tulkitsemaan taksikuitteja useista eri lähteistä.

Sekä asiakkaat että kuljettajat tekevät kulukorvaushakemuksia eri tilanteissa, ja lähettävät tätä varten kuvan käsiteltävästä kuitista. Näiden kuvien muoto jo laatu vaihtelevat suuresti: teksti on usein haaleaa ja asettelu mitä sattuu.

Aluksi näytti siltä, että kuitteihin liittyvät haasteet voitaisiin ratkaista perinteisillä jäsentämismenetelmillä. Mutta kuten kaikki kuittien kanssa vähänkään työskennelleet tietävät, tämä lähestymistapa muuttuu nopeasti työlääksi ja turhauttavaksi.

Perinteinen tapa automatisoida tekstin poimintaa on käyttää säännöllisiä lausekkeita; sääntöjoukkoja, jotka etsivät tekstistä määrättyjä lainalaisuuksia. Tämä toimii mainiosti, kun käsiteltävät formaatit ovat yhdenmukaisia. Tämä ei kuitenkaan toteudu kuittien maailmassa: kymmenien kuittipohjien ja asettelujen kanssa jokainen uusi muoto tarkoittaa uusia poikkeuksia. Järjestelmän ylläpito muuttuu nopeasti virheiden ja korjausliikkeiden noidankehäksi.

Taksikuutio ei halunnut vajota tähän sudenkuoppaan: he tarvitsivat ratkaisun, joka pystyisi käsittelemään suuren määrän variaatioita joustavasti.

Kaaoksesta järjestykseen

Alati kasvavien yksittäisten poikkeustapausten sijaan päätimme opettaa järjestelmän tekemään näkemästään älykkäitä tulkintoja. Työ alkoi optisen tekstintunnistuksen (OCR) avulla, jossa raakateksti erotettiin kuittikuvista. Tämän jälkeen syötimme tekstidatan suurelle kielimallille, joka osasi tunnistaa esimerkiksi yrityksen nimen, ALV-numeron sekä sen, missä loppusumma ja veron osuus sijaitsevat – ilman erillisiä sääntöjä jokaista mahdollista kuittipohjaa varten.

Tulosten luotettavuuden varmistamiseksi määrittelimme selkeän tietomallin, jota hyödyntäen tekoäly täytti mahdollisimman monta kenttää OCR-tekstin perusteella ja tuotti siistin, jäsennellyn lopputuloksen.

Ero aiempaan oli heti valtava. Hauraisiin sääntöihin perustuneiden skriptien sijaan Taksikuutiolla on nyt käytössään yksi älykäs prosessi, joka osaa mukautua nykyisiin ja tuleviin kuittityyppeihin ilman lisätyötä koodareilta.

Vaikutus liiketoimintaan

Uusi järjestelmä vähensi manuaalista työtä ja teki tietovirroista luotettavampia. Virhemäärät laskivat, ylläpito helpottui ja yritys pystyi käsittelemään merkittävästi enemmän kuitteja ilman lisäkehityskustannuksia.

Toisin sanoen: muunsimme aiemmin monimutkaiseksi kasvaneen sääntöpohjaisen prosessin joustavaksi järjestelmäksi, joka palvelee Taksikuutiota pitkälle tulevaisuuteen.

Projekti heijastelee samalla laajempaa muutosta siinä, miten AI-työkalut vaikuttavat automaation suunnitteluun. Sen sijaan, että yritettäisiin rakentaa manuaalisesti sääntöjä jokaista poikkeusta varten, voimme nyt luoda järjestelmiä jotka osaavat soveltaa oppimaansa. Tulevaisuudessa tämä mahdollistaa entistä kehittyneempien työkalujen rakentamisen, joiden käsissä arkisista lippulappusista voidaan kerätä liiketoiminnalle merkittävää dataa.

Mikko Harju

Teknologiajohtaja, jolla on syvällinen asiantuntemus ohjelmistokehityksestä ja uusista teknologioista. Hän jakaa käytännönläheisiä oivalluksia sekä konkreettisia esimerkkejä todellisista projekteista. Mikkoa inspiroivat erityisesti skaalautuvat ratkaisut, tekoäly ja nousevat teknologiatrendit.

Tietoa kirjoittajasta

Mikko Harju

Lisää blogikirjoituksia

Blogin etusivulle