22.06.2021  - Seppo Nyrkkö -  Analytiikka

Tekstianalytiikkaa SOTE-alan tarpeisiin

Sote-alan digitalisaation myötä digitaalista potilastietoa kerätään monista lähteistä; laboratoriotuloksista, lähetteistä, esitiedoista, aiemmista lausunnoista ja potilaan antamista taustatiedoista. Tietojärjestelmien kasvanut määrä on nostanut sote-alla esiin tarpeen automatisoida potilastietojen yhdistäminen eri lähteistä niiden kokonaisvaltaista tarkastelua varten.

Potilastiedot ja kliiniset termistöt lähestyvät toisiaan

Vuonna 2007 julkaistun kansainvälisen kliinisen SNOMED CT (Clinical Terminology) -termistön tavoitteena on, että potilastietoja kyetään tallentamaan koneellisesti käsiteltävään yhdenmukaiseen muotoon. Myös Suomi on mukana termistön käyttöönotossa liityttyään tätä ylläpitävän IHTSDO-järjestön jäseneksi syksyllä 2018. Tämä mahdollistaa asteittaisen siirtymisen aiempien kansallisten sairausluokitus- ja löydöskoodistojen vaihtelevasta käytöstä yhtenäiseen koodistoon ilman tiedon katoamista.

Uuden termistön myötä tietoja kyetään tallentamaan aiempaa runsaammin, kattavammin ja tarkemmin kuvauksin. Potilas voi lisäksi käyttää oman terveydentilansa seuraamiseen sovelluksia, jotka keräävät mittaustietoa lähetettäväksi terveydenhuollon avuksi. Potilastiedot jaotellaan rakenteellisiin, löydöksellisiin ja toimenpiteellisiin käsitteisiin. Jokainen tallennettu potilaan tieto yhdistyy tapahtuma-aikaan ja voi sisältää myös tapahtuman paikkatiedon.

Eri termistöt haltuun NLP:n ja ohjelmistorobotiikan avulla

Potilaiden tietoja liikkuu yhä enemmän eri sairaanhoitopiirien tietojärjestelmien välillä. Yhtenäisen termistön, koneoppimisen ja tekstianalyysin avulla potilaan tiedot saadaan yhdistymään oikein eri potilaskertomusjärjestelmien välillä. Luonnollisen kielen käsittelyn (NLP, Natural Language Processing) ja tekstianalyysin avulla on mahdollista tunnistaa eri lähteistä tulevaa aiempaa hoitotietoa ja ryhmitellä näiden sisältämiä termejä ja koodeja vastaamaan SNOMED CT -termejä.

Potilaan tietojen joukossa olevat lauseet voivat sisältää viittauksia esimerkiksi diagnooseihin ja terveystietoihin, jotka tukeutuvat erilaisiin diagnoositermistöihin ja näiden koodistoihin. NLP-tekoälyä voidaan kouluttaa tunnistamaan lausunto- ja läheteteksteistä termejä ja ilmauksia, joille löytyvät SNOMED CT -termistöstä vastaavat koodit. Uudella termistöllä täydennettynä on aiempi potilastieto tai tutkimustulos mahdollista löytää vaivatta, vaikka tietoa haettaisiin toisella kielellä tai vaihtoehtoisella termillä. Tämä palvelee potilastiedon tehokkaampaa luokittelua, priorisointia ja uudelleenlöytämistä. Esimerkiksi maissa, joissa on useampi kuin yksi virallinen kieli ja siten potilaskertomusten kieli voi vaihdella jopa saman henkilön eri potilaskertomusten tai tutkimustulosten välillä, tästä on erityistä hyötyä.

Monikielisyyttä muoto-opin kera

Termistön siirroksissa ei kohdetermistöstä aina löydy täydellisesti alkuperäistä vastaavaa termiä. Koneoppimisen avulla kehitetyt termitunnistimet tarjoavat sisällöllisesti samaa tarkoittavia ilmauksia, joista asiantuntija voi valita tapaukseen sopivan kooditunnisteen. Kielentunnistus ja tekstin muoto-opillinen analyysi auttavat löytämään uudesta termistöstä oikean tulkinnan sekä välttämään virheellisiä tulkintoja. Esimerkiksi tekstianalyysin käsittelemä ”Potilaan vakuutus maksaa laajat laboratoriotutkimukset” ei yhdistä tietoa maksatutkimukseen, koska se tunnistaa maksaa-sanan tässä verbiksi.

Ohjelmistorobotiikka tulee avuksi termistöjen siirrosvaiheessa, kun hyödynnetään tekstianalyysiä tunnistamaan ja pisteyttämään teksteistä asiasanoja ja termejä. Aiempia potilastietoja voidaan täydentää uuden termistön koodeilla tiedon löytämisen tehostamiseksi. Toimintoihin on lisättävissä myös läpinäkyviä esikäsittelysääntöjä: esimerkiksi tietyn termin esiintyessä voidaan suorittaa ennalta määritelty jatkokäsittely.

Ohjelmistorobotiikan toimintaa voidaan parantaa tekstianalytiikalla löydettyjen esimerkkien avulla, jolloin luokittelun tarkkuus kehittyy sen käytön myötä. Ohjelmistorobotiikka on avuksi myös uuden tiedon tallennuksessa, esimerkiksi käsiteltäviä lähetteitä voidaan ohjata eri teemakoreihin oikean asiantuntijan löytämiseksi.

Chattibotti ja tekstianalytiikka tehostavat sote-asiakasneuvontaa

Terveydenhuollon neuvontapalvelujen saavutettavuus on tärkeää myös ilta- ja yöaikaan, jolloin asiakaspalvelun tavoitettavuus on heikompaa. Esimerkiksi epidemia-aikana asiakasneuvonnan puhelinpalvelu ruuhkautuu helposti. Verkkosivujen chattibotit voivat tällöin toimia tehokkaasti apuna tiedon jakamisessa ja palvelun tavoittamisessa. Älykkään sisältöhaun ja chattibottipalvelun tarjoaminen madaltaa myös kynnystä itsepalvelun käyttöön. Hoidontarpeen arviointi ja asiantuntijan löytäminen itsepalveluna voi helpottua chattibotin kautta joko tekstimuotoisen tai puhumalla esitetyn tarkentavan kysymyksen avulla.

Chattikysymyksestä voidaan esimerkiksi tunnistaa hakusanoja, joiden kautta voidaan tarjota yleisesti tarjottuja itsehoito-ohjeita. Tekstianalyysilla voidaan löytää hakusanoja myös taivutetuissa ja väärin kirjoitetuissa muodoissa. Tämä auttaa löytämään esimerkiksi potilasohjeita käyttäjän omalla äidinkielellä. Suomenkielinen tekstianalyysi ei myöskään hämmenny taivutusmuodoista. Esimerkiksi kysymyksestä "Korvaako vakuutus leikkauksen?" poimitaan leikkaus-sana, mutta korvaako-sanaa ei tulkita erheellisesti korvaksi.

Aidon ihmiskontaktin tarpeeseen viittaavia ilmauksia voidaan tunnistaa automaattisesti, jolloin terveydenhuollon asiakaspalvelija voi liittyä keskusteluun. Chattibotti voi nopeuttaa sopivan terveydenhuollon asiantuntijan löytämistä asiakkaan käyttämän kielen ja esittämän aiheen mukaan, kun se tunnistaa asiakkaan yhteydenotosta käytettävän kielen ja mahdollisia asian tunnistesanoja.

Analytiikka neuvonnan avuksi

Tekstianalytiikan ja asiasanatunnistuksen avulla voidaan kerätä asiakkaiden kysymyksistä tietoa siitä, millaisia ohjeita asiakaspalvelusta haetaan. Chattibotti voi kerätä myös lomakemuotoisesti palautetietoa, josta voidaan tunnistaa usein esiintyvät aiheet. Palautteen aiheen ja sentimentti-ilmausten (positiivinen, neutraali tai negatiivinen sävy) luokittelu auttaa muodostamaan kokonaiskuvan asiakaskunnan toiveista ja tarpeista.

Mukautettuja chattibottiratkaisuja voidaan myös yhdistää reaaliaikaisiin tiedonlähteisiin ja palvelun analytiikkaan. Asiakas voidaan esimerkiksi ohjata hoitoon terveysasemalle, jossa parhaillaan on vähiten ruuhkaa, tai tarjota aluespesifiä tietoa esimerkiksi terveydenhuollon palvelupisteiden aukioloajoista.

Avuksi koneoppiminen ja digitaalisen kielentutkimuksen ammattilainen

Automaattinen luonnollisen kielen tekstianalyysi ei siis ole pelkkää jutustelua tietokoneen kanssa, vaan tarjoaa syvemmän analyysin tekstisisältöön. Tekstianalytiikan sovellukset perustuvat vuosikymmenten tieteelliseen työhön. Aureolis tarjoaa kehittyneitä tekstianalyysin ja ohjelmistorobotiikan ratkaisuja sote-ammattilaisten käyttöön ja auttaa tuomaan palveluja kansalaisten ulottuville. Avuksenne rientävät muun muassa data scientist, NLP-asiantuntija sekä data-analyytikko.