Shrikant Joshi kuulee Kauppatorin ohittaessaan paljon eri kieliä.
Shrikant Joshi kuulee Kauppatorin ohittaessaan paljon eri kieliä.

Kieli kuntoon koneella

TEKSTI ja KUVA: Janne Luotola

Puheentunnistuksessa ja tekstin muotoilussa yhdistyvät insinöörin ja lingvistin taidot.

Tekoälyn käyttö kirjoittamisen, kääntämisen ja puheen litteroimisen apuvälineenä on yleistynyt parissa vuodessa. On kuitenkin käyttötarkoituksia, joissa luotettavuus on niin tärkeää, että yleinen kielimalli ei kelpaa työkaluksi.

Lingsoft kehittää kieliälyratkaisuja, käännöksiä ja lokalisointeja, tekstityksiä sekä litterointeja ja sisällönmuotoiluja. Asiakkaita on hallinnossa, terveydenhuollossa ja mediassa.

Yhteistä yhtiön palveluille on, että ne on mukautettu asiakkaan käyttötarkoitukseen ja koulutettu sopimuksen mukaan tämän omalla aineistolla. Kieltä käsittelevä algoritmikin räätälöidään tapauskohtaisesti.

– Ohjelma ei ole koskaan kerralla valmis, vaan sen käyttäminen ja tulosten viilaaminen parantavat jatkuvasti tuloksia, kertoo ohjelmapäällikkö Shrikant Joshi.

Komission työnkulut nopeutuvat

Lingsoft syventyy asiakkaan kontekstiin ja etsii työnkulkuja, joita voi automatisoida, nopeuttaa ja parantaa. Yhtiö on kehittänyt aiemmin pohjoismaisten kielten tarkistustyökaluja Microsoftin Office-pakettiin.

– Suosikkiprojektejani ovat olleet Euroopan komissiolle tehdyt työnkulut, koska opin hyvin paljon heidän kielen käytön prosesseistaan, Joshi kertoo.

Toisin kuin voisi kuvitella, Chat- GPT:n tai Microsoftin Copilotin kaltaiset yleiset kielimallit eivät ole varsinaisesti Lingsoftin kilpailijoita. Yleisten kielimallien toimintaperiaate on erilainen kuin räätälöityjen kieliratkaisujen.

– Yleiset kielimallit eivät ymmärrä kieltä vaan ennustavat seuraavia sanoja erilaisilla painotuksilla. Me tuomme kielen käsittelyyn semantiikan, kieliopin ja kontekstin, Joshi vertaa.

Lingsoftin tuotteet perustuvat pitkälti omaan koodiin, mutta tekoälysovelluksissa yhtiö hyödyntää avoimen lähdekoodin malleja ja painottaa kotimaista ja eurooppalaista kehitystyötä. Yhtiöllä on paikkoja auki tekoälykehittäjille.

Insinööri kiinnostui kielistä

Joshin osaaminen on yhdistelmä elektroniikkainsinöörin ja lingvistin kykyjä, jotka helpottavat kieliteknologiaan liittyvien projektien johtamista. Hän on kotoisin Intiasta ja äidinkieleltään marathin puhuja.

Suomessa hän seuraa auttavasti Ylen selkouutisia ja lyttää käsityksen suomesta vaikeana kielenä.

– Se on puhtaasti englanninkielisten näkökulma. Suomi on aika samantyyppinen kieli kuin intialaiset kielet ovat kielioppinsa ja muoto-oppinsa puolesta – eli ei niin vaikea intialaiselle.

Lingsoftin ohjelmat toimivat kaikilla EU:n virallisilla kielillä, joten eri kieliperheiden tuntemuksesta on hyötyä.

Eduskunta litteroi puheet

Eduskunnan kanslia otti tänä vuonna pysyvään käyttöön Lingsoftin päivitetyn puheentunnistuksen, joka kuuntelee eduskunnan täysistuntojen äänitallenteita ja kirjoittaa niistä kirjauskäytäntöjen mukaisia pöytäkirjoja.

Ratkaisu tekee aiempaa paremman virkejaon ja välimerkityksen, ja pöytäkirjatoimiston asiantuntijat viimeistelevät tekstin.

– Automaattiseen käsittelyyn kuuluu muun muassa puhekielisyyksien poisto, havainnollistaa projektipäällikkö Elina Manner.

Manner ohjaa useita puheentunnistus- ja konekäännöshankkeita. Eniten häntä työllistää Business Finlandin rahoittama Medallion, jossa kehitetään terveydenhuollon metaversumia eli virtuaalista työtilaa.

Kielimallin avulla tekoäly voi esimerkiksi tiivistää potilaiden potilaskertomuksia ja hoitohistoriaa, ja lääkärin ääneen lausumat muistiinpanot tallentuvat tekstinä reaaliaikaisesti järjestelmään. Vastaavaa tekniikkaa laajennetaan parhaillaan sosiaalipalveluihin.

– Ihmiset puhuvat kolme kertaa nopeammin kuin kirjoittavat. Vaikka puheentunnistuksen litterointeja joutuu tarkistamaan, se säästää silti aikaa.

Asiakkaita julkisella ja yksityisellä

Julkisen terveydenhuollon asiakkaita ovat Länsi-Uudenmaan hyvinvointialue, Keski-Uudenmaan hyvinvointialue ja THL. Yksityisen puolen asiakkaita ovat Esperi Care, Medbase ja Planmeca.

Turkulaisella, kotimaisessa omistuksessa olevalla Lingsoftilla on satakunta työntekijää, jotka työskentelevät ympäri maata. Yhtiö on perustettu vuonna 1986 ja se on kehittänyt luonnollisen kielen prosessointia eli käytännössä tekoälyä kauan ennen kuin yleiset kielimallit tekivät termistä tunnetun.