Insinööri-lehti

Sinun datasi on meidän tuotteemme

Vanha sanonta kertoo, että ilmaisia lounaita ei ole olemassa, mutta internet tuntuu olevan täynnä toinen toistaan hienompia ja tehokkaampia, ilmaisia sovelluksia. Ilmaiseksi on irronnut jo vuosikaudet esimerkiksi sähköpostit, taulukkolaskenta- ja tekstinkäsittelysovellukset, kuvankäsittely, erinäiset sosiaalisen median alustat ja niin edelleen.

Näennäisesti ilmaisia sovelluksia tarjoavat yritykset ovat kasvaneet miljardien arvoisiksi teknologiajäteiksi keräämällä käyttäjiensä dataa ja paketoimalla ja myymällä sitä mainostajien sekä mahdollisesti muiden tahojen käyttöön. Sovellukset eivät siis suinkaan ole ilmaisia, maksamme vain niistä omilla tiedoillamme perinteisten eurojen sijaan.

Viimeisimpänä ja valovoimaisimpana tulokkaana tälle ilmaisen tavaran estradille on saapunut tekoäly ja siihen liittyvät lukuisat sovellukset. Nykyinen tekoäly ei ole varsinaisesti meille scifi-maailmasta tuttu koneellinen tietoisuus, vaan kyseessä on enemmänkin uusi kehityssuunta kone- ja syväoppimisen ja big datan saralla.

Erinäiset tekoälymallit perustuvat valtaviin määriin dataa. Tietyt mallit ovat syöneet ja hyödyntävät esimerkiksi koko internetin verran dataa. Mitä enemmän tietoja mallilla on käytettävissään, sitä paremmin se toimii ja sitä enemmän etua sillä on kilpailijoihinsa nähden. Data on siis kirjaimellisesti näiden tekoälymallien tuote.

Tietojen poistaminen on hankalaa, ellei mahdotonta.

Tekoälyt perustuvat pitkälti hieman ihmisaivoja muistuttaviin neuroverkkoihin ja suuri osa malleista toimii niin sanottuina mustina laatikkoina. Mustalla laatikolla tarkoitetaan, sitä että malliin syötetään tietoja ja sieltä tulee tuloksia ulos, mutta käyttäjä, tekoälymalli itse tai sen kehittänyt taho ei pysty tarkalleen kertomaan, mistä tieto on peräisin tai miten siihen päädyttiin.

Esimerkkinä ihminen tietää ja pystyy kuvailemaan toiselle, miltä omena näyttää ja maistuu, mutta hänen on mahdotonta kertoa, mihin osaan hänen aivojaan kyseinen tieto on tallennettu tai miten tämä tietojen nouto tapahtuu. Tieto on kuitenkin olemassa ja käytettävissä, vaikka sen täsmällistä paikkaa ja toimintatapaa ei tunneta.

EU:n tietosuojalainsäädännön mukaisesti käyttäjillä on muun muassa oikeus saada haltuunsa itsestään järjestelmiin tallennetut tiedot ja oikeus saada tietonsa poistettua järjestelmistä.

Neuroverkkojen tapauksessa näiden oikeuksien toteutuminen on ainakin toistaiseksi hyvin hankalaa, ellei jopa mahdotonta, etenkin tietojen poistamisen osalta. Kun tietojen nouto-, synty- ja tallennusmekanismia ei täsmällisesti tunneta, ei niitä voida täsmällisesti poistaa. Lainsäädännön yhteensopivuuden kanssa tehdään tekoälyn osalta jatkuvasti töitä, mutta maaliin vaikuttaa olevan vielä pitkä matka.

Omista tiedoistaan kannattaa muuttuvassa maailmassa siis pitää entistä parempaa huolta ja olla tarkkana, mille tahoille niitä luovuttaa. Ilmaisia lounaita ei todellakaan ole olemassa, joten vähintään lounaan tarjoajan motiivit on hyvä tuntea.

Aleksi Eteläharju
Insinööriliiton järjestelmäasiantuntija