Tehokkuutta TKI-toimintaan – synteettiset aineistot korvaavat aidon potilastiedon

26.10.2021

PRIVASA-hankkeen projektikoordinaattori Tinja Pitkämäki avaa blogikirjoituksessaan synteettisen datan luomia mahdollisuuksia tutkimukselle ja yritysten kehitys- ja innovaatiotoiminnalle. Lisäksi hän kertoo terveysdatan tutkimuskäytön haasteista, EU:n tietosuoja-asetuksen ja toisiolain asettamista rajoituksista sekä synteettiseen dataan liittyvistä kehittämistarpeista.

Yksilötasoisen terveysdatan kysyntä on suuri, mutta toisiokäyttö on vahvasti säänneltyä

Terveysteknologian alalla puhutaan tällä hetkellä ennen kaikkea yksilöllistetystä hoidosta, genomilääketieteestä ja sairauksien ennaltaehkäisystä. Uusilla analyysipohjaisilla tuotteilla ja palveluilla pyritään vastaamaan tarkasti yksittäisten asiakkaiden tarpeisiin. Räätälöityjen tuotteiden ja palveluiden kehittäminen vaatii yksilötasoista terveystietoa, mikä näkyy esimerkiksi rekisteriaineistojen kasvavana kysyntänä.

Terveystietojen toisiokäyttö on kuitenkin vahvasti säänneltyä ja tältä osin näkemykset kansallisesti lainsäädännöstämme ovat varsin kaksijakoisia. Kansainvälisissä vertailuissa, kuten tuoreessa Open Data Instituten tuottamassa raportissa, Suomi näyttäytyy toisiokäytön mallimaana.

Samaan aikaan yrityksissä ja tutkimuslaitoksissa työskentelevät tutkijat ja tuotekehittäjät kertovat avoimesti, kuinka uusi lainsäädäntö on tehnyt heidän työstään haastavampaa.

Yksi nykyisen lainsäädännön haasteista on sen synnyttämä eriarvoisuus TKI-toimijoiden välille: yksilötasoisia rekisteritietoja luovutetaan tutkimukseen, mutta ei kehittämis- ja innovaatiotoimintaan. Tutkimuksen rajaaminen kehittämis- ja innovaatiotoiminnasta ei aina ole yksiselitteistä. Tästä aiheutuu epävarmuutta, joka vähentää myös vahvalla eettisellä arvopohjalla toimivien yritysten halukkuutta rekisteritietojen hyödyntämiseen.

Synteettiset aineistot tarjoavat vaihtoehdon aidolle potilastiedolle

Uusia tuotteita ja palveluja on mahdollista kehittää myös synteettisten aineistojen avulla. Ne ovat aidon potilastiedon pohjalta mallinnettua aineistoa, jonka tuottamisessa hyödynnetään usein erilaisia tekoälymenetelmiä. Joissain yhteyksissä voidaan puhua myös digitaalisista kaksosista tai simuloiduista aineistoista.

Alkuperäisten aineistojen ominaispiirteet, kuten esimerkiksi muuttujien jakaumat ja riippuvuussuhteet, toistuvat mallinnetuissa aineistoissa. Synteettiset aineistot ovat siis oikeankaltaisia ja soveltuvat tämän ansiosta moneen käyttötarkoitukseen.

Mallinnukseen voidaan lisätä myös tietosuojaa parantavia ominaisuuksia, kuten keinotekoista kohinaa, joka häivyttää aineistosta yksittäisten henkilöiden tunnistettavuutta. Näin synteettisistä aineistoista voidaan tehdä anonyymeja.

Synteettisen aineiston käyttökohde määrää sen, kuinka oikeankaltaista aineiston tulee olla ja mikä on riittävä tietosuojan taso. Aineiston loppukäyttäjällä tulee olla mahdollisuus varmistaa näiden laatukriteerien täyttyminen.

Voivatko synteettiset aineistot lisätä pk-yritysten kilpailukykyä?

Rekisteröidyille synteettiset aineistot tarkoittavat korkeampaa tietosuojaa. Yrityksille niiden käyttö voi tarkoittaa myös resurssitehokkuutta ja uusia toimintamahdollisuuksia.

Suurilla yrityksillä on usein jo valmiiksi suuret datavarannot sekä resursseja niiden kasvattamiseen. Pienillä ja keskisuurilla yrityksillä aineistojen saatavuus voi muodostua kynnyskysymykseksi liiketoiminnan kasvattamisessa.

Synteettisten aineistojen avulla toiminta on mahdollista käynnistää nopeammin ja joustavammin. Tuotekonsepteja ja tutkimushypoteeseja on mahdollista testata jo varhaisessa vaiheessa, ennen työlääseen aineistonkeruuseen tai lupaprosessiin sitoutumista. Lisäsäästöjä voi syntyä esimerkiksi mutkattomammasta aineistonhallinnasta. Parhaimmillaan synteettiset aineistot mahdollistavat täysin uudenlaista liiketoimintaa ja uusia kumppanuuksia.

Tarvitsemme selkeän laillisen viitekehyksen synteettisten aineistojen hyödyntämiselle

Jotta synteettisistä aineistoista voi tulla valtavirtaa, pitää niiden hyödyntämiselle olla selkeät reunaehdot. Tällä hetkellä ilmassa on vielä paljon epävarmuutta liittyen siihen, miten GDPR ja toisiolaki suhtautuvat synteettisiin aineistoihin. Lakiteksteissä aineistot joko ovat anonyymeja tai eivät ole, mutta todellisuudessa useimpiin aineistoihin sisältyy pieniä tietosuojariskejä – jäännösriskejä – myös anonymisoinnin jälkeen.

Tämän kahtiajaon sijaan olisikin hyödyllisempää puhua hyväksytyistä riskitasoista. Lisäksi kansallisesti tulisi miettiä synteettisen datan sisällyttämistä lupaprosesseihin käyttäjäystävällisyyttä lisäävänä ja tuotekehitystä nopeuttavana elementtinä. Yhden vision mukaan tutkija voisi ensin kehittää hypoteesiaan synteettisellä aineistolla ja tutkimusluvan saatuaan validoida johtopäätökset aidolla potilastiedolla.

Paikallista osaamista yhteiskehittämällä ja testialustatoiminnalla

Synteettisten aineistojen käyttökelpoisuus on osoitettava tieteellisissä vertailututkimuksissa. Tarvitsemme lisää tietoa esimerkiksi synteettisten aineistojen laadun arvioinnista, vinoumien välttämisestä ja poikkeamien tarkastelusta. PRIVASA-hankkeemme etsi osaltaan vastausta näihin kysymyksiin ja tuo alueelle synteettisiin aineistoihin liittyvää osaamista.

Samanaikaisesti meidän on ansaittava kansalaisten luottamus. Monitieteinen tutkimus vastaa teknisiin, eettisiin ja lainopillisiin kysymyksiin. Tutkimustulosten viemistä käytäntöön edesauttavat testialustat ja yritysyhteistyö. Terveyskampuksen piirissä tapahtuva tietojen jakaminen, tinkimätön tutkimus ja yhteiskehittäminen vievät meitä eteenpäin.

Jos tahtoa on, suomalaiset korkealaatuiset rekisteriaineistot, aktiivinen kansallinen lainsäädäntökeskustelu ja tekninen osaamisemme antavat eväät nousta jopa kansainväliseen kärkeen.

Kirjoittaja:

 

Tinja Pitkämäki
PRIVASA-hankkeen projektikoordinaattori
Turun yliopisto
tinja.e.pitkamaki(at)utu.fi

 

 

 

 

 

Lisätietoa PRIVASA-hankkeesta voit lukea täältä. Hankkeen yhteistyössä ovat mukana Turun yliopisto, Turun AMK, VTT, Polar, PerkinElmer, Yield Systems, BCB Medical, BC Platforms, MVision, Turku Science Park, Auria tietopalvelu, FinData, THL, Fujitsu Finland ja Bayer. Hanketta rahoittaa Business Finland.