Siirry sisältöön

Palveluntarjoaja(t) Varha, Turun yliopisto, Turun ammattikorkeakoulu, Business Turku

https://www.turkuamk.fi/projekti/syndate-synteettisen-terveysdatan-testialusta/

arho.virkki@varha.fi

Asiakas Synteettistä ja anonyymiä dataa teettävät yksityiset tai akateemiset toimijat
Kesto 1-3 kuukautta
Hinta Kysy tarjous
Aloitus Palvelu päästään aloittamaan noin viikon sisällä projektin sopimisesta, riippuen raakadatan toimitusaikataulusta.
Kuvaus Anonymisointi tarkoittaa prosessia, jolla tunnisteellinen henkilötieto muutetaan sellaiseen muotoon, että henkilöitä ei käytännöllisesti katsoen voi enää tunnistaa uudelleen. Synteettinen, anonyymi data taas on alkuperäistä henkilötietoa muistuttavaa aineistoa, mutta siinä mainitut henkilöt eivät viittaa todellisiin, vaan syntetisoimalla generoituihin tapauksiin.  Syntetisoinnilla tavoitellaan samaa lopputulosta kuin rivitason anonymisoinnillakin: Tavoitteena on tuottaa edustava anonyymi otosta alkuperäisestä aineistosta. Tekniikasta on kuitenkin se lisähyöty, että aineistoa voidaan tuottaa mielivaltainen määrä ja lisätä tarvittaessa simuloimalla mukaan tutkimus- ja kehitystoiminnassa tarvittavia muuttujia ja piirteitä, joita alkuperäinen aineisto ei riittävästi kuvaa.

Syntetisoinnin laatu todetaan testaamalla datan olevan suunniteltujen analyysien suhteen yhteneväinen alkuperäisen aineiston kanssa ja testaamalla tai menetelmien perusteella todistamalla, että alkuperäisiä potilaita ei voi tunnistaa.

Aineisto luodaan Varhan Atolli-palvelussa, jossa voi säilyttää ja käsitellä aineistoja, jotka ovat Findatan valvonnan alaisia.

Asiakkaiden oletetaan olevan joko tutkimusryhmiä tai yrityksiä. Potilasaineistoja voi saada käyttöönsä syntetisointia varten joko yhtä hyvinvointialuetta koskevalla tietoluvalla, Findatan hyväksymällä tietopyynnöllä tai tuomalla oma aineisto.  Asiakkaan tarve on tyypillisesti jokin seuraavista:

  1. Asiakkaalla on tietolupa, jonka perusteella he saavat Atollin auditoidulle, sinetöidylle puolelle todellista potilasaineistoa (pseudonymisoitua tai oikeilla tunnisteilla) ja tästä laaditaan synteettistä dataa, joka luovutetaan asiakkaalle.
  2. Asiakkaalla on Findatan hyväksymä tietolupa, ja pseudonymisoidut potilastiedot on tuotu Atollin auditoidulle puolelle. Näistä laaditaan syntetisoitu data, joka luovutetaan asiakkaalle.
  3. Asiakas tuo oman datan (joka ei ole Findatan tai Varhan luvittama), joka syntetisoidaan ja luovutetaan asiakkaalle. Tämä data on anonyymiä, tai sen käyttöön on suostumus tai se ei sisällä henkilötietoja.

Näiden lisäksi voi olla erikoisempia asiakkaiden tarpeita, kuten anonyymin aineiston jälkikäsittely, modaliteettien muunnokset synteettisen datan menetelmillä, erilaisten hypoteettisten tilanteiden simulointi aineiston pohjalta ja synteettisten potilaiden luonti kliinisten lääkekokeiden kuvausten pohjalta.

Palvelun hinnan komponentteina ovat asiantuntijapalvelut sekä mahdolliset aineiston hankinta-, säilytys ja prosessointikulut. Palvelun tuottaminen on erittäin vaativaa asiantuntijatyötä, jossa vaaditaan aikaa vievää perehtymistä kulloiseenkin tutkimuskysymykseen.

Alkuperäisen aineiston omistajilla voi olla vaatimuksia datan käyttöoikeuksien suhteen. Alkuperäisen aineiston käyttöön voidaan vaatia rajoituksia esim. sen suhteen, kuka sitä saa käsitellä tai kuinka kauan se on käytössä, ja se voidaan vaatia tuhottavaksi tietyn ajan jälkeen. Alkuperäisen aineiston käyttöoikeuden saaminen voi lisäksi edellyttää yhteistyötä aineiston omistajan asiantuntijoiden kanssa projektin keston ajan. Selvitettäväksi jää tavat, joilla mahdollisissa analyysin tuloksina syntyvissä julkaisuissa viitataan Syndate-palveluun.

Datan omistaja voi vaatia sopimusta siitä, millä ehdoilla synteettistä dataa saa käyttää ja jakaa eteenpäin. Alkuperäinen aineisto voi sisältää myös geenisekvenssejä, ja niistä ei ole olemassa tarkkoja määräyksiä laissa, eikä niiden syntetisointimenetelmät ole yhtä pitkälle kehittyneet kuin tabulaari- ja kuvamuotoisella datalla. Niinpä niiden käsittelystä täytyy sopia erikseen. Palveluun kuuluvat tyypillisesti

–       Aloituspalaveri

–       Aineiston hankkiminen tai tuominen analysointiympäristöön

–       Aineiston syntetisoiminen

–       Aineiston laadun ja anonymiteetin varmistus

–       Kattava raportti tehdyistä analyyseistä ja tulostiedostoista

–       Tulospalaveri