14.11.2010 14:48
Kuidas teha arvutusi delikaatsete andmete põhjal?
Kes müüb rohkem
piima? Kohvi? Juustu? Kui kolm Eesti suurimat poeketti tahaks sellele
küsimusele vastust, siis tänasel päeval pole see konkurendi raamatupidamises
nuhkimata võimalik.
Kuid see ei pruugi jääda kauaks nii.
Tartu Ülikooli arvutiteaduse doktorant ja aktsiaseltsi
Cybernetica teadur Dan Bogdanov veab projekti Sharemind, mis võimaldab teha
arvutusi nii, konfidentsiaalsed andmed seejuures ei leki.
Sharemind võimaldaks näiteks poekettide müügiandmete põhjal
leida vastuseid neile küsimustele, ilma, et Selver näeks RIMI või Maxima
Säästumarketi müügiandmeid.
“Kauplusest saadetud andmed jagatakse kolmeks, algoritm
krüpteerib need andmed ning iga osa saadetakse ühele andmebaasile,” kirjeldas Bogdanov.
“Seejärel tehakse nende andmete põhjal arvutisi, kuid nii, et keegi algandmete
algväärtusi ei näe, ning lõpuks kogub andmete töötleja kokku andmebaaside poolt
avalikustatud tulemused ning leiab nende põhjal õige lõpptulemuse. Kui aga
vaadata neist andmetest seda üht kolmandikku, siis näeb see välja nagu suvaline
valge müra.”
Sisuliselt oskab Sharemind arvutada pimesi, aga saada
siiski korrektseid tulemusi.
Eelduseks on vaid see, et andmed pärinevad vähemalt
kolmest eri allikast ning andmete omanikud ei vaheta omavahel infot, sellisel
juhul on kõigi andmeomanike jaoks tagatud turvalisus, et konfidentsiaalne info
ei lähe majast välja.
Bogdanov kasutab mõistet: andmete omanik peab olema uudishimulik,
kuid aus. “Oletame, et üks neist arvutusi tegevatest andmebaasidest
satub siiski ründe alla ja andmed varastatakse. Vargal pole nende andmetega aga
midagi peale hakata, sest see üks andmeosak ei sisalda sisuliselt midagi
sellist, millest on võimalik mingit infot saada,” ütles Bogdanov.
Kes seda vajaks?
Tema sõnul vajaks sedasorti arvutuste tegemise süsteemi
näiteks haiglad ja geenivaramud, kus on tegu samas vormis andmetega, mida aga seadusandlus
teiste pooltega jagada ei luba. Ometi saaks need asutused omavahel koostööd
tehes leida näiteks vastuseid küsimustele: kui palju sekspartnereid on keskmisel
HIV-positiivsel või kui paljud 55-aastased mehed suitsetavad.
“Kindlasti huvitab Eesti IT-firmasid, millised on firmade töötajate keskmised
palgad ametite järgi. Ei Skype ega Webmedia ei hakka seda teistele avaldama,
aga kui kõik oma andmete põhjal lubaks arvutusi teha, siis oleks võimalik
mingeid objektiivseid numbreid välja tuua,” ütles Bogdanov.
Sharemind on Tartu Ülikooli, tarkvara tehnoloogia
arenduskeskuse STACC ja aktsiaseltsi Cybernetica ühistöö. Lisaks sellistele
andmebaaside ülestele arvutustele võimaldab Sharemind üles ehitada ka
internetipõhiseid ankeete, mille andmed juba täitmise käigus jagatakse kolme
eri ossa, mis võimaldab kaitsta küsitletava privaatsust.
Sharemindi taolist arvutussüsteemi on Taanis kasutatud
suhkrupeeditootjatega hinnakokkulepete sõlmimisel, kus ükski suhkrupeeditootja
ei näinud teiste kasvatajate poolt soovitud hindu, kuid lõpuks pani arvuti
nõudluse ja pakkumise omavahel klappima.
“Meil oli algul lihtsalt paar rida ideed, millest
tänaseks on saanud paarkümmend tuhat rida programmikoodi,” ütles Bogdanov.
“Siia on pandud üle kümne aasta inimtööd.”
Sellisel arvutussüsteemil võiks olla palju huvilisi, kes seda kasutada sooviks?
“Esialgu on see siiski teadusprojekt, aga kuivõrd tehnoloogia on valmis saamas,
siis oleme aktiivselt otsimas võimalusi selle rakendamiseks,” märkis Bodganov.