01.12.2010 10:51
Robot õpib lugema
Oxfordi ülikooli robootikateadlane Ingmar Posner soovib arendada roboteid, mis suudaks seintest läbi näha ning seda mitte röntgenkiirte või radari abil, vaid tänu lugemisoskusele, kirjutab New Scientist.
Tema sõnul võib anda suletud uksel oleva sildi lugemine sageli hea ettekujutuse selle kohta, mis ukse taga olla võib. Seega võib lugemisoskus aidata avastada asju, mida sa otseselt ei näe.
Robotid on kirjaoskamatud
Robootikateadlased on aastaid õpetanud robotitele erinevaid oskusi, mis aitaksid neil reaalses maailmas paremini toime tulla. Robotid on õppinud oma ümbrust kaardistama ning üles tõstma ja liigutama kohmakaid esemeid ning mõned on üles näidanud isegi eneseteadvuse märke, kuid siiski on nad seni kirjaoskamatud.
Posneri kolleegi Paul Newmani sõnul on inimeste maailmas, kus kirjasõna kasutamine on nii valdav, mittelugeval robotil oma väärtust äärmiselt keeruline tõestada.
Koostöös Austraalias asuva Queenslandi tehnoloogiaülikooli teadlase Peter Corke'iga üritavad nad arendada robotite lugemisoskust.
Teoreetiliselt peaks roboti lugemaõpetamine olema suhteliselt lihtne, sest on ju olemas optilise tähetuvastuse tarkvara. See muudab automaatselt raamatutest skaneeritud kujutised tekstiks ning paljud teadlased kasutavad seda, et pöörata robotite tähelepanu linnatänavatel paiknevatele plakatitele ja märkidele.
Eelmisel aastal näiteks tuli välja just selleks otstarbeks mõeldud nutitelefonirakendus Google’i Goggles. Alates maist lisandus sellele tõlkefunktsioon, mis aitab turistidel restoranis valikuid teha.
Goggles toetub sellele, et kasutaja tunneb teksti ära ning suunab telefoni kaamera soovitud sõnadele. Nüüd tuleb appi tähetuvastustarkvara.
Robotitel puudub inimese abi ning teadlased on avastanud, et tarkvara ei suuda ise keerulisest keskkonnast sõnu üles leida.
Kuidas leida tekst?
Posneri sõnul ei arvesta tarkvara asjaoluga, et alati ei pruugi tekst olla nähtav ning üritab tekstina tõlgendada ka kõike muud: telliskiviseinu, korstnaid ja katuseosasid. Tulemuseks on mõttetu sasipundar.
Probleemi lahendamiseks arendasid teadlased välja teksti märkava tarkvara. See tugineb asjaolule, et sageli on märgil asuva teksti all ja kohal ühtset värvi horisontaalne ala, kuid palju kahevärvilist varieerumist tekstis eneses.
Kui tarkvara on teksti tuvastanud, siis edastatakse kujutis sellest lugemiseks tähetuvastustarkvarale, kuid isegi siis on tulemused sageli vigased.
Seetõttu otsustas teadlaste rühm varustada oma testroboti Marge'i sõnaraamatu ja spelleriga. See võimaldab robotil tuvastada, et näiteks sõna "roodbond" on kõige tõenäolisemalt hoopis "broadband", samas kui "nqkio" tuleb lugeda hoopis "nokia".
Oma ümbruskonnast loetavate nimede mõistmiseks kasutab Marge uudisveebe, näiteks The New York Times'i ja BBC Online'i. Robot sirvib veebilehti, et leida loetud sõna ning analüüsib, kui sageli esinevad võtmesõnad nagu "restoran" või "pank" samades lugudes.
See võimaldab tal luua tugevaid semantilisi seoseid sageli esinevate sobivuste vahel. Seda lähenemist kasutades on Marge näiteks õppinud selgeks, et Strada on Suurbritannia restoranikett ja Barclays pank.
Teadlased esitlesid oma töö tulemusi eelmisel kuul Taiwanis Taipeis toimunud rahvusvahelisel intelligentsete robotite ja süsteemide konverentsil.
Vaatepunkt on tähtis
Suurbritannias asuva Bristoli ülikooli teadlase Majid Mirmehdi sõnul, kelle juhitav töörühm on arendanud välja roboteid lugema õpetava tarkvara, on üheks potentsiaalseks probleemiks raskesti loetavate sõnade identifitseerimine tulenevalt nende vaatamise perspektiivist. Kumeratele pindadele trükitud sõnad paistavad moonutatuna, mis muudab nende mõistmise robotite jaoks keeruliseks.
Mirmehdi juhitud teadlaste eesmärgiks on tarkvara sedasi parendada, et osavate kätega humanoidsed robotid suudaksid esemeid manipuleerida, mis võimaldaks neil teksti lihtsamini lugeda.
Posner loodab, et tema teadlasterühma töö võimaldab mobiilsetel robotitel ülesannetega lihtsamini toime tulla, kui nad suudavad inimesega samal viisil märke jälgida.
Näiteks hoones töötaval päästerobotil puuduks sel juhul vajadus hoone kaardi järkjärguliseks loomiseks, vaid ta võiks selle asemel lugeda kõiki olemasolevaid märke, mida ta oma teel kohtab.