2015. aastast ilmuvad Novaatori uudised Eesti rahvusringhäälingu veebilehe teadusrubriigis ERR Novaator (novaator.err.ee).

Novaator - Kuidas internetist paremini otsida?
05.11.2012 15:00

Kuidas internetist paremini otsida?

Sven Paulus
Skype:
sven.paulus@ut.ee
Loe kommentaare (2)
Samal teemal (3)

Lihtsa fakti, näiteks mõne kuupäeva või riigi pealinna leidmine veebiotsinguga on imelihtne. Asi muutub aga keeruliseks siis, kui otsiülesandes sisaldub mitu tahku.

Austriast pärit Georg Singeri 19. oktoobril kaitstud väitekirja inspiratsioon tekkis elulisest vajadusest: korraldada otsingu abiga üks puhkusereis.

Kaitsesid hiljutidoktoritöö teemal «Veebi otsingumootorid ja vajadus keeruka informatsiooni järele.» Kuidas teemani jõudsid ja kaua oled sellega tegelenud?

Umbes neli-viis aastat. Enne Eestisse tulekut olin ühenduses Ulrich Norbisrathiga, kes oli toona ainus sakslane Tartu Ülikooli arvutiteaduste instituudis. Alustasime ühe kommertsprojektiga kaks aastat enne seda, kui jõudsin doktoritöö juurde. Tahtsime teha veebiotsingut võimalusterohkemaks, just keerukat, mitte tavalist otsingut.

Google on väga hea leidmaks ühtainsat dokumenti: sisestad päringusõna ja ta leiab kiiresti kohased vasted. Ent otsimootorid ei toeta keerukamaid otsinguid, mis ulatuvad pikema ajaraami sisse, ütleme nädalast kuni kuuni, kui sa planeerid näiteks puhkusereisi.

Soovisin kord koos naise ja lapsega minna Kanaaridele puhkusele ja ees seisis keerukas otsinguülesanne. Gran Canariale kaheaastase lapsega minek tähendab seda, et pead arvestama reisimise poolt – leidma kõiksugu piletid, kursis olema sanitaar- ja meditsiiniliste tingimustega ja tagatipuks tuleb kõik need aspektid leida kompleksotsinguga. Lisaülesandeks oli veel leida lapsesõbralik hotell. Kõige selle väljaselgitamine otsingu abil võib võtta kuni kaks nädalat ja mu reisikorraldajast naine tegeles sellega 8–10 tundi päevas. Lihtsalt läbitöötamist vajava info hulk oli niivõrd suur. See motiveeriski mind nende teemade vastu huvi tundma.

Millistest teoreetilistest eeldustest sa väitekirja puhul lähtusid?

Ühelt poolt kasutasin infootsingu (information retrieval) mõistet. Nimetatud distsipliinile taanduvad kõik otsingutehnoloogiad ja see baseerub eeldusel, et sisestades päringu leiab otsimootor sulle kõik seonduvad dokumendid. Seda võib nimetada päringu ja dokumendi vastavuseks. Teiseks lähtekohaks oli avastuslik otsing (exploratory search), selle termini autoriks on Marchionini. Kui kirjutad otsimootorisse «lapsesõbralikud hotellid Gran Canarial,» leiab Google umbes 5,6 miljonit tulemust. Sellist hulka kodulehti ei suuda inimene eales läbi töötada. Marchionini ütleb, et miski peaks tulema pärast seda ja see peaks põhinema õppimisel ja uurimisel, mitte vaid dokumentide leidmisel.

Sinu väitekirja sisuks on mitu teadusartiklit, mis katavad eri teemasid?

Avaldasin koos kaasautoritega seitse artiklit. Esimene käsitles kompleksotsingu mudelit, mille välja arendasime. See hõlmab endas kolme sammu: koondamist, avastamist ning sünteesi. Ehitasime selle mudeli ja ütlesime, et kui sul on vajadus keeruka otsingu järele, tuleb leida dokumendid, mis käsitlevad juba teatud aspekte. Võtame taas näiteks reisi Kanaaridele. Sul on tarvis leida lennupiletid, mis tähendab sisuliselt andmete koondamist. Siis on juures veel avastuslik aspekt, mis tähendab, et lisaks lendamisele on tarvis leida mõistlik majutus, näiteks lapsesõbralik hotell. See moodustab avastusliku poole ja lõpuks on sul sünteesi aspekt, kus kõigi nende leitud dokumentide seast tuleb kokku panna üks, mis neid kõiki sisaldab. See on teoreetiliselt kõige olulisem.

Samuti lõime kasutajauuringuks vahendi, mida nimetame otsingulogijaks: see aitab teha kasutajauuringuid ning salvestab kõik sooritatavad sammud. Tarkvara installeeritakse laboris asuvatesse arvutitesse ja seal on rida eelnevalt määratletud ülesandeid. Katses osalevad inimesed sooritavaid neid ülesandeid näiteks kolme tunni jooksul. Meie suurimas uuringus, mis toimus 60 tavakasutaja osavõtul Hamburgis, andsime katsealustele kuus sisendülesannet info välja otsimiseks. Alates lihtsast, näiteks sellest, millal sündis Mozart kuni selleni, kui ohutu on praegu elada Afganistanis ja töötada seal näiteks ajakirjanikuna. Viimane on palju avatum ja seetõttu ka keerukam ülesanne. Kokkuvõtteks tuli leida erinevused lihtsa ja keeruka ülesande vahel.

Tegelesime sellega umbes poolteist aastat. Vaatlesime, kuidas mõjutab vanus ja sugu otsingusooritust, kuidas hindavad inimesed seda, kas ülesanne on raske ja kuivõrd leidsid nad soovitud tulemusi. Koostasime artikli ka selle kohta, mida inimesed tavaelus otsimootorite taga teevad: kas nad suhtlevad palju, kas nad on aktiivsed blogijad või osalevad kogukondlikes foorumites. See klassifitseerimine toimus TÜ ajakirjanduse- ja kommunikatsiooni instituudis väljatöötatud määrangute põhjal. Tulemus näitas, et mida aktiivsem on inimene veebis, seda paremini saab ta ka otsinguga hakkama.

Kõige olulisemas artiklis uurisin, kuidas leida mooduseid eristamaks kompleksülesandeid lihtsatest. Kasutasin mõõdikud, mis näitasid, kui palju erinevaid brauseriaknaid inimesed kasutavad, mitut otsingufraasi nad tarvitavaid ja kas nad fraase otsingu käigus muudavad. Ühes artiklis uurisime ka raamatukogude infotöötajate otsioskusi. Kokku seitsme artikli põhjal töötasin välja ATMS-i (awareness task monitoring share) meetodi ja ütlesin, et seda mudelit saab kasutada, edendamaks keeruka otsingu tuge olemasolevates otsimootorites.

Kas sel mudelil on ka praktiline väärtus?

Teoreetiliselt kindlasti, kuid praegune turusegment on liiga väike, sest paljud inimesed isegi ei tea, et neil on otsingu vallas probleem. Ka mina mõtlesin, et Google on väga suur ja kasumlik firma ning miks ei peaks nad siis olema kõiges täiuslikud. Aga nad on seda vaid lihtpäringute puhul, keeruliste otsingute jaoks tugisüsteem puudub ja selle teadasaamine võttis mul mõnda aega.

Mis olid su enda jaoks kõige põnevamad tulemused?

Arvasin, et võistlus otsimootorite seas on lõppenud ja Google'i tulekuga on valdkond justkui kaetud. Aga nüüd näen, et kui praegune on nö lõppseis, siis tegelikult on kaetud vaid väga väike osa. Mind üllatas, kui vähe on tegelikult otsingumaailmas edasi liigutud ja kui palju oleks veel vaja teha.

Kas ühest küljest veebiotsingud laiendavad meie vaadet maailmale, aga teisalt piiravad?

Tead, kui palju tulemusi inimesed Google't kasutades vaatavad? Enamasti esimest kaht-kolme, maksimaalselt viit ehk sisuliselt ainult esimest lehekülge. Siinkohal julgen arvata, et Google on arvamuskujundaja. Aga just keerukates otsingutes on tähtis, et sa kataks kõiki aspekte, mitte ei leiaks vaid ühe sobivana näiva asja.

Seega otsimootorite puhul on alati küsimuseks asjakohasus: mis on need esimesed ettetulevad tulemused, sest inimesed kipuvad just neid vaatama. Teiseks on erinevate aspektide kaetus ning ses osas on otsimootorid paremaks muutumas. Nad on omaks võtnud universaalotsingu põhimõtted, mis tähendab, et nüüd näed esilehel päringu vastusena ka juba pilte. Pakutavat dokumentide hulka püütakse laiendada, kuid puudub tugi, et katta tervise, reisimise, hotellide ja muu sarnasega seotud tahke.

Kuidas sa näed üldse otsimootorite tulevikku?

Ma ei usu, et tekib kõikvõimas süsteem, mis vastaks kõigile küsimustele lihtsalt nupuvajutuse järel. Tõin väitekirjas välja, et see võiks pigem olla toetava iseloomuga keerukatele otsingutele ja et paremini oleks ka integreeritud sotsiaalvõrgustikke haaravad otsingud. Samuti hindan Apple´i arendatavat Siri lähenemist, kus saan otsinguks kasutada loomulikku keelt ja usun, et just selles suunas liigub kogu asi edasi.

Kuidas siis veebist hästi otsida ja leida?

Enne otsingu alustamist otsusta, kas sooritad lihtsat või keerukat otsingut. Lihtne on see, kus vajatav info on tõesti kirjas ühelainsal veebilehel või ühes dokumendis. Kui see info on seal tõesti olemas, siis Google leiab selle kenasti üles ja võid oodata häid tulemusi. See puudutab kuupäevi, fakte, palkasid ja muud taolist lihtsat infot. Kui tegutsed kompleksotsingu kallal, siis tähendab see, et tulemus on avatud lahendustega ja küsimusele vastamiseks on palju eri võimalusi. Sul peab olema eelnev teadmine, mis on selles valdkonnas oluline ja mis mitte. Samuti tuleb aru saada, et otsing võib võtta kaua aega. Praktiline soovitus on üles kirjutada selleks kasutatud päringusõnad, mõistmaks, milliseid probleemiaspekte sa puudutasid. Ka oleks hea püüda sõnastada iga aspekti katmiseks eraldi päringud.

Artikkel ilmus ajakirjas Universitas Tartuensis.

19.11.2012 11:03
Pealkirjanik

Asjal on jumet, aga kõik asjad pole nii keerulised kui näivad.

Artiklis toodut näidete põhjal:
1) Gran Canaria puhul: tripadvisor.com!
2) Selle ajakirjanike teema puhul Googlesse "afghanistan journalist safety" ja leiab väga kiirelt väga teemakohast infot.

Ma saan aru, et ilmselt selle teise teema puhul eeldab autor, et otsingumootor peaks andma vastuse 10-palli sklaalal nii et sa ise ühtegi rida lugema ei pea? Ilmselt peaks sellisel juhul eelnevalt väga põhjalik ankeet olema, et milline inimene sa oled, mis piirkonda ja kui kauaks lähed, mis teemasid kajastama, milline on eelnev kogemus, mis on sinu definitsioon sõnale "ohutu" jne...ja ikka jääks asi väga ebamääraseks. Mulle tundub oluliselt efektiivsem 3 sõna Google'isse lüüa ja siis 10 minutit vastetega tutvuda.

Lisa kommentaar
10.12.2012 23:35
Jüri

No aga kui see nii lihtne on, miks siis uurimuse autori abikaasa töötas iga päev 8-10 tundi, et vastuseid leida? Ma ei usu, et ühe veebilehe leidmiseks kulus sadu töötunde.
Vaevalt oleks ka seda tööd lastud doktoriastmes kaitsmisele, kui asjad on tegelikult palju lihtsamad, kui töös väidetakse. Eks tee siis parem töö ja kaitse ära, mille põhiideeks on see, et tegelikult on asjad lihtsad ja pole sellist mudelit vaja.

Lisa kommentaar

 

Hollandi riigiarhiiv 25.07.2014 16:05

Arvuti analüüsib biitlite muusikat (2)

Tarkvara suudab eristada erinevatel albumitel ilmunud lugusid.

San Diego California ülikool 26.05.2014 17:09

Arvuti tunneb simulandi kaugelt ära

Tarkvara eristab valu teesklejaid tõelistest haigetest 85-protsendilise täpsusega.

24.04.2014 13:37

Näotuvastustarkvara teeb inimesele ära

Uus programm leiab fotodelt sarnased näod 98,5-protsendilise täpsusega.

02.04.2014 15:29

Arvutid õpetavad teineteist

Eriline algoritm lubab arvutil kaaslasele nõu anda.

27.02.2014 14:54

Viirused ohustavad wifivõrke

Viirus levib wifivõrkudes sama kiiresti kui külmetushaigused inimeste seas.

23.01.2014 11:01

Uus lahendus Skype’is petturite avastamiseks

Skype’i kasutajate suhtlusvõrgustiku automaatne analüüs võimaldab eristada neid, kelle kavatsused ei pruugi olla kõige heasoovlikumad.

30.12.2013 18:11

Mida on võimalik teada saada mobiiltelefoniandmeid analüüsides?

Kõigil on taskus mobiiltelefon, mida kasutades jätame me endast pidevalt jälgi: iga kõne, SMS või internetiühendus jätab andmebaasi märgi.

10.12.2013 16:15

Oma silm on kuningas (1)

Pidev pildistamine takistab mälestuste tekkimist.

04.12.2013 17:44

Uudne pildiotsing raalib inimeste suhteid

Algoritm tunneb inimesi ära näotuvastust kasutamata.

18.11.2013 13:52

Kvantmälu tegi uue rekordi (2)

Toatemperatuuril suutis kvantbitt infot säilitada infot 39 minutit.

10.10.2013 12:15

Nobel: Mehed, kes viisid keemia arvutisse

Tänapäeval teevad keemikud palju tööd ära juba arvutimudelite abil, minnes alles seejärel laborisse.

23.09.2013 17:30

Veebis veedetud aeg kammitseb aju

Infotulv takistab mälu.

03.09.2013 17:35

Facebook mõjub ajule nagu seks ja hea toit

Aju lööb nurru igal korral, kui keegi su postitust meeldivaks peab.

12.08.2013 17:26

Kas usaldada internetikommentaare? (3)

Meid huvitab teiste arvamus. Uut külmkappi ostes kulutame tunde guugeldamiseks. Internet ei paku alati õigeid vastuseid, sest inimesi on kerge mõjutada, näitas Massachusettsi tehnoloogiainstituudi uurimus.

17.07.2013 07:38

Tehisintellekt jääb terve mõistusega hätta

Kõige võimekamad arvutid on arukuselt nelja-aastase lapse tasemel.

26.06.2013 14:04

Eluviisid mõjutavad mälu ja õpivõimet (6)

Veebimängud aitavad neuroteadlastel uurida une ja alkoholi mõju vaimsele võimekusele.

Paolo Villanueva/Flickr 30.04.2014 11:26

Nutitelefoni kiirendusandur reedab omaniku (1)

Mobiiltelefonid suudavad nuhkida, kuid ka nende järel luuramine muutub aina hõlpsamaks.

11.04.2014 14:42

Kas päike on aastaks 2032 maa peale toodud? (4)

Piiramatu arvutivõimsus ja termotuumaenergia kasutuselevõtt oleksid võrreldavad muutusega, mille tõi inimkonnale kaasa internet. Aga kas meil õnnestub lahti muukida universumi olemuse üks põhiküsimusi?

06.03.2014 17:46

Arvutiprogramm joonistab 17 miljoni värvitooniga VIDEO (1)

Programmeerimisvõistluse võitnud tarkvara kasutab kõiki digitehnikas kasutatavaid värvusi.

06.02.2014 19:11

Kas sotsiaalvõrgud teevad meid rumalaks? (1)

Pikaajaline sotsiaalvõrgustike kasutamine uinutab terve mõistuse.

22.01.2014 15:45

Kui kiire on kvantarvuti? (1)

Kvantarvutid võivad olla loodetust palju aeglasemad.

23.12.2013 21:24

Hiirega klõpsimine muudab käed osavaks (1)

Facebookis ja YouTube´is veedetud aeg lihvib käte ja silmade koostööd.

09.12.2013 15:18

Kas arvutil kirjutaja aju tegutseb omapäi?

Vähesed inimesed teavad klaviatuuril tähtede asukohti. Ometi ei takista see neid kiiresti kirjutamast.

26.11.2013 16:38

Arvuti proovib inimese kombel mõelda (2)

Internetist pilte otsiv arvutiprogramm vaatab ja õpib.

11.11.2013 10:06

Internet kui toimetulekumehhanism

Eesti teismeliste kalduvus internetis igavleda viitab struktureeritud tegevuste nappusele, ütleb meediauurija Lukas Blinka.

26.09.2013 18:33

Süsinikarvuti töötab nanotorukeste najal

Esimene süsinikprotsessor on sama võimas kui 40 aasta tagused ränikiibid.

20.09.2013 15:42

E-raamat aitab lugemisraskuste puhul

Vaeglugejaid aitab võimalus teksti hõredaks muuta.

28.08.2013 18:09

Tarkvara aitab videokõnes silmsidet luua

Skype´i kasutajad saavad edaspidi üksteisele kõne ajal silma vaadata.

31.07.2013 14:25

Kas internetis saab hingehädadest priiks?

E-nõustamine sobib neile depressioonihaigetele, kes on ise huvitatud oma tervise paranemisest.

05.07.2013 12:23

Kes säutsus? (1)

Twitterisse postitamise kellaajad reedavad, kas kontot kasutab inimene või hoopis internetirobot.

 
Küsi teadlaselt
Teatavasti vee ruumala paisub nii soojenemisel (aurustumisel) kui ka jäätumisel. Oletame, et on üks anum, mis on vett täis ja on purunematu. Mis hakkab juhtuma siis, kui sundida sellel veel jäätuda?
Jaak Kikas, Tartu ülikooli füüsika instituudi direktor :

See on huvitav küsimus, millele täpse kvantitatiivse vastuse andmine polegi nii lihtne. Üldiselt aga võiks vastata nii: kui paisumisvõimalus puudub,

Loe edasi!
Esita küsimus Kõik
Tartu Ülikool
Idee
Veider teadus