2015. aastast ilmuvad Novaatori uudised Eesti rahvusringhäälingu veebilehe teadusrubriigis ERR Novaator (novaator.err.ee).

Novaator - Üks maailma suurimaid saladusi – Google’i algoritm
31.01.2008 22:10

Üks maailma suurimaid saladusi – Google’i algoritm

Villu Päärt
Skype: villu.paart
villu.paart@ut.ee
Loe kommentaare (0)
Samal teemal (5)

Internetist info otsimine on meie igapäevaelu loomulik osa. Internetiotsingutega tegelev firma Netcraft väidab, et internetis on praegu umbes 150 miljonit aktiivset veebilehekülge. Kuidas leida nende hulgast meile vajalik info: see ülesanne tundub üüratu.

Otsingumootorid kasutavad algoritme - matemaatilisi juhendeid, kuidas arvuti peab otsinguülesandeid lahendama.

Google otsingumootoris käib rohkem külastajaid kui ühelgi teisel maailma veebiküljel. Aga milles seisneb selle algoritmi saladus? Keegi ei tea. Lehekülg Howstuffworks pakub väikest sissevaadet sellele, kuidas maailma tuntuim otsingumootor toimib.

Google algoritm otsib lehekülgedelt otsingusõnu, kasutades selleks lehekülgede järjestamise meetodit PageRank, mis arvestab suurt hulka erinevaid tegureid, näiteks seda, mitu korda otsingusõna leheküljel esineb. Järjestamises kõrgema hinde saanud leheküljed ilmuvad otsingu vastustes esimeste seas, mida madalam hinne, seda tahapoole tulemus järjekorras paigutatakse.

Lehekülje omaniku jaoks on ülioluline, et tema lehekülg paikneks Google’i otsingutulemustes võimalikult kõrgel – see tagab külastatavuse ja nähtavuse. Möödunud aastal võttis Google’i Microsofti käest ära maailma kõige külastatuma internetilehekülje tiitli. Niisiis – olles Google’i otsingutes kõrgel kohal annab leheküljele kõvasti lisakülastajaid.

See, kuidas Google otsingusõnadega ringi käib, on sarnane teistele otsingumootoritega. Automaatsed programmid, mida kutsutakse robotiteks, käivad ringi mööda internetti, liiguvad lingilt lingile ning panevad kokku indeksid, mis sisaldavad kindlaid otsingusõnu.

Neid indekseid kasutatakse, kui keegi on otsingulahtrisse trükkinud otsingusõna, nende põhjal kuvab mootor leheküljed, millel esineb otsitud sõna või väljend. Siiski suudavad Google’i robotid pisut rohkemgi – näiteks suudavad nad vahet teha lehekülgedel, millel tegelikult paikneb sisu ning neil, mis on üles riputatud vaid selleks, et veebiliiklust järgmisele veebiküljele suunata.

See, kuidas otsingusõna on leheküljel esitatud, mängib olulist rolli selles, kuidas Google’i otsing lehekülgi leiab. Kuigi sõnu otsitakse terve lehekülje ulatuses, on näiteks pealkirjas leiduv sõna mootori arvates parem. Kui pealkirju on leheküljel mitmes suuruses, loeb mootor tähtsamaks suuremad pealkirjad.

Samuti on oluline, kui tihti otsingusõna lehel esineb. Kindlate otsingusõnadega liialdamist tuleks vältida, aga selle leheküljel paljudesse kohtadesse hajutamist soovitavad need, kes tegelevad lehekülgede otsingumootoritele sobivaks optimeerimisega.

Google otsingualgoritmi kõige olulisem osa on PageRank-süsteem, patenteeritud automaatprotsess, mis määrab ära, kuidas otsingutulemused järjestatakse. Internetiotsijate enamik pöörab tähelepanu vaid paarile-kolmele leheküljele, mis esitatakse otsingutulemuste tipus.

Kuidas siis Google määrab otsingutulemuste järjekorra? Kuigi paljud on püüdnud sellele saladusele jälile jõuda, kaitseb Google algoritmi saladust kiivalt. Ühtteist on siiski teada:

* PageRank annab igale otsingutulemusele hinde. Mida kõrgem see on, seda kõrgemal otsingutulemuste hulgas lehekülg kuvatakse.

* Hinde määrab peamiselt see, kui palju teisi netilehekülgi seda külge lingib. Iga link läheb arvesse justkui ühe häälena. Asja loogika on selles, et hea ja kvaliteetse sisuga lehekülgi lingitakse ilmselt rohkem kui neid, mille sisu on kesine.

* Kõik hinded pole võrdsed. Lingid kõrgelt hinnatud lehekülgedelt maksavad rohkem kui hääled madalama hinnanguga külgedelt. Niisiis ei anna mingit efekti, kui avada trobikond tühju lehekülgi, mis lihtsalt sisaldavad linki leheküljele, kuhu te tegelikult soovite külastajaid meelitada.

* Mida rohkem linke ühelt leheküljelt välja läheb, seda väiksema kaaluga on selle lehekülje hääl. Teisisõnu – kui kõrge hindega leheküljelt läheb välja sadu linke, siis on nende häälte hind madalam. Kui linke oleks vaid mõnele üksikule küljele, oleks häältel suurem kaal.

* Lehekülje hinnet mõjutavad veel näiteks kaua on lehekülg olnud üleval, samuti domeeninimi, kuidas otsingusõnad leheküljel esinevad ning kui vanad on leheküljelt väljuvad ja sellele sisenevad lingid. Google’i algoritm paistab hindavat rohkem neid lehekülgi, mis on olnud juba mõnda aega tegevuses.

* On väidetud, et Google kasutab inimesi, kes hindavad otsingutulemusi ning sorteerivad neid seejärel, et parimad lingid esile tõsta. Google on seda eitanud, väites, et kuigi otsingumootori palgal on terve rida inimesi, kes testivad otsingumootorile tehtud uuendusi, ei sorteeri inimesed siiski tulemusi ega anna lehekülgedele hindeid.

* Google strateegia toimib libedalt. Keskendudes linkidele, mis lehele sisenevad ja väljuvad, suudab otsingumootor tulemusi hõlpsasti korrastada. Kuigi on terve rida trikke, mida lehekülgede hinde parandamiseks saab ette võtta, on üks kindlamaid lahendusi pakkuda oma lehel kõrgekvaliteetset sisu, mis ajendab teisi panema oma leheküljele teie lehekülje linki.

* Google väidab, et kohta otsingutulemustes osta ei saa. Kõik tulemused on järjestatud PageRank-süsteemi antud hinnete põhjal. Samas müüb Google reklaamlinke, mis paigutatakse otsingutulemuste kohale ja kõrvale, aga need on eraldi tähistatud, et otsija suudaks vahet teha otsingutulemuste ja raha eest ostetud reklaamlinkide vahel.

 

Hollandi riigiarhiiv 25.07.2014 16:05

Arvuti analüüsib biitlite muusikat (2)

Tarkvara suudab eristada erinevatel albumitel ilmunud lugusid.

San Diego California ülikool 26.05.2014 17:09

Arvuti tunneb simulandi kaugelt ära

Tarkvara eristab valu teesklejaid tõelistest haigetest 85-protsendilise täpsusega.

24.04.2014 13:37

Näotuvastustarkvara teeb inimesele ära

Uus programm leiab fotodelt sarnased näod 98,5-protsendilise täpsusega.

02.04.2014 15:29

Arvutid õpetavad teineteist

Eriline algoritm lubab arvutil kaaslasele nõu anda.

27.02.2014 14:54

Viirused ohustavad wifivõrke

Viirus levib wifivõrkudes sama kiiresti kui külmetushaigused inimeste seas.

23.01.2014 11:01

Uus lahendus Skype’is petturite avastamiseks

Skype’i kasutajate suhtlusvõrgustiku automaatne analüüs võimaldab eristada neid, kelle kavatsused ei pruugi olla kõige heasoovlikumad.

30.12.2013 18:11

Mida on võimalik teada saada mobiiltelefoniandmeid analüüsides?

Kõigil on taskus mobiiltelefon, mida kasutades jätame me endast pidevalt jälgi: iga kõne, SMS või internetiühendus jätab andmebaasi märgi.

10.12.2013 16:15

Oma silm on kuningas (1)

Pidev pildistamine takistab mälestuste tekkimist.

04.12.2013 17:44

Uudne pildiotsing raalib inimeste suhteid

Algoritm tunneb inimesi ära näotuvastust kasutamata.

18.11.2013 13:52

Kvantmälu tegi uue rekordi (2)

Toatemperatuuril suutis kvantbitt infot säilitada infot 39 minutit.

10.10.2013 12:15

Nobel: Mehed, kes viisid keemia arvutisse

Tänapäeval teevad keemikud palju tööd ära juba arvutimudelite abil, minnes alles seejärel laborisse.

23.09.2013 17:30

Veebis veedetud aeg kammitseb aju

Infotulv takistab mälu.

03.09.2013 17:35

Facebook mõjub ajule nagu seks ja hea toit

Aju lööb nurru igal korral, kui keegi su postitust meeldivaks peab.

12.08.2013 17:26

Kas usaldada internetikommentaare? (3)

Meid huvitab teiste arvamus. Uut külmkappi ostes kulutame tunde guugeldamiseks. Internet ei paku alati õigeid vastuseid, sest inimesi on kerge mõjutada, näitas Massachusettsi tehnoloogiainstituudi uurimus.

17.07.2013 07:38

Tehisintellekt jääb terve mõistusega hätta

Kõige võimekamad arvutid on arukuselt nelja-aastase lapse tasemel.

26.06.2013 14:04

Eluviisid mõjutavad mälu ja õpivõimet (6)

Veebimängud aitavad neuroteadlastel uurida une ja alkoholi mõju vaimsele võimekusele.

Paolo Villanueva/Flickr 30.04.2014 11:26

Nutitelefoni kiirendusandur reedab omaniku (1)

Mobiiltelefonid suudavad nuhkida, kuid ka nende järel luuramine muutub aina hõlpsamaks.

11.04.2014 14:42

Kas päike on aastaks 2032 maa peale toodud? (4)

Piiramatu arvutivõimsus ja termotuumaenergia kasutuselevõtt oleksid võrreldavad muutusega, mille tõi inimkonnale kaasa internet. Aga kas meil õnnestub lahti muukida universumi olemuse üks põhiküsimusi?

06.03.2014 17:46

Arvutiprogramm joonistab 17 miljoni värvitooniga VIDEO (1)

Programmeerimisvõistluse võitnud tarkvara kasutab kõiki digitehnikas kasutatavaid värvusi.

06.02.2014 19:11

Kas sotsiaalvõrgud teevad meid rumalaks? (1)

Pikaajaline sotsiaalvõrgustike kasutamine uinutab terve mõistuse.

22.01.2014 15:45

Kui kiire on kvantarvuti? (1)

Kvantarvutid võivad olla loodetust palju aeglasemad.

23.12.2013 21:24

Hiirega klõpsimine muudab käed osavaks (1)

Facebookis ja YouTube´is veedetud aeg lihvib käte ja silmade koostööd.

09.12.2013 15:18

Kas arvutil kirjutaja aju tegutseb omapäi?

Vähesed inimesed teavad klaviatuuril tähtede asukohti. Ometi ei takista see neid kiiresti kirjutamast.

26.11.2013 16:38

Arvuti proovib inimese kombel mõelda (2)

Internetist pilte otsiv arvutiprogramm vaatab ja õpib.

11.11.2013 10:06

Internet kui toimetulekumehhanism

Eesti teismeliste kalduvus internetis igavleda viitab struktureeritud tegevuste nappusele, ütleb meediauurija Lukas Blinka.

26.09.2013 18:33

Süsinikarvuti töötab nanotorukeste najal

Esimene süsinikprotsessor on sama võimas kui 40 aasta tagused ränikiibid.

20.09.2013 15:42

E-raamat aitab lugemisraskuste puhul

Vaeglugejaid aitab võimalus teksti hõredaks muuta.

28.08.2013 18:09

Tarkvara aitab videokõnes silmsidet luua

Skype´i kasutajad saavad edaspidi üksteisele kõne ajal silma vaadata.

31.07.2013 14:25

Kas internetis saab hingehädadest priiks?

E-nõustamine sobib neile depressioonihaigetele, kes on ise huvitatud oma tervise paranemisest.

05.07.2013 12:23

Kes säutsus? (1)

Twitterisse postitamise kellaajad reedavad, kas kontot kasutab inimene või hoopis internetirobot.

 
Küsi teadlaselt
Teatavasti vee ruumala paisub nii soojenemisel (aurustumisel) kui ka jäätumisel. Oletame, et on üks anum, mis on vett täis ja on purunematu. Mis hakkab juhtuma siis, kui sundida sellel veel jäätuda?
Jaak Kikas, Tartu ülikooli füüsika instituudi direktor :

See on huvitav küsimus, millele täpse kvantitatiivse vastuse andmine polegi nii lihtne. Üldiselt aga võiks vastata nii: kui paisumisvõimalus puudub,

Loe edasi!
Esita küsimus Kõik
Tartu Ülikool
Idee
Veider teadus