31.01.2008 22:10

Üks maailma suurimaid saladusi – Google’i algoritm

Villu Päärt
Skype: villu.paart
villu.paart@ut.ee
Loe kommentaare (0)
Samal teemal (5)

Internetist info otsimine on meie igapäevaelu loomulik osa. Internetiotsingutega tegelev firma Netcraft väidab, et internetis on praegu umbes 150 miljonit aktiivset veebilehekülge. Kuidas leida nende hulgast meile vajalik info: see ülesanne tundub üüratu.

Otsingumootorid kasutavad algoritme - matemaatilisi juhendeid, kuidas arvuti peab otsinguülesandeid lahendama.

Google otsingumootoris käib rohkem külastajaid kui ühelgi teisel maailma veebiküljel. Aga milles seisneb selle algoritmi saladus? Keegi ei tea. Lehekülg Howstuffworks pakub väikest sissevaadet sellele, kuidas maailma tuntuim otsingumootor toimib.

Google algoritm otsib lehekülgedelt otsingusõnu, kasutades selleks lehekülgede järjestamise meetodit PageRank, mis arvestab suurt hulka erinevaid tegureid, näiteks seda, mitu korda otsingusõna leheküljel esineb. Järjestamises kõrgema hinde saanud leheküljed ilmuvad otsingu vastustes esimeste seas, mida madalam hinne, seda tahapoole tulemus järjekorras paigutatakse.

Lehekülje omaniku jaoks on ülioluline, et tema lehekülg paikneks Google’i otsingutulemustes võimalikult kõrgel – see tagab külastatavuse ja nähtavuse. Möödunud aastal võttis Google’i Microsofti käest ära maailma kõige külastatuma internetilehekülje tiitli. Niisiis – olles Google’i otsingutes kõrgel kohal annab leheküljele kõvasti lisakülastajaid.

See, kuidas Google otsingusõnadega ringi käib, on sarnane teistele otsingumootoritega. Automaatsed programmid, mida kutsutakse robotiteks, käivad ringi mööda internetti, liiguvad lingilt lingile ning panevad kokku indeksid, mis sisaldavad kindlaid otsingusõnu.

Neid indekseid kasutatakse, kui keegi on otsingulahtrisse trükkinud otsingusõna, nende põhjal kuvab mootor leheküljed, millel esineb otsitud sõna või väljend. Siiski suudavad Google’i robotid pisut rohkemgi – näiteks suudavad nad vahet teha lehekülgedel, millel tegelikult paikneb sisu ning neil, mis on üles riputatud vaid selleks, et veebiliiklust järgmisele veebiküljele suunata.

See, kuidas otsingusõna on leheküljel esitatud, mängib olulist rolli selles, kuidas Google’i otsing lehekülgi leiab. Kuigi sõnu otsitakse terve lehekülje ulatuses, on näiteks pealkirjas leiduv sõna mootori arvates parem. Kui pealkirju on leheküljel mitmes suuruses, loeb mootor tähtsamaks suuremad pealkirjad.

Samuti on oluline, kui tihti otsingusõna lehel esineb. Kindlate otsingusõnadega liialdamist tuleks vältida, aga selle leheküljel paljudesse kohtadesse hajutamist soovitavad need, kes tegelevad lehekülgede otsingumootoritele sobivaks optimeerimisega.

Google otsingualgoritmi kõige olulisem osa on PageRank-süsteem, patenteeritud automaatprotsess, mis määrab ära, kuidas otsingutulemused järjestatakse. Internetiotsijate enamik pöörab tähelepanu vaid paarile-kolmele leheküljele, mis esitatakse otsingutulemuste tipus.

Kuidas siis Google määrab otsingutulemuste järjekorra? Kuigi paljud on püüdnud sellele saladusele jälile jõuda, kaitseb Google algoritmi saladust kiivalt. Ühtteist on siiski teada:

* PageRank annab igale otsingutulemusele hinde. Mida kõrgem see on, seda kõrgemal otsingutulemuste hulgas lehekülg kuvatakse.

* Hinde määrab peamiselt see, kui palju teisi netilehekülgi seda külge lingib. Iga link läheb arvesse justkui ühe häälena. Asja loogika on selles, et hea ja kvaliteetse sisuga lehekülgi lingitakse ilmselt rohkem kui neid, mille sisu on kesine.

* Kõik hinded pole võrdsed. Lingid kõrgelt hinnatud lehekülgedelt maksavad rohkem kui hääled madalama hinnanguga külgedelt. Niisiis ei anna mingit efekti, kui avada trobikond tühju lehekülgi, mis lihtsalt sisaldavad linki leheküljele, kuhu te tegelikult soovite külastajaid meelitada.

* Mida rohkem linke ühelt leheküljelt välja läheb, seda väiksema kaaluga on selle lehekülje hääl. Teisisõnu – kui kõrge hindega leheküljelt läheb välja sadu linke, siis on nende häälte hind madalam. Kui linke oleks vaid mõnele üksikule küljele, oleks häältel suurem kaal.

* Lehekülje hinnet mõjutavad veel näiteks kaua on lehekülg olnud üleval, samuti domeeninimi, kuidas otsingusõnad leheküljel esinevad ning kui vanad on leheküljelt väljuvad ja sellele sisenevad lingid. Google’i algoritm paistab hindavat rohkem neid lehekülgi, mis on olnud juba mõnda aega tegevuses.

* On väidetud, et Google kasutab inimesi, kes hindavad otsingutulemusi ning sorteerivad neid seejärel, et parimad lingid esile tõsta. Google on seda eitanud, väites, et kuigi otsingumootori palgal on terve rida inimesi, kes testivad otsingumootorile tehtud uuendusi, ei sorteeri inimesed siiski tulemusi ega anna lehekülgedele hindeid.

* Google strateegia toimib libedalt. Keskendudes linkidele, mis lehele sisenevad ja väljuvad, suudab otsingumootor tulemusi hõlpsasti korrastada. Kuigi on terve rida trikke, mida lehekülgede hinde parandamiseks saab ette võtta, on üks kindlamaid lahendusi pakkuda oma lehel kõrgekvaliteetset sisu, mis ajendab teisi panema oma leheküljele teie lehekülje linki.

* Google väidab, et kohta otsingutulemustes osta ei saa. Kõik tulemused on järjestatud PageRank-süsteemi antud hinnete põhjal. Samas müüb Google reklaamlinke, mis paigutatakse otsingutulemuste kohale ja kõrvale, aga need on eraldi tähistatud, et otsija suudaks vahet teha otsingutulemuste ja raha eest ostetud reklaamlinkide vahel.

 

Prism Skylabs 07.02.2012 12:18

Järgmine samm tarbijakäitumise uurimises: turvavideod (2)

Turvasalvestisi analüüsiv tarkvara võimaldab kaupmeestel kaardistada klientide ostukäitumist kaupluses.

Adeen Flinker/UC 02.02.2012 15:09

Kuidas mõtteid pealt kuulata? (1)

Teadlased demonstreerisid meetodit, mis võimaldab mõtteid lugeda.

31.01.2012 09:14

Multimeediaajastu pärsib teismelise sotsiaalset arengut (1)

Pidevalt erinevaid digitaalseid seadmeid samaaegselt kasutavad teismelised tüdrukud on sotsiaalses ja emotsionaalses arengus vähem edukad, näitas värske uuring.

27.01.2012 12:50

Uus kinokeskkond mängib kõigi meeltega (1)

Digirevolutsioon planetaariumides viib filmivaatamise täiesti uuele tasemele.

24.01.2012 12:05

Video: Kuidas töötab ajavari?

Nähtamatuks muutev ajavari toimib tänu laserimpulssidele.

18.01.2012 09:35

Google ennustab gripilaineid

Gripiga seotud otsingusõnu analüüsiv Google’i töövahend suudab haiglaid hoiatada gripipatsientide tulva eest tõhusamalt kui tavapärane haigusstatistika, näitas värske uuring.

17.01.2012 12:01

Randmepael ühendab inimese nutimajaga

Teadlased arendavad anduritega varustatud märkamatut randmepaela, mis aitab luua ruumisviibijale sobilikud tingimused.

11.01.2012 14:46

Video: Nanotöötlus muudab nutitelefoni veekindlaks

Uus toode katab elektroonikaseadmed nii seest kui väljast juuksekarvast õhema läbipaistva vett tõrjuva kihiga.

09.01.2012 17:41

Selgus sudoku vähim võimalik algseis (4)

Iiri matemaatikul õnnestus tõestada, et sudokus peab ühese lahenduse jaoks olema ette antud vähemalt 17 numbrit.

29.12.2011 00:01

Mida salvestas Alexander Graham Bell?

Algeliste helikandjate optiline skaneerimine võimaldas teadlastel kõlama panna telefoni leiutamisega kuulsaks saanud Alexander Graham Belli laboris 125 aastat tagasi salvestatud helilõigud.

20.12.2011 12:43

Andmeanalüüs muutub tõhusamaks (1)

Uus tööriist aitab teadlastel avastada tohututes andmekogudes seni märkamatuks jäänud seaduspärasi ja seoseid.

19.12.2011 10:04

Tarkvara teeb hitiennustusi

Briti teadlaste loodud tarkvara suudab ennustada laulu hitipotentsiaali.

06.12.2011 14:57

Hiirekäsi, SMS-pöial... nüüd siis nutitelefoni-kael (1)

Tunnid tillukese ekraani ees võivad valusalt kätte maksta.

28.11.2011 09:57

Uus tehnoloogia aitab sõpradega trehvata

Ameerika teadlaste loodud süsteem ennustab ette inimeste liikumist ja asukohta.

23.11.2011 18:17

Video: tillukesed robotid teevad koostööd

Harvardi ülikooli teadlased ja insenerid on väljatöötanud tehnoloogia, mis suudab kollektiivset käitumist kirjeldavaid algoritme katsetada sadade või isegi tuhandete minirobotite peal.

22.11.2011 08:49

Pahavara sihib Androidi

Android platvorm on pahavaratootjate uus lemmik, väidab viirusetõrjefirma McAfee värske aruanne. Lõppev aasta tõotab püstitada rekordi nii üldise kui nutitelefonide pahavara leviku osas.

Raigo Pajula Postimees/Scanpix 02.02.2012 13:08

Nutitelefon aitab talvise linnumaja külalisi ära tunda

Talvel aia linnumajas kõhtu täitmas käivate linnuliikide määramisel saab nüüd appi võtta äsjavalminud eestikeelse nutitelefonirakenduse.

31.01.2012 08:58

Uus kiip tõotab kiiremat elektroonikat

Loodusliku mineraali molübdeniidi kasutamine mikrokiipide valmistamisel tõotab väiksemaid ja kiiremaid elektroonikaseadmeid.

26.01.2012 16:59

Juhtmevaba seade juhib aju

Ameerika idufirma loodud seade võimaldab juhtmevabalt manipuleerida laboriloomade ajurakkudega.

24.01.2012 11:38

Video: YouTube täitub meeletus tempos

YouTube’i laetakse iga sekundiga terve tund uut materjali, minutis lisandub 60 tundi videot.

17.01.2012 15:57

Kes käis? Nutitelefon teab

Lumises metsas loomajälgi tuvastades on nüüd võimalik abi saada oma nutitelefonist.

13.01.2012 09:12

Kas arvutid vajavad oma võrgulehekülgi?

Eraldi võrguleheküljed inimeste ja arvutite jaoks muudaks andmete kasutamise ja jagamise internetis lihtsamaks.

11.01.2012 12:38

Google muutub kasutajakesksemaks (1)

Google'i internetiotsing hõlmab nüüdsest ka Google+ postitusi ja Picasa pildialbumeid, mistõttu sisaldavad otsingutulemused rohkem personaalset informatsiooni.

05.01.2012 14:13

Ahvid hakkavad skaipima

Ameerika loomaaiatöötajatel on plaanis õpetada orangutanidele selgeks iPadi abil Skype'i kaudu suhtlemine.

27.12.2011 08:00

Autoiste tuvastab juhi isiku (1)

Tulevikuautod võivad tuvastada rooli taha istunud isiku tema tagumiku parameetrite järgi.

19.12.2011 12:10

Milliseks muutub elu järgmise viie aasta jooksul?

IBM avalikustas järjekordse iga-aastase ülevaate „IBM Next Five in Five“ innovaatilistest uuendustest, mis võivad järgmise viie aasta jooksul muuta meie elu.

12.12.2011 18:05

Ajamasin lubab vaadata interneti eilset päeva

Milline nägi välja teie kodulinn poole sajandi eest? Fotod on siin abiks. Aga milline oli kümne aasta eest veebileht, mida te täna iga päev külastate?

01.12.2011 08:52

WiFi võib kahjustada spermat

Võrguvaba interneti tehnoloogia võib kahjustada meeste seemnerakke, näitas värske uuring.

25.11.2011 15:01

Milleks seentele Facebook? (1)

Kui seenekorjaja suudab metsas kukeseente, puravike, riisikate ja pilvikute seas veel orienteeruda, siis seeneteadlaste elu on märksa keerulisem.

22.11.2011 17:32

Maailm on tõesti väike

Väiksem, kui arvata oskate.