19.05.2011 15:04
Korrapäratus – universaalne keelereegel
Foto: Flickr/James Morrison
Sõnajärjes sisalduva informatsiooni hulk on kõigis
keeltes sama, sõltumata sellest, kas keeled on omavahel seotud või mitte.
See kooskõlalisus võib vihjata meie esivanemate ühisele
algkeelele või universaalsetele ajuprotsessidele kõne töötlemisel.
Ajakirjas PLoS ONE ilmunud artikli autori ja Manchesteri
ülikooli süsteemibioloogi Marcelo Montemurro sõnul ei oma tähtsust, millist
keelt vaadelda.
Tema sõnul on isegi nii erinevate keelte kui hiina,
inglise ja sumeri keeles lingvistilise korrapärasuse ehk sõnade seadmise viisi
mõõduks midagi, mis tundub olevat keelte üldmõiste.
Keel kannab tähendust edasi nii valitud sõnade, kui ka
nende järjestuse kaudu.
Osades keeltes, näiteks soome ja eesti keeles, on suur
osa tähendusega seotud muutustest seotud sõna enda vormi muututmisega, näiteks
erinevatel käänetel on erinevad lõpud. Nendes keeltes on sõnajärjekord
suhteliselt vaba.
Teistes keeltes, näiteks inglise keeles, ei ole sõnade
seadmise vorm samas nii paindlik. "Jüri armastab Mari" tähendab
midagi muud kui "Mari armastab Jüri".
Montemurro taipas, et ta on suuteline koguseliselt
väljendama sõnajärjes kodeeritud informatsiooni hulka, arvutades välja teksti
"entroopia" ehk kui ühtlaselt sõnad tekstis jaotuvad. Üldmõistena
tähendab entroopia süsteemi korrapäratuse määra.
Uuringu kaasautor, Argentina riikliku tuumaenergia
komisjoni teadlane Damian Zanette arvutas informatsiooniteooria meetodite abil
välja kaheksas erinevas keeles olevate tuhandete tekstide entroopia.
Keelteks olid inglise, prantsuse, saksa, soome, tagalogi,
sumeri, vanaegiptuse ja hiina keel.
Seejärel seadsid teadlased kõik sõnad juhuslikult ümber
tekstides, mis ulatusid Shakespeare'i teostest kuni sumeri savitahvlitele
kirjutatud palveteni.
Montemurro sõnul võib originaalteksti sõnu segi ajades
hävitada, kuid sõnavara säilib. Sel moel teksti hävitades hävineb lingvistiline
korrapärasus - seaduspärasused, mida me
kasutame informatsiooni kodeerimiseks.
Teadlased leidsid, et originaaltekstid kajastasid
erinevusi keele grammatikas ja struktuuris. Kummalisel kombel oli aga erinevus
algse korrastatud teksti ja juhuslikult sassi aetud teksti korrapäratuse vahel
kõigis keeltes konstante.
Montemurro sõnul võimaldab see erinevus mõõta sõnajärjes
kodeeritud informatsiooni hulka. Teksti sassi ajamisel kaotsi läinud
informatsiooni hulk oli umbes 3,5 bitti sõna kohta.
Tema sõnul tegid nad huvitava avastuse - kõigis keeltes
oli see väärtus peaaegu täpselt sama. Mingil põhjusel on need keeled välja
arenenud nii, et selle sõnajärje seaduspärasuse piiresse jääda.
Montemurro arvab, et see kooskõlalisus võib peegeldada
teatud kognitiivseid piiranguid, millega inimeste aju kokku põrkub või
võimaldada tagasivaadet keele arengule.
Teadlased vaidlevad tänaseni selle üle, kas keeltel on
universaalseid tunnuseid või ei ole.
Osa
teed rajavaid keeleteadlasi arvab, et keeled arenevad vastavalt piiratud
reeglitekogumile, mille tulemuseks on sarnased tunnused keelte grammatikas ja
struktuuris. Eelmisel kuul avaldatud uuring, mis vaatles tuhandete keelte
struktuuri ja süntaksit, selliseid sarnaseid reegleid aga ei avastanud