Sisemine dialoog tehismõistusest

JAAN ARU

Mul on tehismõistusega keerukas suhe. Aju-uurijana kipun arvama, et inimmõistusest nupukama tehisintellekti tegemine ei ole sugugi kerge ja sellega läheb veel kaua aega. Aga samal ajal on areng tehisintellektis nii kiire, et vahel tundub endalegi, et oleme väga lähedal. Niisiis otsustasin kirja panna mõlemad pooled enda sees – lugeja ise otsustagu!

J1: Miks sa arvad, et seekord läheb teistmoodi? Supernutikat tehisintellekti on oodatud juba XX sajandi keskpaigast alates, seni pole teda kuskilt paista olnud.

J2: Alates sellest, kui umbes kümme aastat tagasi saadi esimesed edukad tulemused sügavate närvivõrkude vallas, on areng olnud ootamatult kiire.

J1: Ma kähku lisaksin siia, et sügavaid ehk siis mitme kihiga tehislikke närvivõrke püüti tööle saada juba 1980ndatel, seega mulle näib, et praegune sügavõppe edulugu põhineb peamiselt võimsamal arvutustehnoloogial, mis on rakendatud suurtele pildikogudele, mitte niivõrd mingil kontseptuaalsel läbimurdel.

J2: Tähtsates leiutistes on alati teisi tükke osavalt kombineeritud! Nii näiteks leidis 2013. aastal idufirma DeepMind viisi, kuidas sügavaid närvivõrke treenida sõltuvalt keskkonna tasudest – kuidas positiivne tagasiside viib samm-sammult süsteemini, mis oma keskkonnas hakkama saab.1 See programm õppis arvutimänge mängima, ilma et talle oleks koodi sisse kirjutatud, kuidas neid mänge mängida. Sama kood lahendas mängu, kus tuleb kontrollida allveelaeva ja tulistada haisid; mängu, kus tuleb edukalt juhtida autot; mängu, kus reketiga tuleb palli tabada ja palju teisi, ilma et programmis oleks olnud ridagi allveelaevade, haide, autode, autoteede, pallide ja reketite kohta. See tehismõistus lihtsalt katsetas ja õppis järk-järgult neid mänge mängima, jõudes tihti inimestest parema soorituseni. DeepMindi meeskond lõi hiljuti ka süsteemi, mis õpib mängima lauamängu „GO“ ilma vähimagi inimesepoolse sisendita ja võidab maailma parimaid mängijaid.2

J1: See on muidugi selge liialdus: inimesed mõtlesid selle süsteemi välja, kirjutasid selle süsteemi koodi, valisid tema tehismõistuse arhitektuuri, kirjutasid sisse mõned teadmised „GO“ kohta. Näiteks kui sellele väga targale masinale anda poole väiksem mänguväli, siis ta peaks uuesti mängima õppima, samas kui inimene suudaks koheselt väiksemale mänguväljale ümber kohaneda. Ja lõpuks, „GOst“ inimliku mõistuseni on ikka väga pikk tee minna.

J2: Defineeri inimlik mõistus!

„GO“ mäng maailma esinumbri Ke Jie ja Google’i programmi AlphaGo vahel eelmise aasta mais.

AFP Photo / STR / China OUT / Scanpix

J1: Kui inimlik „GO“-mängija lõpetab mängu, siis võib ta endale teha kiluvõileiva; avada veinipudeli isegi siis, kui avajat ei ole; ta võib vestelda kultuurist ja lugeda ajalehte; ta võib pumbata tühjaks solgikaevu või pesta puhtaks koera; ta võib sõita jalgrattaga ja lahendada ristsõnu; ta võib šopata internetis või kütta ahju. Kõik need tegevused üksikuna tunduvad lihtsad ja isegi tobedad, aga inimese teeb eriliseks see, et ta suudab teha kõiki neid. Ja enamasti veel palju muud.

J2: Olen nõus, et ükski tehismõistuse algoritm praegu selleni ei jõua. PRAEGU.

J1: Su karjuv toon annab mõista, et sa arvad, et see juhtub varsti.

J2: Hiljemalt 2029.

J1: Naeruväärne. 2029. aastal on robotid, kes aitavad nõusid pesta ja süüa teha …

J2: Demod sellistest robotitest on olemas juba praegu!

J1: Olgu, aga ma arvan, et me pole 2029. aastaks väga palju kaugemale jõudnud.

J2: See on naiivne, aga viisaka vestluspartnerina luban sul selgitada, miks sa nii arvad.

J1: Meie arusaam sellest, kuidas aju töötab, on veel üsna vilets ja ega me ka 2029. aastaks väga kaugele jõudnud ole.

J2: Hakkab jälle pihta! Miks meil on tarvis aju mõista? Meil on ülivõimsad tehis­intellekti algoritmid, mis on äkki isegi paremad kui aju. Lennukid ei lehvita tiibu nagu linnud. Rattad koos mootoriga on palju tõhusamad edasiliikumise abivahendid kui loomade ja inimeste keha.

J1: Üks su enda iidolitest, ettevõtte DeepMind asutaja Demis Hassabis on öelnud kenasti: inimese aju on ainus tõend selle kohta, et üldine tehisintellekt, mida ehitada üritatakse, on üldse võimalik. Seega tema arvates tasub aju uurida ja DeepMindi ettevõttes on lausa oma neuroteaduse osakond, mida juhib üks tuntud ajuteadlane …

J2: … kelle DeepMind värbas otse väga healt täisprofessori positsioonilt Princetoni ülikoolist. Temasugused teadlased liituvad tehismõistuse uurijatega just seepärast, et nad näevad, et praegu on põnevad ajad, mil me nuputame välja üldised nupukuse algoritmid. Ja seda pole võimalik teha ajuteaduses, vaid tehisintellekti uurides.

J1: Oma mõju omab kindlasti ka see palgatšekk, mida DeepMind talle iga kuu saadab: isegi Princetoni ülikool ei suuda sellega võistelda, rääkimata väiksematest teadusasutustest. Aga siiski, tulles tagasi meie teema juurde – aju on selles kõiges kesksel kohal!

J2: Mh.

J1: Muuseas, ma ei taha üldse olla ajušovinist! Ka tehisintellekti uuringutest on ajuteadusele palju kasu olnud. Näiteks veel kümme aastat tagasi oli ajuteadlastel kombeks öelda „me ei tea, kuidas nägemine ajus toimub“, aga nüüd on meil tehisintellekti algoritmid, mis suudavad objekte ära tunda sama hästi kui inimesed. Ja mis veelgi hämmastavam – need algoritmid ennustavad ka seda, kuidas aju ühele või teisele pildile reageerib.3 Ajuteadlasel oleks rumal ignoreerida tehisintellekti uuringutest tulevaid teadmisi, aga samamoodi oleks tehisintellekti uurijal rumal eirata ajuteadust.

J2: Olgu. Näiteks mida mina, tehisintellekti uurija, võiks teada ajust?

J1: Selliseid aspekte on väga palju!

J2: Nimeta üks, ole konkreetne. See häiribki mind sinusuguste bioloogide puhul: te hämate sellest, et aju on keerukas, aga mul on tarvis lahendada konkreetne probleem, näiteks luua masin, mis oskaks mul saapapaelu kinni siduda. Mul on tarvis ideid, mille põhjal saan kirjutada arvutile programmi, mitte üldist jahu ajust.

J1: Muuseas, ajujahu on päris hea nimetus mõnele tootele!

J2: Jah, näiteks bioloogide või psühholoogide või filosoofide heietustele.

J1: Aga siin sa näedki, kui erinevalt inimese aju tehissüsteemist töötab. Ma kuulsin su fraasi „mitte üldist jahu ajust“ ja lisaks sellele, et ma sain aru su kriitikast, tekkis mul ka uus ja huvitav mõte ajujahu kohta. See sõnaühend tõmbas mu tähelepanu ja sai meie edasise vestluse osaks. Aga üldisemalt võib öelda, et me ei saa praegu üldse aru, kuidas inimaju lauseid mõistab ja neist uusi kombinatsioone luua suudab. Näiteks eelmine lause ei tähenda tehismõistuse jaoks midagi; sõna „ajujahu“ ei ole tema jaoks ei huvitav ega sisukas, see on lihtsalt märkide rida. Tehismõistusele ei saa tähendust sisse kirjutada. Ta suudab paljude andmepunktide pealt õppida õigesti vastama, aga ta ei saa midagi aru.

J2: Mis imeloom see „tähendus“ siis on?

J1: Eem, tähendus on …

J2: Täpselt, tähendusele on antud palju tähendusi, aga see ei aita meid palju edasi. Hoopis tähendusrikkam on see, et ka väiksele lapsele ei ole ajujahul mingit tähendust. Tähendused on õpitud, arusaamine tekib alles harjutamise järel. Ka inimese ajus on tarvis pikka treenimist, enne kui sõnad midagi tähendavad. See, mida üks või teine sõna ühe või teise inimese jaoks tähendab, on erinev. Näiteks „konvolutsiooniline neurovõrk“ ei tähenda isegi erudeeritud humanitaar­valdkonna inimesele mitte midagi, samas kui tehisintellektist huvituv teismeline teab, mis see on. Tähendus tekib siis, kui objekte ja sõnu õiges kontekstis kasutatakse. Tehisintellekt ei ole selles suhtes inimesest erinev ja tähendus ei ole midagi erilist.

J1: Esiteks ma ei nõustu ja teiseks ilmnebki siin suur vahe tehismõistusega. Tõesti, nii inimene kui ka tehismõistus muutuvad paremaks, kui nad õpivad ja sõnu kasutavad. Aga inimene suudab aru saada ka uutest sõnadest ja lausetest. Ka sõnadel ja lausetel, mida ma varem ei ole kuulnud, on tähendus.

J2: Ma ikkagi ei saa aru, kuidas sügava närvivõrgu poolt õpitud „tähendus“ erineb „tähendusest“ inimese või looma jaoks.

J1: Näiteks võtame tehisnägemissüsteemi, mis suudab objekte ära tunda paremini kui inimene: suur sirmik, martsipanist kuju, bonobo (ehk kääbusšimpans – toim), allveelaev ja tuhat muud objektide kategooriat kõik saavad pea täpselt ära tuntud. On aga korduvalt näidatud, et on võimalik võtta see väga nupukas süsteem ja muuta pildil ainult ühte või vaid paari pikslit, nii et see korrektne äratundmine muutub valeks – süsteem ütleb bonobo asemel jalgratas või redel.4 Inimese puhul võib neid üksikuid piksleid vahetada palju tahad, aga jalgratas jääb jalgrattaks, redel redeliks. Seega, kui masin on hästi treenitud, on inimese ja masina nägemisosavus samal tasemel, kuid see ei tähenda, et masinate nägemine oleks sama paindlik ja mitmekesine kui inimestel ja loomadel. Praegused nägemisalgoritmid suudavad hakkama saada nende objektidega, mille kohta neil on palju treeningandmeid, nad ei suuda üldistada.

J2: Ega inimene ka veatu ole! Näiteks pidime tegelikult ju rääkima üldse sellest, mida ajuteadus tehisintellekti uuringutele öelda saaks, aga oleme sellest teemast nüüd väga kaugele jõudnud.

J1: Tehisintellekt sellist viga ei teeks, eks! Aga mõneti ilmnebki selles „veas“ üks erinevus inimmõistuse ja tehismõistuse vahel: tehismõistusele pilt on pilt ja sõna on sõna; meie jaoks on iga pilt või iga sõna potentsiaalne uute mõtete ja ideede sünnitaja. Seda seetõttu, et meie nägemissüsteem ei ole eraldatud muust ajust – kui me vaatleme midagi tähelepanelikult, siis võib nägemismeele kaudu tulev sisend viia mälusisude aktiveerimiseni, tuua uusi mõtteid ja seoseid.

J2: Oot-oot. Võiks öelda, et tehismõistusele on pilt aktiivsusvektor ja ka sõna on aktiivsusvektor. Need mõlemad on võimalik teisendada ühtsesse vektorruumi.5 Selles ruumis on kergesti võimalik minna pildist sõnani või mingi uue ideeni. See vist ei erinegi palju sellest, kuidas ajus asjalood on: ajus on valuutaks närvirakkude aktiivsusvektorid.

J1: Tjah, pean tunnistama, et olen mingil määral nõus, aga mulle näib, et inimmõistus suudab seal vektorruumi osavamalt teisendada ja painutada. Ehk selgitan seda üldist probleemi ühe konkreetse näitega. Oletame, et abikaasa sokisahtel laguneb ära, on vaja kruvid uuesti kinni keerata. Aga kruvikeerajad on kõik kuuris, väljas sajab vihma ja olen suhkrust. Mida teha? Selles olukorras muutuvad teised maailma objektid potentsiaalseteks kruvikeerajateks. Kui ma esimest korda seda probleemi lahendasin, polnud ma mitte kunagi varem mõelnud, et autovõti võiks olla kruvikeeraja, aga selleks ta sai.

J2: Autovõtit keerad ka nagu kruvikeerajat!

J1: Olgu, õnneks või kahjuks laguneb vahel ka esiku kingakapp. Sealsed kruvid on autovõtme jaoks liiga väiksed – proovisin. Kuna jälle sadas, siis selles olukorras tuli mul pähe, et võiks kasutada poja sööginuga, mis on väiksema otsaga. Ühesõnaga, sellistes situatsioonides suudab aju teha huvitavat sarnasusotsingut: „otsi objekt, mis võiks keerata kruvi“. Autovõti tõepoolest on ise ka keeratav, aga näiteks noaga me tavaliselt ei keera objekte.

J2: Nuga on muidugi pisut kruvikeeraja kujuga.

J1: Õige! Sellegi poolest on see sarnasuste leidmise mehhanism ajus üldisem, võimsam ja paindlikum kui tehismõistuse süsteemides.

J2: Mida see tähendab? Mine pane otsingumootorisse visual question answering ja näed, et tänapäeval saab tehismõistuse süsteemile sisestada suvalise pildi ja talt näiteks küsida „mitu silda on pildil?“ või „mis värvi on lehed?“ või „mida teeb punase särgiga tüdruk“ ja ta vastab õigesti, ehkki pole seda pilti kunagi varem näinud.6 Selleks peab ta küsimuse teisendama vektorruumi ja samuti ka pildi, seejärel otsima küsimuse aktiivsus­vektorile sarnast aktiivsusvektorit pildilt. Ja voilà, saabki hakkama. Mida veel tahta?

Robotkelnerid Harbinis Heilongjiangi provintsis Hiinas.

Sheng Li / Reuters /Scanpix

J1: See nupukas süsteem istub kuskil serveris ja teisendab vektoreid. Tegu on tänapäeva versiooniga Hiina ruumist – tähenduseta märgid ruumi sisse, tähenduseta märgid välja, tagasiside ja pika-pika treeningu järel saavad sisend- ja väljundmärgid õigesti seostatud. Aga seal ei ole tähendust, see on tähenduse illusioon! Suur erinevus tehismõistusega on see, et inimesed tegutsevad maailmas, nad muudavad maailma, nad õpivad tähendusi selle kaudu …

J2: Mis vahet seal on, tehismõistus ka tegutseb arvutimängus, oma otsustega muudab seda ja õpib tähendusi selle kaudu.

J1: Nagu ikka, katkestasid sa mu poole argumendi pealt. Ma tahtsin öelda, et inimesel, isegi kaheaastasel, või ka loomadel on mingi eesmärk, nad tahavad midagi. Tähendus sünnib tahtmise kaudu.

J2: Selle mõtlesid sa küll just praegu välja!

J1: Ehk tõesti! Aga mõtle sellele: praegused tehissüsteemid ei taha midagi. Jah, ma juba näen su näost, mida sa tahad öelda: nad tahavad punkte ja stiimulsüsteemi tööd. Aga mis juhtub, kui nad seda ei saa? Ikka oleksid nad seal arvutis või serveris vangis, samasugused programmid. Nad ei vaja punkte ja sisendvektoreid, nad on programmid. Samas bioloogilise organismi jaoks on olemas baasvajadused, mis sunnivad teda keskkonnas tegutsema. Kui ta süüa ei saa, siis on tema eksistentsi lõpp. Kui ta ei suuda end kiskja eest varjata või kaitsta, siis on mäng läbi. Elussüsteemid on motiveeritud elama.

J2: Niisiis, kas su kaitse on tõrjutud positsioonile „elusorganismid on elus ja seetõttu ei saa elusorganismi intelligentsi järgi teha“?

J1: Esiteks on väga tähtis märkida, et ma olen kindel, et inimesest nutikam tehismõistus kunagi luuakse, ma lihtsalt arvan, et sinna läheb veel aega. Teiseks arvan, et selles sinu sõnastatud väites on tükike tõde ka. Elusorganismil on eesmärk püsida elus ja saada järglasi; need baaseesmärgid viivad teiste eesmärkideni – õppida maailma kohta, saada teistest inimestest aru, leida endale sobiv partner paaritumiseks …

J2: Teie, bioloogid mõtlete alati ainult seksist, sellal kui meie, tehisintellekti uurijad üritame lahendada mõistuse mõistatust!

J1: Aga ehk need kaks on omavahel seotud! Bioloogilise intelligentsuse eesmärk ei ole lahendada intelligentsusteste, mängida „GOd“, luua heliteoseid või naerda karikatuuride üle. Aga kõik need oskused võivad kaasneda, kui meie aju sarnane keerukas süsteem paigutatakse inimeste ja inimkultuuri keskele, kus ta peab umbes kaks kümnendit kujunema, enne kui jõuab geenide edasiandmiseni.

J2: Olgu. Aga kas tead, et sa pole mulle ikkagi veel andnud ühtegi vihjet selle kohta, kuidas paremat tehismõistust ehitada.

J1: Või olen neid andnud juba väga palju?

J2: Palun ütle vähemalt midagi sisukat, muidu keeldun edaspidi igasugusest interdistsiplinaarsest teaduskoostööst!

J1: Proovime nii: tänapäeva tehismõistuse algoritmide peamine õppimisviis on õppida seoseid keskkonna objektide ja reaktsioonide vahel. Kui arvutimängus tulnukate kosmoselaev liigub nii, siis tulista. Said pihta? Tulevad punktid, mis kinnistavad selle keskkonnaseisundi ja reaktsioonide vahelise seose. Aga arvan, et võiks rohkem rõhku panna sellele, et kõik ei alga mitte keskkonna objektidest, vaid hoopis organismi eesmärkidest. Alguses oli eesmärk, mitte sõna. Organismi jaoks võib üks ja sama keskkonnaseisund viia väga erineva reaktsioonini sõltuvalt hetke-eesmärgist. Näiteks tühja kõhuga on kommipaber lakkumiseks, aga täis kõhuga saab sellest kas tore krabisev objekt või muu mänguasi. Nagis rippuv autovõti muutub kruvikeeraja asendajaks, kui eesmärgiks on parandada sokisahtlit. Meie maailm muutub sõltuvalt eesmärgist.

J2: Ma olen mingil määral nõus. Kui mu eesmärk oleks bioloogiga tüli norida, siis ma keskenduksin sellele, kui ebatäpne termin see „eesmärk“ on, aga kuna mu eesmärk on vestlusega edasi minna, siis ma küsin: meil ju on teatud uued süsteemid, näiteks niinimetatud feudaalvõrgustikud,7 kus süsteem üritab ise eesmärke tekitada – mis on neis võrgustikes puudu? Või arvad, et kui neid teha suuremaks ja võimsamaks, siis nad jõuavad peagi inimmõistuse lähedale?

J1: Feudaalvõrgustikud tõesti tekitavad ise eesmärke, aga kui need eesmärgid ei täitu, siis ei juhtu mitte midagi. Programm on serveris edasi. Organismide ajus on eesmärgid justkui sunnitöö: täitmata eesmärk surub meid nende täitmise poole ja eesmärgi mittetäitumine võib olla tõeline painaja. Kui mu kaheaastane tütar ei saa endale kleiti õigesti selga, siis ta on frustreerunud; kui mu nelja-aastane poeg ei saa legosid õigesti kokku, siis annab ta sellest väga kõva häälega märku; kui suure inimese tööülesannete hulk on liiga suur, võib tagajärjeks olla läbipõlemine. Eesmärgid põletavad meid, kuni nad on saavutatud. Ma ei tea, kuidas me selle tehisvõrgustikesse sisse kirjutame, aga ehk peaksime proovima.

J2: Tule, ma näitan sulle tahvli juures üht ideed.

Ja nad asuvad kahekesi tahvli juures arutama. Nagu enamik tehisintellekti uuringute ideid, nii on ka nende ideed ilmselt naiivsed ja ebapiisavad. Teaduses ongi võimatu kohe tulla õige idee peale – tuleb proovida seda, mis ennast kütkestab ja kannustab ning nende mõtetega pühendatult tegeleda. Ainult aeg näitab, kas ponnistusele järgnevad uued avastused või oli tegu järjekordse ajujahuga.

Autor tänab Tambetit sisukate mõtte­vahetuste eest.

1 Mnih, Volodymyr, et al. Playing atari with deep reinforcement learning. arXiv preprint arXiv:1312.5602 (2013).

2 Silver, David, et al. Mastering the game of go without human knowledge. Nature 550.7676 (2017): 354.

3 Yamins, Daniel LK, and James J. DiCarlo. Using goal-driven deep learning models to understand sensory cortex. Nature Neuroscience 19.3 (2016): 356–365.

4 Su, Jiawei, Danilo Vasconcellos Vargas, and Sakurai Kouichi. One pixel attack for fooling deep neural networks. arXiv preprint arXiv:1710.08864 (2017).

5 Karpathy, Andrej, and Li Fei-Fei. Deep visual-semantic alignments for generating image descriptions. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2015.

6 Nt http://www.visualqa.org/

7 Vezhnevets, Alexander Sasha, et al. Feudal networks for hierarchical reinforcement learning. arXiv preprint arXiv:1703.01161 (2017).

Kui sulle meeldis see postitus jaga seda oma sõpradega

[LoginRadius_Share]
 

Leia veel huvitavat lugemist

Värske Rõhk
Hea laps
LR
Keel ja kirjandus
Akadeemia
Kunstel
Muusika
Õpetajate leht
Täheke
TeaterMuusikaKino
Vikerkaar
Looming
Müürileht