Po večletnem razvoju programskih algoritmov, analize velikih podatkov in strojnega učenja, se bomo letošnjega leta spominjali kot prelomnice. Ko je umetna inteligenca pokazala, v čem naj bi bila boljša od človeka. Pri tem boste nekateri pomislili, da bi veljalo razvoj upočasniti.
Prvič se je lahko vsak od nas na lastne oči prepričal o zmogljivosti generativne umetne inteligence, ki odgovarja na še tako zapletena vprašanja in na zahtevo ustvarja umetnine. Tehnologije umetne inteligence, ki za nekajkrat presegajo sposobnosti algoritmov za zaznavo fotografskega prizora in prilagajanje nastavitev ali algoritmov učinkovitejše rabe energije v telefonih, so po desetletjih razvoja postale zrele za komercialne aplikacije.
Novice o dosežkih so bile pogoste in večino njih sem obravnaval z dobršno mero zdravega razuma, medtem ko sem se vsakič znova skušal otresti spremljajočega nekritičnega navdušenja. A kljub dobršni meri skepse je tudi meni jasno, da smo bili priča nečemu, kar bo tako ali drugače vplivalo na prihodnost.
Aprila je podjetje OpenAi napovedalo model ustvarjanja slik (ISM – image synthesis model) Dall-E 2, ki uporablja tehniko latentne difuzije (latent diffusion). Model so urili z velikimi zbirkami slik, katerih vir je bil internet. Tam so namreč našli na milijarde fotografij in slik z besedilnimi opisi, ki so bili nujni del učenja umetno inteligentnega ustvarjalca digitalnih umetnin. Dobili smo dvornega slikarja, ki je vedno na razpolago in lahko skoraj v trenutku ustvari umetnino po naših zahtevah. Ker ni omejitev v ustvarjalnem opusu in tehniki, so splet hitro preplavila njegova dela. Od decembra je storitev odprta za vse in v demonstracijske namene omogoča ustvarjanje slik v relativno nizkih ločljivostih.
Julija je DeepMind objavil, da je njegov model umetne inteligence AlphaFold AI napovedal obliko skoraj vseh znanih beljakovin z zaporednim genomom. Model, ki je bil zagnana leta 2021, da bi napovedal obliko človeških beljakovin, je v enem leto zbirko razširil na več kot 200 milijonov beljakovinskih struktur. Hrani jih javna zbirka Evropskega inštituta za bioinformatiko pri Evropskem laboratoriju za molekularno biologijo (EMBL-EBI), kjer so na voljo raziskovalcem iz vsega sveta.
Avgusta sta Stability AI in CompVis izdala model sinteze slik Stable Diffusion. Podoben je že omenjenemu modeli DALL-E 2. Toda medtem ko je ta zaprt in s precejšnimi omejitvami, je Stable Diffusion prostokodni projekt in dovoli delovanje lokalno in zasebno na osebnem računalniku z dovolj zmogljivo grafično kartico. To je skoraj takoj sprožilo polemike. Decentralizacija omogoča zlorabe, kot so politične dezinformacije ali ustvarjanje pornografskih slik brez privoljenja. Kot problematično sta se izkazali še pristranskost nabora podatkov in tehnike učenje. Kljub temu (ali ravno zaradi tega) je model široko uporabljen v različnih spletnih storitvah sinteze slik. Tega meseca je ena od treh umetnin Jasona Allena zmagala v kategoriji digitalne umetnosti natečaja v Koloradu. Ustvaril jih je s komercialnim modelom za sintezo slik Midjourney (podoben modelu Stable Diffusion), ki deluje znotraj komunikacijske storitve Discord. Zmaga umetne inteligence nad človekom je pričakovano sprožila ostro razpravo o naravi umetnosti in kaj sploh pomeni biti umetnik. Strokovnjaki vidijo modele za sintezo slik kot neizogiben razvojni korak, umetniki pa kot eksistencialno vprašanje.
Novembra je Meta prestavila bota umetne inteligence Cicera, ki premaguje igralce iz mesa in krvi v spletni igri Diplomacy. Gre za dokajšen uspeh, kajti družabna igra od igralcev zahteva sposobnost prepričevanja, sodelovanja in pogajanja. V svojem bistvu so razbili preprečljivega bota, ki ga igralci ne prepoznajo kot umetnega. Mislijo, da pač igrajo s človekom. Jezikovno komponento so poleg številnih besedil igre učili tudi s 40 tisoč prepisov poteka že odigranih partij. Bot ima še strateško komponento, ki sledi poteku igre in predvideva, kako se bodo drugi igralci obnašali. Tehnologijo nameravajo uporabiti pri razvoju spletnih iger s pametnejšimi »računalniškimi igralci« ter za zmanjševanje komunikacijskih ovir med ljudmi in sistemi umetne inteligence. Možno so ravno tako zlorabe. Predvsem lažno predstavljanje stroja za človeka.
OpenAI nas je ponovno presenetil v začetku decembra, ko so predstavili ChatGPT. Temelji na velikem jezikovnem modelu GPT-3 in kot sem lahko prepričal, razume slovensko. Od vseh modelov umetne inteligence je ravno zadnji predstavljeni požel največ zanimanja. Med drugim so ga uporabili za simulacijo seje konzole sistema Linux, ustvarjanju receptov, pisanju pesem in še za marsikaj drugega. Nekateri so kmalu opazili njegove slabosti. Možno ga je pretentati. Nekdo je vprašal, kdo je predsednik Slovenije. Ko mu je bot vrnil pravilni odgovor, mu je dejal, da se moti. Sprejel je opozorilo in vprašal, kdo pa je predsednik. Lahko ste vpisali, kogarkoli in tega je potem ponudil kot odgovor na enako vprašanje nekoga drugega.
Leta 2022 se nam je razkrila sposobnost umetne inteligence. Čas bo pokazal, v kolikšni meri so letošnji dosežki pomembni oziroma uporabni. Ter še bolj. Kakšno skrinjico smo odprli. Pandorino ali skrinjo napredka?






Brez komentarjev