Ameriško kulturno onesnaževanje sveta je že zdaj pereča problematika, z uvedbo umetne inteligence pa se zlahka zgodi, da se bomo nekega jutri zbudili Američani! Na sprijeni način podobno, kot so v Matrici vsi postali agenti Smith.
Naslednje mi je dalo misliti. Telekomov sprejemnik Neo je ena redkih naprav, ki tekoče razume slovenščino. Razume celo ukaze, ki niso popolnoma znotraj definicije zbornega jezika, zgolj zato, da je lažje najti televizijske kanale, vsebine in kategorije v nastavitvah. Zdaj pa k težavi. Pred kratkim so omogočili povezavo z Googlovim Pomočnikom in Alexo. Dodatek k prejšnjim možnostim je ugašanje in prižiganje, toda zdaj morate ukazovati v skoraj popolni angleščini. Če želite, da vas razume, potem nikar ne recite »neo«, temveč »nio«. In tako naprej. Podobno je z ukazovanjem v avtomobilu, »pokliči andrejo«, postane »kol andžreja«, in še kje. Vrsto let že poznamo funkcijo govornih ukazov, toda niti na misel jim ne pride, da bi omogočili razumevanje manjših svetovnih jezikov. Mlajši boste pripomnili, »pa kaj«, starejšim bo vseeno, a meni ni. Od tehnoloških podjetij pričakujem, da se nehajo delati norca in začnejo prilagajati storitve delovanju v različnih jezikih. Ni težko, kot dokazuje Neo, le odločiti se je treba in začeti prilagajati algoritme.
Algoritmi umetne inteligence za priljubljenimi boti, kot je ChatGPT, so odvisni od velikih jezikovnih modelov, kar pomeni, da je jezik v središču inovacije. Evropska unija zato želi, da tehnologija upošteva kulturne in vsebinske posebnosti 24 uradnih jezikov, s čimer si pretežno ameriška tehnološka podjetja pretirano ne belijo glave. Njihovi predstavniki bodo dejali, da boti razumejo veliko jezikov. Res je, z njimi se zlahka pogovarjate v slovenščini, a v ozadju poteka prevajanje v in iz angleščino. Pa to sploh ni bistvo. Osrednja težava je, na čem so algoritmi pridobivali znanje – na besedilih v angleščini, zaradi česar imajo zelo enostranski pogled.
Kultura je v ostrem boju s tehnološkimi podjetji glede kulturnih vsebin, vključno s filmskimi scenariji, medijskimi arhivi in celo avtorskimi pravicami glasbenih umetnikov.
Tudi če ne gre za angleščino, so večji jeziki v prednosti. Špancem ne bo težko vložiti v razvoj velikega jezikovnega modela, samo pomislite, v koliko državah je španščina uradni jezik. Podobno je z nemščino, francoščino in še kakšnim jezikom. Vsi ti bodo pridobili vpliv, kar se nenazadnje že dogaja. Američani sklepajo dogovore z nemškimi in francoskimi medijskimi hišami, saj želijo, da se algoritmi učijo na njihovih korpusih besedil. Vendar to ne reši problema. Eno je jezik, drugo kulturne posebnosti. Marsikomu se ne zdi nič posebnega, če objavi na družbenem omrežju fotografijo golega otroka, ki se igra na obali jadranskega morja (oziroma nam to ni bilo tuje), medtem ko algoritem za modeliranje objav takoj pomisli na pedofilijo. To je zgolj skrajni primer razlik. Koliko je še manjših, ki nas še bolj razlikujejo?
Raziskovalci na University College London so lani ugotovili, da Googlov in OpenAIjev »bot« nista v koraku s kulturnimi normami dobršnega dela držav, a sta brez težava opravila teste glede spoštovanja običajev v Združenih državah.
Američanom ne moremo preprečiti, da bi razvijali in algoritme nudili tostran Atlantika, vendar ne moramo več čakati na njihove. Razviti bomo morali svoje algoritme in svoje jezikovne modele, kajti drugače bo prevlada angleščine ter ameriškega načina življenja in njihovega pogleda na svet v Evropi kvečjemu še večja.
Naslovna fotografija: DepositPhotos
Brez komentarjev