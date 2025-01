U ovoj godini bi napretci u umjetnoj inteligenciji i glasovnoj tehnologiji napokon mogli ispuniti obećanja koja tehnološki giganti daju već desetljećima.

Kada je 2016. tada novi izvršni direktor Googlea Sundar Pichai predstavio Google Assistanta u sklopu svoje nove agende fokusirane na AI, glasovnog je pomoćnika opisao kao alat koji će ljudima pomoći izvršavati zadatke.

“Google Assistant omogućava vam da obavljate stvari, donosi vam informacije koje trebate, kada ih trebate, gdje god se nalazili,” napisao je on tada u objavi na blogu.

Bio je to ambiciozan cilj koji je uglavnom ostao neispunjen. Prečesto softver ostaje zbunjen upitom, predlaže internetsko pretraživanje i skrušeno priznaje kako ne može pomoći. Zato su korisnici uglavnom glasovne asistente koristili za jednostavne zadatke poput postavljanja tajmera za kuhanje, puštanje glazbe ili kontrolu svjetala. Ni Amazonova Alexa, predstavljena prije deset godina, nije bila ništa bolja. Siri, najnoviji asistent u nizu, podnosi najžešće kritike.

Ipak, u posljednje dvije godine generativna umjetna inteligencija ušla je u mainstream i postavila temelje za takozvane “AI agente”. Riječ je o programima posebno osmišljenim da poduzimaju korake ili izvršavaju zadatke u ime korisnika, poput rezervacija ili online kupovine. “Era agenata”, kako ju zove Pichai, stići će 2025. godine, a to znači da tehnologija sada ima priliku postići nešto što je dosad tehnološkim platformama izmicalo: učiniti glasovne asistente zapravo korisnima.

Google Assistant / FOTO: Tom George / Alamy / Alamy / Profimedia

AI agenti najnoviji su trend u tech industriji

To znači da bi Google Assistant, Alexa i Siri mogli napokon ispuniti svoje obećanje i početi se ponašati kao osobni asistenti. Umjesto da samo recitiraju kakav vam je raspored sastanka u danu, kao što Googleov asistent čini sada, mogli bi početi rezervirati termine, kontaktirati druge pojedince i pronaći vrijeme koje odgovara svima. Mogli bi moći rezervirati letove ili hotele za odmor poput digitalnog agenta za putovanja.

Agenti su posljednji trend u tehnološkoj industriji. Ovoj tehnologiji okrenulo se više od 470 platformi, pokazuje istraživanje Forrestera. Neke od njih su giganti industrije, a drugi su manji startupovi kao što su LangChain, CrewAI ili Play.ai. Uz značajke za potrošače, mogli bi transformirati biznise, gdje bi agenti mogli raditi u korisničkoj podršci ili programiranju. Broj ugovora sklopljenih sa startupovima za AI agente porastao je za više od 81 posto u odnosu na prethodnu godinu, pokazuju podaci PitchBooka, a u ovu tehnologiju uloženo je više od 8 milijardi dolara.

“Utrka je počela,” kaže Steve Jang, investitor i osnivač tvrtke Kindred Ventures. “Startupovi će se natjecati s etabliranim platformama u tome tko ovo može dizajnirati što je bolje moguće. Tko će kreirati realistične, autentične glasove i razgovore, agente koji će moći pristupati podacima i poduzimati korake koje svi želimo?”

Velike kompanije u najboljoj su poziciji

Glasovni asistenti velikih tvrtki u najboljoj su poziciji za ovo AI ubrzanje. Google ima svoj model Gemini koji daje dodatnu snago glasovnim pretragama. Apple je ranije ove godine najavio partnerstvo s OpenAI-jem kojim bi se ChatGPT koristio za neke upite upućene Siri. Protekle godine Amazon je uložio 8 milijardi dolara u Anthropic, proizvođača moćnog chatbota Claude.

Siri koristim samo za trivijalne stvari za koje sam sigurna da ih neće zeznuti. Kanjun Qiu, suosnivačica, Imbue

Jang misli kako će stvarna inovacija doći iz pravih glasovnih AI modela. Za razliku od velikih jezičnih modela koji pokreću usluge poput ChatGPT-ja, glasovni modeli nisu obučeni na tekstovima koje potom program iščitava. Oni se obučavaju na stvarnim audio snimkama kako bi mogli shvatiti suptilnosti govora poput emocionalnih signala ili tona. Jang je investirao u Play.ai, koji je specijaliziran za glasovne agente. Konkurenti su mu ElevenLabs, OpenAI i Google, koji svi rade na vlastitim glasovnim modelima.

Ipak, postoje i oni koji nisu uvjereni da će agenti velike glasovne asistente učiniti eksponencijalno boljima. Kanjun Qiu osnivačica je tvrtke Imbue koja gradi agente za softver za kodiranje. Ona vjeruje kako će dodavanje više umjetne inteligencije te proizvode poboljšati tek “sporo i postupno”. Kaže kako nove AI značajke ne predstavljaju dovoljno velik iskorak kako bi ljudima počele ulijevati povjerenje. “Delegacija je jedna paradigma s kojom se ljudima teško pomiriti,” kaže Qiu. “Siri koristim samo za trivijalne stvari, za koje sam sigurna da ih neće zeznuti.”

Seemanta Dutta / Alamy / Alamy / Profimedia

Veliki potencijal i za širu primjenu

Ipak, vjeruje kako će nedavni napretci u glasovnoj umjetnoj inteligenciji potrošačima pomoći na druge načine. Na primjer, više aplikacija integrirat će glasovne značajke, predviđa Qiu. Uz poboljšano razumijevanje prirodnog jezika, moći ćete aplikaciji dati upute koje će ona izvršavati. Na primjer, moći ćete reći aplikaciji za trgovinu da želite vratiti par cipela koje vam ne odgovaraju.

Poboljšanja u umjetnoj inteligenciji i glasovnoj tehnologiji također mogućima čine neke od drugih ambicija koje Silicijska dolina već godinama želi ostvariti. Poznata je priča o neugodnom promašaju Googlea, naočalama Google Glass koje su, uz to što nisu bile korisne, izazvale velike strahove za zaštitu privatnosti. Ranije ovog mjeseca, kompanija je predstavila novi par naočala koji će se koristiti zajedno s novom Googleovom platformom za AI agente Project Astra. I Facebook je predstavio svoje naočale, naziva Orion, koje koriste kombinaciju glasova i gestikulacija za upravljanje AI alatima. U teoriji možete s tim naočalama promatrati svoju smočnicu i zatražiti od AI alata da pronađe recept za njih.

Inovacije glasovne tehnologije mogu pomoći i u pristupačnosti. Ne mogu svi čitati ili pisati ili tipkati, ali više ljudi može govoriti, kaže Jang. A to je i sve više po ukusu mladih: 42 posto Amerikanaca u dobi od 18 do 29 godina najmanje jednom tjedno u chatovima šalju glasovne poruke, pokazala je studija YouGova i Voxa.

Novi iskoraci u umjetnoj inteligenciji mogli bi proširiti upotrebu glasovnih alata i promijeniti način na koji ljudi komuniciraju s tehnologijom.

Autor originalnog članka: Richard Nieva, Forbes

Link: AI Agents Could Finally Make Siri And Alexa Truly Useful

(Prevela: Nataša Belančić)