Digitália

2024.05.15. 06:00

Az új GPT-4o úgy beszélget velünk, mint Scarlett Johansson

Az OpenAI elkészítette a Her ihlette mesterséges intelligenciát, amely lát, olvas, követi az arckifejezéseinket és valós időben beszélget.

MW

Scarlett Johansson a „Her” premierjén a 8. Római Filmfesztiválon

Forrás: Getty

Fotó: Elisabetta A. Villa

Spike Jones Her / A nő című, nagy sikerű filmjében a magányos férfi szerelmes lesz új, mesterséges intelligencia által működtetett operációs rendszerébe, aki/ami Scarlett Johansson hangján társalog vele.

Most az OpenAI kiadja megszólalásig erre hasonlító, a többi hangasszisztensnél mérföldekkel jobbnak ígérkező termékét, aki lát minket, valós időben társalog, humora van, érzelmes – és remélhetőleg nem hagy ott a végén bennünket, mint a férfit a filmben.

A GPT-4o-ban az „o” jelentése omni, azaz teljes, kivétel nélküli. Úgy tűnik, joggal, mert hatalmas lépést tesz a jelenleginél sokkal természetesebb ember-számítógép interakció felé – bemenetként elfogadja szöveg, hang és kép bármilyen kombinációját, és bármilyen szöveg-, hang- és képkimenetet képes generálni.

Akár 232 ezredmásodperc alatt képes reagálni az audio bemenetekre, átlaga 320 ezredmásodperc, ami nagyjából az emberi válaszidő egy átlagos beszélgetésben. Hozza a GPT-4 Turbo teljesítményét angolul, jelentős javulást produkál a nem angol nyelvű szövegekben, ugyanakkor sokkal gyorsabb.

Tehát képes lesz Her-szerű hangasszisztensként működni, valós időben reagálni, és megfigyelni a körülötte lévő világot.

Az alábbi videón látható élő közvetítésen Mira Murati műszaki igazgató és az OpenAI mérnökei egy mobil köré ültek, hogy bemutassák az újdonságot. Légzőgyakorlatokra bírták GPT-4o-ot, később biztatták, hogy legyen egyre kifejezőbb az esti mese előadásában, majd megkérték, váltson robothangra, s végül énekhanggal kellett befejeznie a történetet.

Utána megkérdezték, mit lát a telefon kameráján, és reagáljon rá. Az asszisztenst félbe lehetett szakítani beszéd közben, láthatóan jól ért a matematikához és élőben fordít idegen nyelveken – ezúttal olaszról angolra.

Az asszisztens hangja feltűnően hasonlít Scarlett Johansson karakterére a Her című filmben. Az OpenAI vezérigazgatója, Sam Altman rejtélyesen csak egy szót írt erről az X-en: „ő”.

A ChatGPT-hez képest jelentős fejlődést mutató mesterséges intelligencia új képességei korlátozott, „alfa” kiadásban fognak megjelenni „a következő hetekben”, és először a ChatGPT Plus előfizetői számára lesznek elérhetők.

Nyilván nem véletlen, hogy az OpenAI a bevezetést éppen a Google I/O, a technológiai óriás konferenciája elé időzítette, ahol várhatóan a Gemini csapatának különböző mesterségesintelligencia-termékeit mutatják be.

A Bloomberg kiszivárogtatása szerint az OpenAI hamarosan megállapodik az Apple-lel a ChatGPT iPhone-on való működéséről. (A tájékoztatón egy kérdésre Murati azt válaszolta, hogy nem beszéltek partnerségről.) Az iPhone hangasszisztense, Siri meglehetősen megbízhatatlan, s a harapott almás óriás eddig lemaradni látszott az MI-versenyben.

 

Hírlevél feliratkozás
Ne maradjon le a feol.hu legfontosabb híreiről! Adja meg a nevét és az e-mail-címét, és mi naponta elküldjük Önnek a legfontosabb híreinket!