Az OpenAI bemutatta a GPT-5.4-et Pro és Thinking változatokkal

Csütörtökön az OpenAI bemutatta a GPT-5.4 nevű új alapmodellt, amelyet a vállalat „a professzionális munkára szánt eddigi legfejlettebb és leghatékonyabb frontier modellként” jellemez. A standard verzió mellett a GPT-5.4 gondolkodási (GPT-5.4 Thinking) változatban is elérhető, valamint egy nagy teljesítményre optimalizált (GPT-5.4 Pro) kiadásban is.

Az API-n keresztül elérhető modell akár 1 millió tokenes kontextusablakkal is használható lesz, ami messze a legnagyobb kontextusméret az OpenAI kínálatában.

Az OpenAI kiemelte a javuló token-hatékonyságot is: a GPT-5.4 képes ugyanazokat a feladatokat jelentősen kevesebb token felhasználásával megoldani, mint az elődje.

Az új modell számos benchmark teszten is jelentősen jobb eredményeket ért el. Rekordpontszámot kapott például a számítógépes használatot mérő OSWorld-Verified és WebArena Verified teszteken. Emellett az OpenAI GDPval tudásalapú feladatokat mérő tesztjén 83%-os eredményt ért el, ami szintén rekordnak számít.

A Mercor APEX-Agents benchmarkon is az élre került, amely a jogi és pénzügyi szakmai készségeket vizsgálja – közölte Brendan Foody, a Mercor vezérigazgatója.

Foody szerint a GPT-5.4 különösen jól teljesít hosszabb, összetett feladatok elkészítésében, például prezentációk, pénzügyi modellek vagy jogi elemzések készítésében, miközben gyorsabban és alacsonyabb költséggel működik, mint a versenytárs frontier modellek.

A GPT-5.4 továbbfejleszti az OpenAI azon törekvéseit is, hogy csökkentse a hallucinációkat és a ténybeli hibákat. A vállalat szerint az új modell 33%-kal ritkábban hibázik egyedi állításoknál, mint a GPT-5.2, és az összes válasz 18%-kal kevesebb hibát tartalmaz.

A frissítéssel az OpenAI átalakította azt is, hogyan kezeli az API-verzió az úgynevezett tool calling funkciót. Az új rendszer neve Tool Search. Korábban a rendszerprompt minden elérhető eszköz definícióját tartalmazta, ami sok tokent igényelhetett, ha sok eszköz volt elérhető. Az új rendszer lehetővé teszi, hogy a modellek csak akkor kérjék le az eszközök definícióit, amikor szükség van rájuk, így gyorsabb és olcsóbb kérések valósíthatók meg.

Az OpenAI egy új biztonsági értékelést is bevezetett, amely a modellek chain-of-thought (gondolatmenet) működését vizsgálja – vagyis azt a folyamatot, ahogy a modellek lépésről lépésre magyarázzák a gondolkodásukat összetett feladatoknál. A kutatók korábban attól tartottak, hogy a modellek képesek lehetnek megtévesztően bemutatni a gondolatmenetüket, és tesztek szerint bizonyos helyzetekben ez előfordulhat.

Az OpenAI új vizsgálatai szerint azonban a GPT-5.4 Thinking változatában kevésbé valószínű a megtévesztés, ami arra utal, hogy a modell nem képes elrejteni a saját gondolkodási folyamatát, így a gondolatmenet figyelése továbbra is hatékony biztonsági eszköz marad. – írja a TechCrunch.

Kép forrása: The Decoder

Az OpenAI bemutatta a GPT-5.4-et Pro és Thinking változatokkal

Hasznos információk

Kapcsolat