Új szintre lépett a Google: tarol a Gemini 3.1 Pro a benchmark méréseken

A Google csütörtökön bemutatta a Gemini Pro legújabb, 3.1-es verzióját, amely a vállalat nagy teljesítményű nyelvi modellje (LLM). A modell jelenleg előzetes (preview) verzióban érhető el, a széles körű bevezetésre hamarosan sor kerül – közölte a cég.

A Google új modellje az eddigi egyik legerősebb LLM lehet. Szakértők szerint a Gemini 3.1 Pro jelentős előrelépést jelent az elődjéhez, a Gemini 3-hoz képest, amelyet már a tavaly novemberi megjelenésekor is kifejezetten fejlett és sokoldalú mesterségesintelligencia-eszközként tartottak számon.

A Google csütörtökön független benchmark tesztek – például a Humanity’s Last Exam nevű mérés – eredményeit is közzétette. Ezek alapján az új modell számottevően jobban teljesített a korábbi verziónál.

A Gemini 3.1 Pro dicséretet kapott Brendan Foodytól, az AI-startup Mercor vezérigazgatójától is. A Mercor által fejlesztett APEX nevű benchmark rendszer azt méri, hogy az új AI-modellek milyen hatékonysággal képesek valós, szakmai feladatokat ellátni. „A Gemini 3.1 Pro jelenleg az APEX-Agents ranglista élén áll” – írta Foody egy közösségi médiás bejegyzésben, hozzátéve, hogy az eredmények jól mutatják, „milyen gyorsan fejlődnek az AI-ügynökök a valódi tudásalapú munkavégzésben”.

A bejelentés egyre kiélezettebb versenyhelyzetben érkezik, miközben a technológiai vállalatok sorra mutatják be az egyre erősebb, ügynökalapú működésre és több lépésből álló gondolkodásra optimalizált nyelvi modelljeiket. Más meghatározó szereplők – köztük az OpenAI és az Anthropic – szintén nemrég új modellekkel jelentkeztek. – írja a TechCrunch.

Kép forrása: Mezha

Új szintre lépett a Google: tarol a Gemini 3.1 Pro a benchmark méréseken

Hasznos információk

Kapcsolat