Az Anthropic hétfőn bejelentette Opus 4.5-öt, zászlóshajó modelljük legújabb verzióját. Ez az Anthropic 4.5-ös sorozatának utolsó kiadott tagja, a Sonnet 4.5 (szeptember) és a Haiku 4.5 (október) után.
A teszteredmények szerint az Opus 4.5 kimagaslóan teljesít a kódolási benchmarkokon (SWE-Bench, Terminal-bench), az eszközhasználatban (tau2-bench, MCP Atlas) és az általános problémamegoldásban (ARC-AGI 2, GPQA Diamond). Különösen figyelemre méltó, hogy a modell először érte el a 80%-ot a SWE-Bench verified kódolási benchmarkon, ami komoly mérföldkő a fejlesztők körében.
Az új verzió kiemelt figyelmet kapott a számítógépes és táblázatkezelő feladatokban is: a Claude for Chrome és a Claude for Excel termékeket mostantól szélesebb körben teszik elérhetővé. A Chrome-bővítmény minden Max felhasználó számára elérhető lesz, az Excel-modell pedig Max, Team és Enterprise felhasználóknak.
Az Opus 4.5 emellett fejlesztett memóriakezeléssel rendelkezik a hosszú kontextusú műveletekhez, ami lehetővé tette a régóta várt „végtelen chat” funkciót is: a beszélgetések megszakítás nélkül folytatódhatnak, miközben a modell automatikusan tömöríti a memóriáját.
Az újítások kifejezetten az ügynöki felhasználásra készültek, például amikor az Opus vezető ügynökként irányít egy csoport Haiku-alapú alügynököt. Ebben a helyzetben a fejlesztett memória- és munkamemória-kezelés különösen fontos.
Az Opus 4.5-nek komoly versenytársa lesz az OpenAI GPT 5.1-nek és a Google Gemini 3-nak, amelyek szintén nemrég jelentek meg a piacon. – írja a TechCrunch.
Kép forrása: Complete AI Training
