Anthropic Opus 4.6 wprowadza zespoły wieloagentowe o wartości 350 miliardów dolarów
Zach Anderson
5 lutego 2026 r., godz. 18:43
Anthropic wprowadza Claude Opus 4.6 z oknem kontekstowym o pojemności 1 miliona tokenów i funkcją zespołów agentów, kilka dni po tym, jak oferta o wartości 350 miliardów dolarów wstrząsnęła rynkiem akcji technologicznych.
W czwartek firma Anthropic wypuściła Claude Opus 4.6, aktualizację modelu, która pięciokrotnie zwiększa okno kontekstowe do miliona tokenów i wprowadza autonomiczną współpracę wielu agentów. Stało się to zaledwie dzień po tym, jak wycena firmy na 350 miliardów dolarów spowodowała wyprzedaż akcji technologicznych.
Ważny jest moment. Inwestorzy, którzy byli zaniepokojeni konkurencją w dziedzinie sztucznej inteligencji, 4 lutego wyprzedali swoje akcje, a teraz Anthropic pokazuje dokładnie, dlaczego zasługuje na tę wycenę: Opus 4.6 osiąga o 144 punkty Elo lepszy wynik niż GPT-5.2 firmy OpenAI w teście GDPval-AA, który mierzy ekonomicznie wartościową pracę umysłową w dziedzinie finansów, prawa i techniki.
Co tak naprawdę się zmieniło?
Trzy aktualizacje są szczególnie istotne dla użytkowników biznesowych.
Okno kontekstowe 1M tokenów (w wersji beta) stanowi pięciokrotny wzrost w porównaniu z 200 000 tokenów w Opus 4.5. W przypadku MRCR v2 – zadania porównywalnego do szukania igły w stogu siana – Opus 4.6 osiąga wynik 76% w porównaniu z 18,5% dla Sonnet 4.5. Nie jest to stopniowa poprawa, ale zupełnie nowa klasa możliwości dla przepływów pracy wymagających intensywnego wykorzystania dokumentów.
Agent Teams w Claude Code umożliwia programistom równoległą pracę wielu agentów AI. Partner wczesnego dostępu, Invariant Labs, poinformował, że Opus 4.6 „w ciągu jednego dnia samodzielnie zamknął 13 spraw i przypisał 12 spraw odpowiednim członkom zespołu, zarządzając organizacją liczącą około 50 osób w 6 repozytoriach”. Model zajmował się zarówno decyzjami produktowymi, jak i organizacyjnymi i wiedział, kiedy należy eskalować sprawę do ludzi.
W celu integracji z biznesem firma Anthropic dodała obsługę PowerPoint (wersja badawcza) oraz ulepszone możliwości Excel. Model może teraz przyjmować dane nieustrukturyzowane, samodzielnie wywnioskować strukturę i wykonywać wieloetapowe zmiany za jednym razem.
Wyniki testów porównawczych
Opus 4.6 przoduje w testach Terminal-Bench 2.0 dotyczących kodowania agentycznego i osiąga najwyższe wyniki w Humanity’s Last Exam, wielodyscyplinarnym teście rozumowania. Pokonał również wszystkie inne modele w teście OpenAI BrowseComp, który mierzy zdolność do lokalizowania trudnych do znalezienia informacji w Internecie.
Poprawa o 190 punktów Elo w porównaniu z poprzednikiem w GDPval-AA sugeruje znaczący postęp w zadaniach, które faktycznie generują dochody: analizie finansowej, ocenie prawnej, dokumentacji technicznej.
Cena pozostaje stabilna na poziomie 5 USD/25 USD za milion tokenów za dane wejściowe/wyjściowe. W przypadku poleceń przekraczających 200 000 tokenów obowiązuje cena premium (10 USD/37,50 USD).
Twierdzenia dotyczące bezpieczeństwa i pozycja konkurencyjna
Anthropic twierdzi, że Opus 4.6 wykazuje „najniższy odsetek nadmiernych odmów spośród wszystkich najnowszych modeli Claude”, zachowując jednocześnie podobną zgodność jak Opus 4.5. Firma dodała sześć nowych sond cyberbezpieczeństwa w celu wykrywania potencjalnych nadużyć, uznając, że ulepszone możliwości modelu są bronią obosieczną.
Dzięki tej wersji Anthropic stawia się w bezpośredniej konkurencji z OpenAI w wyścigu o AI dla przedsiębiorstw. Teraz, gdy również Gemini od Google i Grok od xAI konkurują o kontrakty biznesowe, funkcje wieloagentowe i rozszerzone okno kontekstowe Opus 4.6 stanowią zakład Anthropic, że autonomiczne przepływy pracy AI – a nie tylko chatboty – będą determinować kolejny etap wdrażania tej technologii w biznesie.
Opus 4.6 jest już dostępny na claude.ai, API i głównych platformach chmurowych. Deweloperzy mają do niego dostęp poprzez identyfikator modelu claude-opus-4-6.
Źródło obrazu: Shutterstock