Contents

よりスマートなコーディング、リサーチ、オフィス スキルを備えた Claude Opus 4.6 が発売

<本文>/images/Claude-Opus-4.6.png

以前の噂どおり、Anthropic は Claude Opus 4.6 をリリースしました。新しいモデルは、コーディング、研究、日常の事務作業を改善すると同時に、Opus クラス モデルのベータ版で最初の 1M トークン コンテキスト ウィンドウを追加します。 Claude Opus 4.6 では、計画の大幅な改善が見られ、エージェント タスクの持続時間が長くなり、大規模なコードベース全体で確実に動作します。

Claude Opus 4.6 はコーディング、ナレッジワーク、および長期的な文脈の推論に優れています

Anthropic は、より適切なコードレビューを実行し、間違いを見つけ、自律的にデバッグを処理できるようになったと述べています。 Opus 4.6 は、コーディングとは別に、財務分析の実行、スプレッドシートの処理、ドキュメントの管理、さらにはプレゼンテーションの作成も可能です。クロードが独立してマルチタスクを行う Cowork 内では、Opus 4.6 がユーザーに代わってこれらすべての機能を自動的に適用します。

パフォーマンスの点では、このモデルはいくつかのベンチマークで際立っています。エージェント コーディング評価の Terminal-Bench 2.0 で最高のスコアを獲得し、Humanity’s Last Exam でトップとなり、金融、法務、その他の分野の経済的に価値のあるタスクを対象とするテストである GDPval-AA では GPT-5.2 およびその前任者を上回っています。 BrowseComp の評価では、見つけにくいオンライン情報を見つける優れた能力も示しています。

/images/Knowledge-Work-scaled.png /images/Coding-scaled.png /images/Agentic-Search-scaled.png /images/Multidisciplinary-reasoning-scaled.png /images/Knowledge-Work-scaled.png /images/Coding-scaled.png /images/Agentic-Search-scaled.png /images/Multidisciplinary-reasoning-scaled.png /images/

さらに、Opus 4.6 では、より長いコンテキストの推論がテーブルに追加されます。何十万ものトークンを追跡し、微妙な詳細を拾い上げ、長時間のセッションにおける「コンテキストの腐敗」を軽減できます。 MRCR v2 などのテストでは、Sonnet 4.5 の精度がわずか 18.5% であったのに対し、Opus 4.6 は 76% の精度を達成し、ロングコンテキストのパフォーマンスが大幅に向上したことが実証されました。

/images/Comparison-chart-897x1024.png 画像クレジット: Anthropic

安全性、開発者管理、オフィス統合

Anthropic は安全性の部分でも妥協していません。その理由は、Opus 4.6 が誤った行動の発生率と過剰拒否率を低く維持し、6 つの新しいサイバーセキュリティ調査を含む強力な安全装置を示しているためです。このモデルは、オープンソース ソフトウェアの脆弱性を検出してパッチを適用するためにも使用され、防御的なサイバーセキュリティ タスクをサポートします。

忘れてはいけないのは、開発者は API を使用して新しいコントロールを取得できることです。適応的思考により、より深い推論が役立つ時期をクロードが決定できるようになり、努力設定で知性と速度が調整され、コンテキストの圧縮により、長時間実行されるタスクを制限に達することなく完了できます。出力は 128,000 トークンに達し、200,000 を超えるタスクにはプレミアム オプションが追加されました。米国のみの推論も利用できます。

Excel の Claude では、パフォーマンスが向上し、構造化されたデータ推論を使用して、長く複数ステップのタスクを処理できるようになり、Office 統合がさらに拡大します。 PowerPoint では、Claude がリサーチ プレビューとして利用できるようになり、ユーザーが Excel 出力をブランドのスライドに自動的に変換できるようになりました。さらに、Claude Code のエージェント チームはタスクを並列実行し、大規模で読み取り負荷の高いワークロードを自律的に調整できるようになりました。

Claude Opus 4.6 は現在、claude.ai、API、およびすべての主要なクラウド プラットフォームを通じて利用可能であり、開発者や企業チームがよりスマートでより高性能な AI を使用して複雑なタスクに簡単に取り組むことができるようになります。

*️⃣ 出典リンク:

以前の噂では、 Claude Opus 4.6 をリリース/images/Comparison-chart-897x1024.png