OpenAI が GPT-5.3-Codex をリリース、社内チームは開発スピードに「驚かされた」と語る
<本文>
OpenAI は GPT-5.3-Codex を発表しました。これは、Codex をコードの記述を超えて、コンピューター上で完全なエンドツーエンドのプロフェッショナルな作業を処理できるようにするメジャー アップグレードです。興味深いことに、この発売は Anthropic の Claude Opus 4.6 (噂) のリリースと同時に行われます。公式の詳細はここで読むことができます。
GPT-5.3-Codex は、速度、自律性、現実世界の実行を兼ね備えています
GPT-5.3-Codex に戻ると、新しいモデルは、GPT-5.2-Codex のフロンティアコーディングの強みと、GPT-5.2 のより広範な推論および知識機能を組み合わせています。その結果、手作業を大幅に減らして、長時間実行タスクを調査、ツールの使用、デバッグ、展開、および実行できる単一のエージェントが実現します。
OpenAI によれば、GPT-5.3-Codex は 25% も高速であり、数時間、場合によっては数日にわたる複雑なワークフローにより適しているとのことです。注目に値する詳細の 1 つは、モデル自体の構築にどのように役立ったかです。 OpenAI は、GPT-5.3-Codex の初期バージョンが、トレーニング実行のデバッグ、展開の管理、評価の分析、さらには予期しないテスト結果の診断に内部的に使用されていたことを明らかにしました。実際には、AI は独自の開発サイクルを加速しました。
ベンチマークでは、GPT-5.3-Codex が新高値を記録しました。これは、複数の言語にわたる実際のソフトウェア エンジニアリングをテストする SWE-Bench Pro をリードし、実用的なコマンド ラインとシステム スキルの尺度である Terminal-Bench 2.0 で以前のモデルを大幅に上回っています。また、ビジュアル デスクトップ環境内で実際の生産性タスクを完了することに重点を置いたベンチマークである OSWorld でも大きな向上を示しています。
最新モデルは、セキュリティをより強化してコーディングの枠を超えて拡張されています。
OpenAI は、生のコーディングに加えて、GPT-5.3-Codex を一般的な専門エージェントとして位置づけています。完全な Web アプリの構築、プレゼンテーションのデザイン、スプレッドシートの分析、ドキュメントの作成、およびソフトウェア ライフサイクル全体にわたる運用タスクの管理を行うことができます。デモでは、モデルは数百万のトークンを超えてゲームや本番環境に対応した Web サイト上で自律的に反復されました。
セキュリティに関する限り、OpenAI は GPT-5.3-Codex をサイバーセキュリティ タスクの「高機能」として分類し、防御セキュリティ研究の強化を目的とした新しいプログラムと並行して、これまでで最も包括的な保護手段を導入しました。
GPT-5.3-Codex は、Codex アプリ、CLI、IDE 拡張機能、Web の有料 ChatGPT ユーザーが利用できるようになり、次に API アクセスが計画されています。
*️⃣ 出典リンク:
GPT-5.3-Codex を発表しました、Claude Opus 4.6 (噂)、ここで公式の詳細を読んでください、GPT-5.2、