OpenAI が GPT-5.3-Codex をリリース、社内チームは開発スピードに「驚かされた」と語る

2026-02-05 74 words One minute

Contents

<本文>

OpenAI は GPT-5.3-Codex を発表しました。これは、Codex をコードの記述を超えて、コンピューター上で完全なエンドツーエンドのプロフェッショナルな作業を処理できるようにするメジャーアップグレードです。興味深いことに、この発売は Anthropic の Claude Opus 4.6 (噂) のリリースと同時に行われます。公式の詳細はここで読むことができます。

GPT-5.3-Codex は、速度、自律性、現実世界の実行を兼ね備えています

GPT-5.3-Codex に戻ると、新しいモデルは、GPT-5.2-Codex のフロンティアコーディングの強みと、GPT-5.2 のより広範な推論および知識機能を組み合わせています。その結果、手作業を大幅に減らして、長時間実行タスクを調査、ツールの使用、デバッグ、展開、および実行できる単一のエージェントが実現します。

OpenAI によれば、GPT-5.3-Codex は 25% も高速であり、数時間、場合によっては数日にわたる複雑なワークフローにより適しているとのことです。注目に値する詳細の 1 つは、モデル自体の構築にどのように役立ったかです。 OpenAI は、GPT-5.3-Codex の初期バージョンが、トレーニング実行のデバッグ、展開の管理、評価の分析、さらには予期しないテスト結果の診断に内部的に使用されていたことを明らかにしました。実際には、AI は独自の開発サイクルを加速しました。

ベンチマークでは、GPT-5.3-Codex が新高値を記録しました。これは、複数の言語にわたる実際のソフトウェアエンジニアリングをテストする SWE-Bench Pro をリードし、実用的なコマンドラインとシステムスキルの尺度である Terminal-Bench 2.0 で以前のモデルを大幅に上回っています。また、ビジュアルデスクトップ環境内で実際の生産性タスクを完了することに重点を置いたベンチマークである OSWorld でも大きな向上を示しています。

Contents

OpenAI が GPT-5.3-Codex をリリース、社内チームは開発スピードに「驚かされた」と語る

GPT-5.3-Codex は、速度、自律性、現実世界の実行を兼ね備えています

最新モデルは、セキュリティをより強化してコーディングの枠を超えて拡張されています。