Contents

OpenAI、自動コードセキュリティ分析のための Codex Security AI エージェントを開始

<本文>/images/openai-codex-security.jpg

GPT-5.4 のリリースと、Microsoft による新しいエージェント コーディング モデルの GitHub Copilot への迅速な統合を受けて、OpenAI は最近注目を集めています。同社は現在、セキュリティに重点を置いた大規模なアップグレードにより、開発者ツールのポートフォリオを拡大しています。

OpenAI は、セキュリティ研究者エージェント Aardvark のブランドを Codex Security に変更し、Codex Web インターフェイスを介した研究プレビューでこのツールを導入しました。

Codex Security は現在、ChatGPT Pro、Team、Enterprise、および Edu ユーザーが利用できます。 OpenAIによると、このツールは来月までのプレビュー期間中は引き続き無料で使用できるという。

Codex Security は自動化された脆弱性検出に重点を置いています

新しいシステムは、開発者がソフトウェア リポジトリのセキュリティ脆弱性を自動的に検出して修正できるようにすることを目的としています。

開発者はツールをコード リポジトリに接続することで、Codex Security がコードベースを継続的に分析し、潜在的なセキュリティ問題の修正を提案できるようになります。このシステムは、自動検証と組み合わせたエージェント推論を使用して、どの脆弱性が最も大きな影響を与える可能性があるかを判断します。

OpenAI によると、このツールは、現代のソフトウェア開発において増大する 2 つの課題に対処するように設計されています。

まず、AI によって生成されるコードの量が劇的に増加し、手動によるセキュリティ レビューがより困難になり、時間がかかるようになりました。

第 2 に、従来の脆弱性スキャナーは影響の少ないアラートや誤検知を大量に生成することが多く、開発者は実際の脅威を表していない可能性がある問題のレビューに時間を費やす必要があります。

Codex Security は、これらの価値の低いアラートを除外し、即時の対応が必要な問題を優先順位付けしようとします。

Aardvark ベータテストに基づく改善

新しいシステムは、OpenAI の以前の Aardvark プロジェクトに基づいて構築されており、このプロジェクトは公開リサーチ プレビューの前にセキュリティ チームと非公開でテストされました。

テスト中、OpenAI は、システムが同じリポジトリを繰り返しスキャンしたときに大幅な改善を観察しました。脆弱性レポートのノイズの量は、初期のベータ結果と比較して 84% 減少しました。

精度も大幅に向上しました。過剰に報告された重大度レベルは 90 パーセント以上減少し、リポジトリ全体の誤検知は 50 パーセント以上減少しました。

OpenAIは、これらの改善により、セキュリティチームは誤ったアラートのトリアージに時間を費やすことなく、真の脅威に集中できるようになると述べている。

同社はまた、Codex Security の S/N 比は、システムがより現実世界の開発環境とセキュリティ ワークフローを処理するにつれて向上し続けると予想しています。

Codex Security のリリースは、AI 企業が開発者向けの自動化ツールを拡大し続ける中で行われました。

一方、Microsoft は、OpenAI の Sora 2 AI ビデオ生成モデルを使用するように Bing Video Creator サービスもアップグレードし、同社の生成メディア機能を拡張しました。

Codex Security は、コードを生成するだけでなく、大規模な信頼性とセキュリティの維持にも役立つ AI システムへの新たな一歩を示します。

ネオウィン経由

*️⃣ 出典リンク:

GPT-5.4 のリリース、GitHub Copilot へのエージェント コーディング モデル、 リサーチ プレビューでのツールの導入、OpenAI の Sora 2 AI ビデオ生成モデルを使用、 Neowin