エージェント OS が Windows の使用方法をどのように変えるか
<本文>

HTG Wrapped 2025: 24 日間のテクノロジー
お気に入りのハードウェア、ガジェット、テクノロジーを 24 日間お楽しみいただけます
好き嫌いは別として、AI はどこにでも存在しており、おそらくあなたも毎日それを使用しているでしょう。新しいツールは毎週登場します。また、Agentic OS という新しい大きなアイデアもあります。 Microsoft は、AI がユーザーを支援するだけでなく、実際にユーザーに代わって作業を行う未来を表現するためにこの用語を使用しています。では、なぜ Microsoft はそのように考えているのでしょうか?
エージェント OS の概念の概要
Windows に来る大きな変更について説明する前に、基礎的な知識を確立したいと思います。
Windows、Linux、macOS などのさまざまなオペレーティング システムについてよく知っている必要があります。しかし問題は、何がオペレーティング システムをエージェント的なものにするのかということです。これは新しい種類の OS ですか?
簡単に言えば、エージェント OS は、AI エージェントを完全に統合して管理するためにゼロから設計されるか、大幅に変更される OS です。
AI エージェントとは何ですか?
ChatGPT または Gemini を使用したことがあるはずです。どちらも単純なチャットボットです。質問すると、答えが返ってきます。
しかし、エージェント AI は異なります。エージェント AI は、自律性、推論性、そして複雑で高レベルの目標を達成するために行動を起こす能力を備えています。たとえば、フライトを予約したり、人のリストを電子メールで送信したりするように依頼できます。これらのアクションは複数のステップで構成されており、AI エージェントはこの複雑なタスクを実行できます。
やり方は次のとおりです。
-
タスクの内訳: エージェントは、まず大規模で複雑なタスクを取り上げ、それを一連の小さな連続したステップに分割します。
-
アクションとツールの使用: 計画の各ステップで、必要なアクションを実行するために適切なツール (外部 API、検索エンジン、コード インタプリタなど) を選択して利用します。
-
観察とレビュー: アクションを実行した後、エージェントは結果または環境の現在の状態を観察します。
-
反映と調整: 次に、エージェントは計画に対して結果を評価します。結果が不十分、予期しない、または正しくない場合、エージェントは計画を修正し、新しい計画でアクションを実行しようとします。
この行動、観察、調整のループは、当初の目標が正常に完了するまで続きます。
クレジット: Patrick Campanale/Windows Insight
その例としては、フォローアップを処理し、スレッドを要約し、タスクを促す Google Workspace Duet があります。または Outlook の Microsoft Copilot。 GitHub Copilot Workspace や Google の新しい Antigravity は AI エージェントのカテゴリに属しますが、プログラミングのニッチ向けに微調整されています。
それで、エージェント OS とは何ですか?
エージェント OS という用語はかなり新しいものですが、これが何を意味するかは次のとおりです。これは、複数の AI エージェントをサポート、管理、調整するように基本アーキテクチャが設計されたオペレーティング システムです。これは中央オーケストレーターとして機能し、エージェントがファイル、アプリケーション、ネットワーク、設定などのシステム リソースにアクセスできるようにします。しかし、それを安全かつ体系的にすることもできます。
ここでは、AI がアドオン/ツールのコレクションからオペレーティング システムの中核設計の一部に移行する未来を見ることができます。
しかし、ここで注意すべき重要な点があります。 Windows や Linux などの OS はリアクティブです。たとえば、ボタンをクリックしたり、マウスを動かしたり、アプリケーションを起動したりすると、システムはあらかじめ決められた方法で反応します。デスクトップを右クリックすると一連のオプションが開くようにコーディングされています。
クレジット: Microsoft
一方、エージェント OS はプロアクティブです。ユーザーに代わってタスクを実行し、手動作業の必要性を最小限に抑えます。
たとえば、ディレクトリ内のファイルを再編成したいとします。ファイルの種類 (JPEG、音楽など) に基づいてファイルをフォルダに分類し、1 週間より古いものはすべて別のアーカイブ フォルダに保存し、新しいファイルは Current という名前のフォルダに残しておきたいとします。
現在のシステムでこれを実装するには、広範囲にわたる手動のクリックと並べ替えが必要になるか、プログラミング スキルがある場合は専用のスクリプトを作成して実行する必要があります。
エージェント OS を使用すると、望ましい結果全体を自然言語で記述するだけで済み、エージェントはローカル ファイルにアクセスして、一歩も動かなくても変更を加えてくれます。
Microsoft のエージェント Windows に対するビジョン
明確に述べておくことが重要だと思います。Microsoft は自社のオペレーティング システムをエージェント OS に変換することに全力で取り組んでおり、固執しています。
Microsoft の Windows およびデバイス担当社長、Pavan Davuluri がこれを投稿しました。
これも驚くことではありません。移行はしばらく前から目に見えて進んでいます。まず Copilot の紹介、次に Copilot PC のコンセプト、Recall などの機能について説明します。この積極的な推進はしばらくの間行われており、世間のかなりの監視と反発を受けてきました。
現時点で私は、Microsoftがオペレーティングシステムの中核にさらに多くのAIエージェントを組み込み続ける中で、どれだけの抵抗に直面するのか興味がある。なぜなら、彼らはすぐには止まらないように見えるからです。
人々が新しい AI 機能を望むかどうかに関係なく、Microsoft は勢いを増しており、エージェント OS の最初の完全に実現されたバージョンが間もなく登場するかもしれません。これは、Copilot がローカル Windows ファイル上でタスクを直接実行できる新機能である Copilot Actions のリリースで明らかです。
クレジット: Microsoft
つまり、Windows 11 は急速に、音声またはテキスト コマンドを使用でき、コンピューターがユーザーに代わって何らかのタスクを実行する OS になる方向に向かって進んでいるのだと私は見ています。
Microsoft は、マウスとキーボードを離れて、次のように PC を使用することを望んでいます。タスクを自然な言葉で説明します。 Copilot Voice はそれを具体的な指示に分解します。必要に応じて、Copilot Vision を使用して画面のコンテキストを理解します。ファイルにアクセスします。デスクトップおよび Web アプリケーションと対話します。
これは隠されたものではありません。 Microsoft が明らかにした Windows 2030 のビジョンでは、キーボードとマウスは自然な音声、ジェスチャー、コンテキストに応じたインタラクションに次ぐものになると考えています。

関連
Copilot がついに他のチャットボットに追いつきました
大きな出来事が起こっています。
メカニズム: 内部で何が起こっているのか
もう 1 つの疑問は、Microsoft が実際にエージェント OS のビジョンをどのように実現するのか、そして実際にはどのようなものになるのかということです。これには非常に興味があったので、詳しく調べてみたところ、これが見つかりました。
この変化を推進する 3 つの重要なアーキテクチャ要素があります。
-
副操縦士のアクション
-
モデルコンテキストプロトコル (MCP)
-
エージェントワークスペース
Microsoft は、Windows Insider 向けに Copilot Actions をリリースしました。コパイロット アクションは、対話型レイヤー、つまり汎用エージェントとして機能します。完了したいタスクを自分の言葉で説明すると、エージェントは、包囲された環境でデスクトップおよび Web アプリケーションと対話してタスクを完了しようとします。これが OS との対話方法になります。コパイロット アクションはリクエストを受け取り、単独で、またはタスクを他のエージェントに委任することによって、リクエストを完了しようとします。
2 番目のコンポーネントは MCP サーバーであり、最も重要な部分です。これは、AI エージェントが標準化された方法で外部ツールやデータ ソースと対話できるようにするオープン スタンダードです。これは Anthropic のエンジニアによって発明されました。これについては、Wikipedia で詳しく読むことができます。 Microsoft は、この MCP プロトコルを自社の OS に積極的に採用しています。
たとえば、Microsoft は、Windows ファイル エクスプローラー MCP コネクタは、ファイル エクスプローラーでファイルやフォルダーを操作するためのコンテキスト メニューに MCP サーバー ツールを統合すると述べています。これとは別に、MCP サーバー用の Windows 設定コネクタもあります。
それで、これは何の意味があるのでしょうか? AI エージェントが特定のフォルダー内のファイルを確認したいと想定してみましょう。これを行う方法は 2 つあります。 1 つの方法は、エージェントが AI ビジョンを使用してコンピューターのスクリーンショットを分析し、フォルダー内にどのようなファイルがあるかを把握することです。それは面倒で非効率的です。より良い方法は、ファイル エクスプローラー アプリがすべてのファイルの名前を含むテキスト ファイルを直接渡すことです。
これはまさに MCP が行うことです。これにより、AI エージェントは、時間がかかりエラーが発生しやすい回避策に頼ることなく、外部アプリと効率的に通信できるようになります。
3 番目のコンポーネントはエージェント ワークスペースです。
Microsoftによると、エージェントワークスペースはWindows内の隔離された隔離された環境で、AIエージェントはユーザーのメインセッションとは別に動作できるという。これらのワークスペースは、ユーザーが明示的に選択したアプリとファイルへのアクセスのみを AI に許可するため、メインのデスクトップはクリアで中断されないままになります。
1 つまたは複数のこのようなエージェントは並行して実行され、独自の軽量 Windows セッションを通じて動作し、独自のアカウントによって管理され、独自の仮想デスクトップに制限されます。これは、AI によってもたらされるセキュリティの脅威に対する Microsoft の答えです。
Windows があなたの代わりに仕事をしてくれるようになるでしょうか?
短い答えですが、はい。 Windows は間もなく、いくつかのタスクをユーザーに代わって実行できるようになります。しかし同時に、重要なのは、Windows がユーザーに代わって仕事を実行できるかどうかだけではなく、ユーザーが実際に Windows に仕事を実行したいかどうかであると思います。
技術的な観点から見ると、エージェント OS は実際に多くのタスクを自動化できます。それは可能です。しかし、より大きな問題は、Microsoft が望んでいることとユーザーが必要としているものの間にギャップがあることです。
エンタープライズ環境の場合、エージェント機能によりワークフローの効率が向上する可能性があります。そこに価値があるのです。しかし、平均的な消費者にとって、価値ははるかに低いです。
一般消費者にとって、Windows に AI エージェント、ボット、および多数の自動化ツールを詰め込むことは、やりすぎであるだけでなく、圧倒的です。それは侵入、混乱、フラストレーションを引き起こす危険があり、求めてもいない領域に AI を押し込むことになります。可能なあらゆるものに AI を導入しています。
OS が新しい機能や自動化されたワークフローを常に提案していると想像してください。プロアクティブなシステムが必ずしも役に立つとは限りません。作業を助けるというよりも、作業を中断する可能性があります。これは前にも見たことがあります。たとえば、Windows 11 の永続的なアップグレード プロンプトや、回避できない Copilot 通知などです。
セキュリティも別の懸念事項です。システムにアクセスして実行されている AI エージェントが悪用される可能性があります。単一の構成エラーまたは違反により、気付かないうちに壊滅的なデータ損失や望ましくないシステム変更が発生する可能性があります。
したがって、これにより、将来的にはエージェント Windows があなたの代わりに作業を行うことができるようになると私は確信しています。しかし、どのくらいの費用がかかるのでしょうか?おそらく、その代償はプライバシー、シンプルさ、そして安心です。
*️⃣ 出典リンク:
HTG Wrapped 2025: 24 days of tech 、エージェント AI には自律性と推論機能が備わっており、Copilot はついに他のチャットボットに追いつきました 、 Microsoft が Copilot Actions をリリースしました、 Wikipedia、 Microsoft 、 Microsoft は Agent Workspace と言っています 、可能なあらゆるものに AI を押し込み、