エージェント オペレーティング システムに非常に問題がある 4 つの理由
<本文>
エージェント オペレーティング システムというアイデアは、机上では素晴らしく聞こえます。メニューをクリックして単調なタスクを自分で実行する代わりに、プロンプトを通じてコンピュータに要求を伝えると、コンピュータはそのタスクを独自に実行する方法を見つけ出します。ファイルの移動、設定の変更、電子メールの下書きと送信が可能で、最も重要なことは、これらのタスクがユーザーからの最小限の入力で連鎖的に行われることです。
悪意のある行為者やソフトウェアのバグが存在しない世界では、それはすべて素晴らしいことのように聞こえますが、残念なことに、私たちはそれらが蔓延する世界に住んでいます。このエージェント モデルは、現代のコンピューティングが構築されている多くの前提を静かに打ち破ります。歴史的に、オペレーティング システムは事後的、決定論的、明示的でしたが、エージェント的な OS 設計はそれを自律性、推論、確率的意思決定に置き換えます。この変化には、ほとんどのマーケティングが示唆するよりもはるかに深刻なトレードオフが伴います。
セキュリティ リスクが大幅に増加
あなたはだまされる可能性のあるものに多大な信頼を置いています

人間は間違いを犯すものです。私たちはだまされて、ソーシャル エンジニアリング、フィッシング、その他の不正な手段を通じて、本来提供しないような情報を提供してしまう可能性があります。エージェント OS が役立つためには、ユーザーと同じレベルのアクセス権が必要です。これは、ファイルのアクセス許可、アプリケーションのアクセス許可、ネットワーク アクセス、そしておそらく最も懸念されるパスワード保管庫が必要であることを意味します。パスワードを要求したり、パスキーを確認したりするために 10 分ごとに停止するエージェント OS は目的を達成できません。ここにエージェント オペレーティング システムの問題の核心があります。
エージェント システムは完全ではありません。従来のアプリが失敗したり、侵害されたりした場合 (議論のために LLM も)、「影響範囲」は比較的限られていますが、エージェントが失敗すると、そのほぼシステム レベルの権限がコンピューターだけでなくデータにも壊滅的な影響を与える可能性があります。攻撃対象領域は膨大です。プロンプトインジェクション、汚染されたコンテキスト、およびエージェントへの入力のその他の操作は、実行可能なセキュリティベクトルになる可能性があります。 ChatGPT や Claude などをだまして、彼らがすべきではないことを実行できることは、人々が何度も証明しており、これらのエージェント オペレーティング システムも例外ではありません。
説明責任はありません
企業は責任を放棄するだろう

従来の OS が予期しないことをした場合、その責任は通常非常に明確です。ユーザーがボタンをクリックしたり、アプリが誤動作したり、ドライバーがクラッシュしたりしました。エージェント システムでは、その明確さはほとんど完全に失われます。それはユーザーのプロンプトでしたか?エージェントは、あなたがそれを使用した前のコンテキストを誤解しましたか?幻覚だったのか?
エージェントが間違ったファイルを削除したり、機密データを送信したり、重要な設定を変更したりした場合、誰が責任を負うのでしょうか?ユーザーは明示的にアクションを実行しませんでした。 OS は決定的な指示に従いませんでした。モデルはコンテキスト、履歴、確率に基づいて意図を解釈しますが、場合によっては誤解する可能性があります (そして、間違います)。
これは、特に機密データを扱う場合に、大きな説明責任の問題を引き起こします。おそらく、あらゆる種類のエージェント OS には、ユーザーに責任を転嫁することを可能にする非常に長い利用規約が付属しているでしょう。どのような種類の企業環境であっても、管理者が最初から使用を許可する勇気がある場合、これが法的な悪夢に変わるのは目に見えています。
失敗は再現不可能になる可能性があります
PC のトラブルシューティングが完全に中断される可能性があります

PC を所有し、毎日使用する場合の基本的な部分の 1 つは、エラーを再現し、それに応じてトラブルシューティングを行う能力です。再現できない問題は、修復することが非常に困難な問題であり、エージェント機能を追加すると、問題を推論する能力を失います。
エージェントの決定は、タイミング、以前のコンテキスト、システム状態、および確率的推論の影響を受けます。同じリクエストを 2 回発行すると、異なる結果が生じる可能性があります。一度発生した失敗は二度と起こらないか、あるいはわずかに異なる状況で再び発生する可能性があります。
ログには、どのようなアクションが実行されたかが示されますが、そのアクションが選択された理由が示されることはほとんどありません。これにより、従来のトラブルシューティング ワークフローが非効率になります。そもそも明示的ではなかったステップを確実に遡ることはできません。
意図の推論は依然として根本的に信頼性が低い
人間は常に予測できるわけではありません
エージェントティック OS は、システムがユーザーの意図した内容を正しく推測できるという 1 つの脆弱な前提に依存しています。しかし、人間の意図は時には複雑で、多くの場合曖昧で、状況に応じて非常に複雑です。
人間は共通の仮定と状況認識に依存しているため、ユーザーが不完全な指示を出すことがよくあります。モデルはこれらの仮定を実際には理解していませんが、代わりにそれらを近似します。彼らがそれを間違った場合、その結果は単なる悪い提案ではありません。それはユーザーに代わって行われるアクションです。
最も危険なエラーは、ほぼ正しいエラーです。間違ったフォルダーを削除したり、間違った設定を変更したり、間違ったドキュメントを共有したりすることは、何もしないよりもはるかに悪いです。個人的には、むしろ自分の意思で間違っていたほうがいいと思います。
自動化はオペレーティング システムに組み込まれますが、エージェント アクションは組み込まれません。
エージェント システムは、範囲が狭く、範囲が広いツールでは意味を持ちますが、オペレーティング システムはそのカテゴリに分類されません。その範囲は広大で多様であり、ユーザー定義の自動化の恩恵を受けることはできますが、エージェント的なものは私の好みには少し境界を押し広げすぎます。オペレーティング システムは退屈で予測可能でなければなりません。
*️⃣ 出典リンク:
そのタスクを単独で実行し、ほとんどのマーケティングが暗示するよりも多くの前提を打ち破り、 同じレベルのアクセス、オペレーティング システム、予測可能、