Microsoft Copilotの新しいオーディオAIを実施します。

AI機能を備えた画面分析ツールであるCopilot Visionを導入した後、Microsoftにはテストに新しい製品があります。 Windows Insightは、スクリプト用の人間のようなオーディオ出力を生成し、そのようにしたい場合は創造的なコントロールを取ることができるAI音声生成ツールであるCopilot Audio Expressionsをテストしました。
このツールは、ツールを試すことができる公式のCopilot Labs Webサイトでテストできます。感情とストーリーの2つのモードがあり、ほぼ12個の声とスタイルオプションがあります。 Windows Insightは、機能がどのように機能するかについての深い分析を実施し、さまざまな音声とトーンオプションを試してみると、ツールはそれが何をするのか非常に優れています。しかし、それは主要な言語として英語のみを提供します。
まず、忙しい駅のシナリオをナレーションするダミースクリプトから始めました。スクリプトをプロンプトフィールドに供給し、ボイススタイルを指定するためにスクリプトの行を追加しました。

オークの音声とナレーションスタイルのモードオプションとしてEmoteを選択しました。このツールは、統合されたWebプレーヤーを使用して再生することができたオーディオを生成するのに時間がかかりませんでした。

Emoteモードは、オーディオクリップごとに最大59秒を生成します。私たちは、テキストを声に出して読んでいるAIの声になる単純化されたナレーションを期待していました。驚くべきことに、オーディオクリップは、提供されたスクリプトと追加のビット、より魅力的に聞こえるビットを追加したビットで自由を取りました。それは、すでに良いスクリプトスニペットに、小さなが便利な詳細を追加しました。
ログイン要件なしでオーディオファイルをダウンロードできるという事実が気に入っており、MP3形式を使用しています。したがって、どのデバイスやプレーヤーでそれを再生することは問題になりません。 Copilot Audio Expressionは、粒状コントロールを備えたEmoteモードに感銘を受けましたが、ストーリーモードも探索したかったのです。
ストーリーモードで説得力のあるストーリーを生成します
次に、音声とスタイルを自動的に選択し、それらを調整するオプションを提供するストーリーモードを選択しました。あなたはプロンプトであなたが望むものを指定することができますが、私たちは「獲物を満たすために影に潜んでいる猫についての物語を語る」という基本的なプロンプトを持って行きました。
今回、このツールは、獲物を探している猫を語る人についての90秒の物語を調理しました。ナレーターの声(アメリカのアクセント)と猫の声(はい、猫はこの物語で話し、空腹を表現しています)の両方をイギリスのアクセントに持っていました。どちらも完全に同期し、平らなAIの音声ではなくコラボレーションのように聞こえました。

両方のオーディオスニペットをチェックして、出力品質を確認できます。
オーディオクリップの作成に使用できるAIオーディオ生成ツールに値することがわかりました。 Copilot Labsサイトでツールを試してみてください。
共有
ニュースレター
購読する
プッシュ通知を購読します
WLニュースレター
WLニュースレター!
最新のWindows、IT、およびAIの更新を進めてください。 50,000人以上の加入者から信頼されています。
名前
メール
無料で参加してください
*÷ソースリンク:
Copilot Vision、 Copilot Labsサイト、
ニュースレター
、