Contents

Microsoft AIはMAI-Voice-1を起動し、MAI-1ファンデーションモデルをプレビューします

/images/MAI-Voice-1-and-MAI-1-Preview-1.png

開示ページを読んで、Windows Insightが編集チームを維持するのをどのように支援できるかを確認してください。続きを読む

読者はWindowsの洞察をサポートするのに役立ちます。あなたが当社のリンクを通して購入する場合、私たちは手数料を取得するかもしれません。

Microsoft AI(MAI)は、Mai-Voice-1とMai-1-Previewの最新のラインナップで正式にカーテンを引き戻しました。最初のものは非常に表現力豊かな音声生成システムであり、後者は同社の最初の大規模な基礎モデルであるエンドツーエンドの訓練です。

mai-voice-1は、自然なスピーチをCopilotにもたらします

Mai-Voice-1は、表現力と速度のために構築されたMicrosoftの最初の社内音声モデルです。同社によれば、単一のGPUで1秒未満で1分間のオーディオを生成できます。これにより、この種の最速システムの1つになります。

このモデルは、Copilot Labs内に専用の遊び場を備えた、すでにCopilot Dailyおよびポッドキャストに統合されています。ユーザーは、ストーリーテリングエクスペリエンスやガイド付き瞑想などのデモを試すことができ、シングルおよびマルチスピーカーのシナリオ全体でモデルの高忠実度オーディオを紹介できます。

MAI-1-PREVIEWはパブリックテストにヒットします

Voiceに加えて、Microsoftは、最初の内部訓練を受けた基礎モデルであるMai-1-Previewも導入しました。約15,000のNvidia H100 GPUで混合された専門家アーキテクチャを使用して構築されたこのモデルは、人気のあるコミュニティ評価プラットフォームであるLmarenaでテストされています。

MAI-1-PREVIEWは、指導に従ったものと一般的な支援のために設計されており、Microsoftは今後数週間のうちに選択された副操縦士のテキストユースケースで展開することを計画しています。 APIアクセスは、早期フィードバックのために信頼できるテスターに​​拡張されています。

両方のリリースは、ユーザーのニーズに合わせて責任ある信頼性の高いAIを提供するというマイクロソフトの長期的なビジョンの一部です。同社はすでに次世代のGB200クラスターを運営しており、より専門的なモデルが進行中であると述べています。

*÷ソースリンク:

mai-voice-1およびmai-1-previewhttps://copilot.microsoft.com/labs/audio-expression)