Darius Baruo
2025/12/19 2:12
Together AIは、テキスト読み上げ機能を向上させるため、Rime Arcana v2およびMist v2モデルの統合を発表し、エンタープライズアプリケーション向けに強化された表現力と発音制御を提供します。
Together AIは、2つの高度なRimeテキスト読み上げ(TTS)モデル、Arcana v2とMist v2をプラットフォームに導入し、AI Native Cloudの提供を強化しました。Together AIの報告によると、これらのモデルは、表現力と発音精度を向上させたエンタープライズグレードの音声ソリューションを提供することを目指しています。
TTS技術の進歩
Arcana v2とMist v2は、既存の大規模言語モデル(LLM)および音声認識(STT)システムとシームレスに統合できるように設計されており、ユーザーが音声技術インフラをより効率的に管理できるようにします。これらのモデルは、Together AIの専用クラウドインフラストラクチャ上でホストされており、エンタープライズアプリケーションに不可欠な低レイテンシと高信頼性を確保しています。
Arcana v2: 強化された会話表現力
Arcana v2は表現力に特化しており、多様な顧客サービスシナリオに対応するため、複数の言語と方言で40以上の音声を提供しています。営業やサポートなど、ニュアンスのある会話能力が求められる環境で特に効果的であり、営業コンバージョン率や通話成功率などの指標を改善することが示されています。
Mist v2: 発音の精度
Mist v2は、一貫性が重要な大量のアプリケーションに不可欠な、確定的な発音に焦点を当てています。このモデルにより、ユーザーは一度発音を定義するだけで、異なる音声やプラットフォーム間で統一性を確保できます。このような精度は、正確なコミュニケーションが不可欠な医療や金融などの分野で極めて重要です。
エンタープライズアプリケーションへの影響
両モデルは、Fortune 500企業からスタートアップ企業まで、さまざまな業界ですでに展開されています。Arcana v2の会話インタラクションを強化する能力は、顧客エンゲージメントの大幅な改善につながっています。一方、Mist v2の発音制御における信頼性は、顧客サービスや音声自動応答(IVR)システムなどの重要な環境をサポートしています。
インフラストラクチャとコンプライアンス
Together AIは、専用のGPUリソースとSOC 2 Type IIおよびHIPAA基準への準拠により、これらのモデルをサポートする堅牢なインフラストラクチャを提供しています。このセットアップにより、企業は高いパフォーマンスと稼働時間を維持しながら、厳格な規制要件を満たす音声ソリューションを展開できます。
将来の展望
これらのモデルの統合により、Together AIはプラットフォームを進化させ続け、企業の多様なニーズに対応する包括的な音声ソリューションスイートを提供しています。この開発は、AI 駆動音声技術の進化における重要な前進を示しており、自動化システムにおけるより自然で効果的なインタラクションを約束しています。
画像出典: Shutterstock
出典: https://blockchain.news/news/together-ai-integrates-rime-voice-models-enhanced-tts-solutions


