1. ホーム
  2. ニュース
  3. Speechify、LiveKitとの提携でAI音声エージェントを強化
2025年5月13日

Speechify、LiveKitとの提携でAI音声エージェントを強化

SpeechifyとLiveKitがどのように会話型AIの未来を変革しているかをご覧ください。

AI音声生成プラットフォームのリーダーであるSpeechifyは、リアルタイム音声エージェントのオーケストレーションで世界的に人気のあるオープンソースプラットフォーム、LiveKitとの強力な新統合を正式に開始しました。この提携により、開発者はSpeechifyのリアルなテキスト読み上げ(TTS)機能をLiveKitエコシステムで構築された会話型音声エージェントにシームレスに組み込むことができ、カスタマーサポート、営業、教育、医療などで応答性が高く、感情的に知的なエージェントをこれまで以上に簡単に作成できます。

SpeechifyとLiveKitの提携が意味するもの

この統合により、LiveKitの開発者はLiveKit Agents SDK内で直接Speechifyの高度なAI音声技術にアクセスできるようになり、自然で表現力豊かで人間らしい音声駆動のボットを作成することが可能になります。SpeechifyのTTSは60以上の言語と方言をサポートし、カジュアルで親しみやすいトーンからプロフェッショナルで説得力のある配信まで、1,000以上の高品質な音声を提供します。

LiveKitの概要

LiveKitは、リアルタイムの音声ベースのアプリケーションを構築する開発者にとっての定番ソリューションとなっています。グループ音声チャット、ライブ放送プラットフォーム、またはAIカスタマーサービスエージェントを構築する際に、LiveKitは低遅延で高信頼性の音声インタラクションをスケールするためのインフラとオーケストレーションツールを提供します。新しいAgents機能は、ユーザーとリアルタイムで対話する音声ベースのボットを構築するために特別に設計されています。Speechifyとの統合により、これらのボットは明瞭で感情的に魅力的な人間の声で話すことができます。

LiveKitのプラグインシステムを使用して、開発者は数秒でSpeechifyを好みのTTSプロバイダーとして設定できます。このスムーズな統合により、LiveKit Agentsはテキストから即座に音声応答を合成し、スムーズで非常にリアルな会話体験を作り出します。AIエージェントがカスタマーサービスの流れを案内したり、リアルタイムの更新をナレーションしたり、語学学習を促進したりする際に、Speechifyの表現力豊かな声がユーザーの関心を引き続けます。

なぜSpeechifyなのか?

Speechifyは、最も柔軟で手頃な価格設定を提供することで、他のテキスト読み上げプロバイダーと一線を画しています。開発者は100万文字あたり10ドル、つまり約2,000分の音声に相当する料金を支払うだけです。使用制限や隠れた料金、前払いはなく、シンプルな従量課金制でエンタープライズグレードの音声AIにアクセスできます。

この価格モデルは、スタートアップ、独立系開発者、迅速にスケールしたい企業にとって特に魅力的です。厳格な契約に縛られることなく、予期せぬ超過料金に悩まされることもありません。 

SpeechifyとLiveKitを活用したAI音声エージェントのユースケース

この提携により、さまざまな業界での革新が可能になります。企業がLiveKitエコシステム内でSpeechifyを活用したAI音声エージェントを活用する方法の一部を以下に示します:

  • カスタマーサポート: AIエージェントは基本的な問い合わせに対応し、一般的なトラブルシューティング手順を自然で安心感のある声で案内します。
  • 医療: バーチャルアシスタントは予約のスケジュール、薬のリマインダー、健康に関するアドバイスを親しみやすく落ち着いたトーンで提供します。
  • 教育: インタラクティブな音声チューターや語学学習ボットは、地域のアクセントや感情豊かな発音でレッスンを提供します。
  • 企業研修: AI営業エージェントはリアルタイムでチームを指導し、ロールプレイの会話をシミュレートし、オンボーディングプロセスをナレーションします。
  • アクセシビリティ: 音声エージェントは視覚障害者が複雑なアプリやサービスを音声だけで操作するのを支援します。

LivekitでのSpeechifyの始め方  

開発者は LiveKit Agents SDKを通じて統合にアクセスでき、Speechifyは公式のTTSプロバイダーとしてリストされています。セットアップは簡単で、SpeechifyのAPIキーを設定し、希望の声を選択して、リアルタイムでテキストを豊かで表現力豊かな音声に変換するだけです。

この統合はオープンソースで、 GitHubから入手可能です。完全なカスタマイズと透明性を実現します。Speechifyは、開発者が音声エージェントアプリケーションを最大限に活用できるよう、詳細なドキュメント、音声プレビュー、ベストプラクティスを提供しています。

詳細を知り、開発を始めるには、 LiveKitドキュメントのSpeechifyのページをご覧ください。