Cloud TTS

CXoneCloud TTSを使えば、お客様のCloud TTSプロファイルのすべてを1か所で管理できます。Cloud TTSは、テキストを合成音声によって作られる音声出力に変換します。Cloud TTSプロファイルは、音声と言語の組み合わせを定義します。このサービスは、CXoneIVR閉じた 発信者が音声コマンド、キー入力、またはその両方を介して対話し、情報を取得したり、着信音声通話をルーティングしたり、あるいはその両方を行うことができる自動電話メニュー。で使用できます。例えば、IVRに複数の言語オプションを追加できます。

Cloud TTSは、PlayなどのStudioアクションで提供されるTTSサービスとは別個のテキスト読み上げオファリングです。

Classics, Inc.は、このたび、新たな地域へ書籍販売事業を展開することとなりました。CXone管理者のアンシャーリーは、新しい地域のスクリプトでIVR閉じた 発信者が音声コマンド、キー入力、またはその両方を介して対話し、情報を取得したり、着信音声通話をルーティングしたり、あるいはその両方を行うことができる自動電話メニュー。メニューの設定を開始します。彼女はCXoneが提供するデフォルトの多言語音声合成機能には、いくつか違和感があることを発見しました。アンはCloud TTSを使用することで、必要とする言語を提供するTTSプロバイダーを選択できることを知ります。彼女は、TTSプロバイダーが提供する幅広い音声の選択肢を気に入っています。

SSMLサポート

Cloud TTSは音声合成マークアップ言語(SSML)の使用をサポートしています。SSMLはXMLベースのマークアップ言語で、テキストを音声に合成する方法のさまざまな側面を指定できます。発音、話速、声の高さ、音量などを微調整するために使用できます。

SSMLを使用するには、テキスト入力が次の条件を満たす必要があります。

  • 有効なXML
  • 有効なSSML
  • <speak> </speak>タグのセットに含まれる
  • それぞれが1つの属性のみを持つタグでマークアップ(これには<speak>タグが含まれます)

例:

<speak xml:lang="en-US">

Here are <say-as interpret-as="characters">SSML</say-as> samples.

I can pause <break time="3s"/>.

I can say cardinal numbers. This number is <say-as interpret-as="cardinal">1135</say-as>.

Or I can say ordinal numbers. You are <say-as interpret-as="ordinal">1135</say-as> in line.

I can even say numbers as digits. The digits are <say-as interpret-as="characters">1135</say-as>.

I can also substitute phrases, like the <sub alias="World Wide Web Consortium">W3C</sub>.

</speak>

スクリプトでは、TTSプロバイダーからサポートされているマークアップ言語を使用する必要があります。その他のTTSマークアップは機能しない場合があります。Googleに固有のSSMLのバリエーションや要件については、GoogleTTSのドキュメンテーションを参照してください。

TTSプロバイダー

このセクションのコンテンツは、制御リリース(CR)の製品または機能用です。CRグループに所属しておらず、詳細情報が必要な場合は、CXoneアカウント担当者にお問い合わせください。

CXoneCloud TTSは、サードパーティのTTS閉じた ユーザーが録音されたプロンプトをテキストとして入力し、コンピューターで生成された音声を使用してコンテンツを話すことができるようにします。プロバイダーを使用しています。サポートされているプロバイダーのどれを使用するかを選択できます。また、Cloud TTSが使用する言語と声を選択することもできます。サポートされる言語はTTSプロバイダーによって異なります。

現在、CXoneは以下のプロバイダーをサポートしています:

  • AWS PollyTTS(制限リリース)
  • Google TTS
  • Googleカスタム音声TTS

サポートされている言語と音声

TTS閉じた ユーザーが録音されたプロンプトをテキストとして入力し、コンピューターで生成された音声を使用してコンテンツを話すことができるようにします。プロバイダーが提供する言語セットは異なります。言語ごとに、選択可能な1つ以上の音声が提供されます。言語と音声の選択はいつでも変更できます。最新の対応言語リストについては、各TSプロバイダーのドキュメントをチェックしてください:

複数の言語のTTSが必要な場合は、スクリプトに複数のTTSVOICE アクションStudioを追加し、それぞれが異なる音声を使用するように構成します。必要に応じて、各アクションで異なるTTSプロバイダーを使用できます。