Cloud TTS

CXoneCloud TTSを使えば、お客様のCloud TTSプロファイルのすべてを1か所で管理できます。Cloud TTSは、テキストを合成音声によって作られる音声出力に変換します。Cloud TTSプロファイルは、音声と言語の組み合わせを定義します。このサービスは、CXoneIVR閉じた 音声コマンド、キー入力、またはその両方を使用して発信者が情報を取得したり、着信音声通話をルーティングしたり、またはその両方を行うことができる自動電話メニュー。で使用できます。例えば、IVRに複数の言語オプションを追加できます。

Cloud TTSは、PlayなどのStudioアクションで提供されるTTSサービスとは別個のテキスト読み上げオファリングです。

Classics, Inc.は、このたび、新たな地域へ書籍販売事業を展開することとなりました。CXone管理者のアンシャーリーは、新しい地域のスクリプトでIVR閉じた 音声コマンド、キー入力、またはその両方を使用して発信者が情報を取得したり、着信音声通話をルーティングしたり、またはその両方を行うことができる自動電話メニュー。メニューの設定を開始します。彼女はCXoneが提供するデフォルトの多言語音声合成機能には、いくつか違和感があることを発見しました。アンはCloud TTSを使用することで、必要とする言語を提供するTTSプロバイダーを選択できることを知ります。彼女は、TTSプロバイダーが提供する幅広い音声の選択肢を気に入っています。

SSMLサポート

Cloud TTSは音声合成マークアップ言語(SSML)の使用をサポートしています。SSMLはXMLベースのマークアップ言語で、テキストを音声に合成する方法のさまざまな側面を指定できます。発音、話速、声の高さ、音量などを微調整するために使用できます。

SSMLを使用するには、テキスト入力が次の条件を満たす必要があります。

  • 有効なXML
  • 有効なSSML
  • <speak> </speak>タグのセットに含まれる
  • それぞれが1つの属性のみを持つタグでマークアップ(これには<speak>タグが含まれます)

例:

<speak xml:lang="en-US">

Here are <say-as interpret-as="characters">SSML</say-as> samples.

I can pause <break time="3s"/>.

I can say cardinal numbers. This number is <say-as interpret-as="cardinal">1135</say-as>.

Or I can say ordinal numbers. You are <say-as interpret-as="ordinal">1135</say-as> in line.

I can even say numbers as digits. The digits are <say-as interpret-as="characters">1135</say-as>.

I can also substitute phrases, like the <sub alias="World Wide Web Consortium">W3C</sub>.

</speak>

スクリプトでは、TTSプロバイダーからサポートされているマークアップ言語を使用する必要があります。その他のTTSマークアップは機能しない場合があります。Googleに固有のSSMLのバリエーションや要件については、GoogleTTSのドキュメンテーションを参照してください。

TTSプロバイダー

このセクションのコンテンツは、制御リリース(CR)の製品または機能用です。 CRグループに参加していない場合で、詳細情報を知りたい方は、CXoneアカウント担当者にお問い合わせください。

CXoneCloud TTSは、サードパーティのTTS閉じた ユーザーが録音プロンプトをテキストとして入力し、コンピューターで生成された音声を使用してその内容を読み上げる機能。プロバイダーを使用しています。サポートされているプロバイダーのどれを使用するかを選択できます。また、Cloud TTSが使用する言語と声を選択することもできます。サポートされる言語はTTSプロバイダーによって異なります。

現在、CXoneは以下のプロバイダーをサポートしています:

  • AWS PollyTTS(制限リリース)
  • Google TTS
  • Googleカスタム音声TTS

サポートされている言語と音声

TTS閉じた ユーザーが録音プロンプトをテキストとして入力し、コンピューターで生成された音声を使用してその内容を読み上げる機能。プロバイダーが提供する言語セットは異なります。言語ごとに、選択可能な1つ以上の音声が提供されます。言語と音声の選択はいつでも変更できます。最新の対応言語リストについては、各TSプロバイダーのドキュメントをチェックしてください:

複数の言語のTTSが必要な場合は、スクリプトに複数のTTSVOICE アクションStudioを追加し、それぞれが異なる音声を使用するように構成します。必要に応じて、各アクションで異なるTTSプロバイダーを使用できます。