Cloud TTS Service
このページのコンテンツは、制御リリース(CR)の製品または機能用です。CRグループに所属しておらず、詳細情報が必要な場合は、CXoneアカウント担当者にお問い合わせください。
必要な権限: スクリプトを表示、スクリプトを作成/編集
CXoneCloud TTS Serviceは、テキストを合成音声によって配信される音声出力に変換します。このサービスは、音声合成(TTS)とも呼ばれ、CXone IVR 発信者が音声コマンド、キー入力、またはその両方を介して対話し、情報を取得したり、着信音声通話をルーティングしたり、あるいはその両方を行うことができる自動電話メニュー。と一緒に使用できます。たとえば、IVRに複数の言語オプションを追加できます。
Classics, Inc.は、このたび、新たな地域へ書籍販売事業を展開することとなりました。CXone管理者のアンシャーリーは、新しい地域のスクリプトでIVR 発信者が音声コマンド、キー入力、またはその両方を介して対話し、情報を取得したり、着信音声通話をルーティングしたり、あるいはその両方を行うことができる自動電話メニュー。メニューの設定を開始します。彼女はCXoneが提供するデフォルトの多言語音声合成機能には、いくつか違和感があることを発見しました。アンはCloud TTSを使用することで、必要とする言語を提供するTTSプロバイダーを選択できることを知ります。彼女は、TTSプロバイダーが提供する幅広い音声の選択肢を気に入っています。
SSMLサポート
Cloud TTS Serviceは音声合成マークアップ言語(SSML)の使用をサポートしています。SSMLはXMLベースのマークアップ言語で、テキストを音声に合成する方法のさまざまな側面を指定できます。発音、話速、声の高さ、音量などを微調整するために使用できます。
SSMLを使用するには、テキスト入力が次の条件を満たす必要があります。
- 有効なXML
- 有効なSSML
- <speak> </speak>タグのセットに含まれる
-
それぞれが1つの属性のみを持つタグでマークアップ(これには<speak>タグが含まれます)
タグごとに1つの属性の例を表示する
<speak xml:lang="en-US">
<voice name="en-US-JennyNeural"> Good morning Chris! </voice>
<voice name="en-US-ChristopherNeural"> Good morning to you too, Jenny! </voice>
</speak>
たとえば。
<speak xml:lang="en-US">
Here are <say-as interpret-as="characters">SSML</say-as> samples.
I can pause <break time="3s"/>.
I can say cardinal numbers. This number is <say-as interpret-as="cardinal">1135</say-as>.
Or I can say ordinal numbers. You are <say-as interpret-as="ordinal">1135</say-as> in line.
I can even say numbers as digits. The digits are <say-as interpret-as="characters">1135</say-as>.
I can also substitute phrases, like the <sub alias="World Wide Web Consortium">W3C</sub>.
</speak>
スクリプトでは、TTSプロバイダーからサポートされているマークアップ言語を使用する必要があります。その他のTTSマークアップは機能しない場合があります。SSMLのバリエーションやGoogle固有の要件については、Google TTSのドキュメントを参照してください。
TTSプロバイダー
CXone Cloud TTSは、サードパーティのTTS ユーザーが録音されたプロンプトをテキストとして入力し、コンピューターで生成された音声を使用してコンテンツを話すことができるようにします。プロバイダーを使用しています。サポートされているプロバイダーのどれを使用するかを選択できます。また、Cloud TTSが使用する言語と声を選択することもできます。サポートされる言語はTTSプロバイダーによって異なります。
現在、CXoneはGoogle TTSをサポートしています。
サポートされている言語と音声
各TTS ユーザーが録音されたプロンプトをテキストとして入力し、コンピューターで生成された音声を使用してコンテンツを話すことができるようにします。プロバイダーが提供する言語セットは異なります。 空のテキストボックスを持つデジタルチャットスキルのプッシュ通知ページの画面キャプチャ。言語ごとに、選択可能な1つ以上の音声が提供されます。言語と音声の選択はいつでも変更される可能性があるため、サポートされている言語の最新のリストを表示するには、次のことができます。
- 各TTSプロバイダーのドキュメントを確認してください。
- Cloud Text to Speechページの各TTSプロバイダーの 音声の選択ページを確認してください。
複数の言語のTTSが必要な場合は、Studioスクリプトに複数のTTSVOICE アクションを追加し、それぞれが異なる音声を使用するように構成します。必要に応じて、各アクションで異なるTTSプロバイダーを使用できます。