Service de synthèse vocale cloud

CXone Service de synthèse vocale cloud convertit le texte en sortie parlée délivrée par des voix synthétisées. Ce service, également appelé synthèse vocale (TTS), peut être utilisé avec CXone RVIFermé Menu téléphonique automatisé qui permet aux appelants d'interagir via des commandes vocales, des entrées de touches, ou les deux, pour obtenir des informations, acheminer un appel vocal entrant, ou les deux. . Par exemple, vous pouvez ajouter plusieurs options linguistiques à votre IVR.

Classiques, Inc. a récemment étendu ses activités de librairie à de nouvelles régions. Anne Shirley, le CXone administrateur, commence les menus de configurationRVIFermé Menu téléphonique automatisé qui permet aux appelants d'interagir via des commandes vocales, des entrées de touches, ou les deux, pour obtenir des informations, acheminer un appel vocal entrant, ou les deux. dans les scripts pour les nouvelles régions. Elle découvre certaines lacunes dans les langues de synthèse vocale par défaut qui CXone des offres. Anne apprend qu'avec Synthèse vocale cloud, elle peut choisir un fournisseur TTS qui propose les langues dont elle a besoin. Elle aime que les fournisseurs TTS offrent un large éventail de voix parmi lesquelles choisir.

Prise en charge de SSML

Service de synthèse vocale cloud Prend en charge l’utilisation du langage SSML (Speech Synthesis Markup Language). Ce langage de balisage basé sur XML vous permet de spécifier de nombreux aspects de la synthèse vocale du texte. Vous pouvez l’utiliser pour affiner la prononciation, la vitesse d’élocution, le ton de voix, le volume, etc.

Pour utiliser SSML, le texte d’entrée doit respecter les critères suivants :

  • Contenu XML valide
  • Contenu SSML valide
  • Contenu délimité par un jeu de balise <speak> </speak>
  • Contenu utilisant des balises contenant un seul attribut chacune (vaut également pour la balise <speak>)

Par exemple :

<speak xml:lang="en-US">

Here are <say-as interpret-as="characters">SSML</say-as> samples.

I can pause <break time="3s"/>.

I can say cardinal numbers. This number is <say-as interpret-as="cardinal">1135</say-as>.

Or I can say ordinal numbers. You are <say-as interpret-as="ordinal">1135</say-as> in line.

I can even say numbers as digits. The digits are <say-as interpret-as="characters">1135</say-as>.

I can also substitute phrases, like the <sub alias="World Wide Web Consortium">W3C</sub>.

</speak>

Vous devez utiliser le langage de balisage pris en charge indiqué par le fournisseurs TTS dans vos scripts. D’autres formes de balisage TTS risquent de ne pas fonctionner. Reportez-vous à la documentation Google TTS pour plus d’informations sur les variations ou exigences SSML propres à Google.

Fournisseurs TTS

CXone Synthèse vocale cloud utilise des fournisseurs des tiers STTFermé Permet aux utilisateurs de saisir des invites enregistrées sous forme de texte et d'utiliser une voix générée par ordinateur pour lire le contenu.. Vous pouvez choisir lequel des fournisseurs pris en charge vous souhaitez utiliser. Vous pouvez également choisir la langue et la voix quiSynthèse vocale cloud les usages. Les langues prises en charge varient selon le fournisseur TTS.

À l’heure actuelle, CXone prend en charge GoogleTTS.

Langues et voix prises en charge

Chaque fournisseur STTFermé Permet aux utilisateurs de saisir des invites enregistrées sous forme de texte et d'utiliser une voix générée par ordinateur pour lire le contenu. propose un ensemble de langues différent. Pour chaque langue, ils proposent une ou plusieurs voix parmi lesquelles vous pouvez choisir. Étant donné que la sélection de langues et de voix peut changer à tout moment, pour afficher la liste la plus récente des langues prises en charge, vous pouvez :

  • Consultez la documentation de chaque fournisseur TTS.
  • Regardez la page Sélectionnez une voix pour chaque fournisseur TTS sur la page Cloud Text to Speech.

Si vous avez besoin de la TTS dans plusieurs langues, vous pouvez ajouter plusieurs TTSVOICE actions à vos scripts Studio et configurez chacun pour utiliser une voix différente. Chaque action peut utiliser un fournisseur TTS différent, si nécessaire.