Synthèse vocale cloud

La Synthèse vocale cloud CXone vous permet de gérer tous vos profils de Synthèse vocale cloud en un seul endroit. La Synthèse vocale cloud convertit le texte en sortie parlée délivrée par des voix de synthèse. Un profil de Synthèse vocale cloud définit une combinaison de voix et de langue. Ce service peut être utilisé avec les IVRFermé Menu téléphonique automatisé qui permet aux appelants d'interagir via des commandes vocales, des entrées de touches, ou les deux, pour obtenir des informations, acheminer un appel vocal entrant, ou les deux. dans CXone. Par exemple, vous pouvez ajouter plusieurs options de langues à votre IVR.

La Synthèse vocale cloud est une offre distincte du service TTS fourni avec les actions Studio comme Lire.

Classiques, Inc. a récemment étendu ses activités de librairie à de nouvelles régions. Anne Shirley, le CXone administrateur, commence les menus de configurationRVIFermé Menu téléphonique automatisé qui permet aux appelants d'interagir via des commandes vocales, des entrées de touches, ou les deux, pour obtenir des informations, acheminer un appel vocal entrant, ou les deux. dans les scripts pour les nouvelles régions. Elle découvre certaines lacunes dans les langues de synthèse vocale par défaut qui CXone des offres. Anne apprend qu'avec Synthèse vocale cloud, elle peut choisir un fournisseur TTS qui propose les langues dont elle a besoin. Elle aime que les fournisseurs TTS offrent un large éventail de voix parmi lesquelles choisir.

À l’heure actuelle, la Synthèse vocale cloud CXone prend en charge un seul fournisseur TTS tiers, Google TTS Service.

Prise en charge de SSML

Synthèse vocale cloud Prend en charge l’utilisation du langage SSML (Speech Synthesis Markup Language). Ce langage de balisage basé sur XML vous permet de spécifier de nombreux aspects de la synthèse vocale du texte. Vous pouvez l’utiliser pour affiner la pronunciation, la vitesse d’élocution, le ton de voix, le volume, etc.

Pour utiliser SSML, le texte d’entrée doit respecter les critères suivants :

  • Contenu XML valide
  • Contenu SSML valide
  • Contenu délimité par un jeu de balise <speak> </speak>
  • Contenu utilisant des balises contenant un seul attribut chacune (vaut également pour la balise <speak>)

Par exemple :

<speak xml:lang="en-US">

Here are <say-as interpret-as="characters">SSML</say-as> samples.

I can pause <break time="3s"/>.

I can say cardinal numbers. This number is <say-as interpret-as="cardinal">1135</say-as>.

Or I can say ordinal numbers. You are <say-as interpret-as="ordinal">1135</say-as> in line.

I can even say numbers as digits. The digits are <say-as interpret-as="characters">1135</say-as>.

I can also substitute phrases, like the <sub alias="World Wide Web Consortium">W3C</sub>.

</speak>

Vous devez utiliser le langage de balisage pris en charge indiqué par le fournisseurs TTS dans vos scripts. D’autres formes de balisage TTS risquent de ne pas fonctionner. Reportez-vous à la documentation Google TTS pour plus d’informations sur les variations ou exigences SSML propres à Google.

Langues et voix prises en charge

Chaque fournisseur STTFermé Permet aux utilisateurs de saisir des invites enregistrées sous forme de texte et d'utiliser une voix générée par ordinateur pour lire le contenu. propose un ensemble de langues différent. Pour chaque langue, ils proposent une ou plusieurs voix parmi lesquelles vous pouvez choisir. Étant donné que la sélection de langues et de voix peut changer à tout moment, pour afficher la liste la plus récente des langues prises en charge, vous pouvez :

  • Consultez la documentation de chaque fournisseur TTS.
  • Regardez la page Sélectionnez une voix pour chaque fournisseur TTS sur la page Cloud Text to Speech.

Si vous avez besoin de la TTS dans plusieurs langues, vous pouvez ajouter plusieurs TTSVOICE actions à vos scripts Studio et configurez chacun pour utiliser une voix différente.