Reconnaissance vocale automatique (ASR)

La reconnaissance vocale automatique (ASR) permet aux contacts de répondre aux incitations IVRFermé Menu téléphonique automatisé qui permet aux appelants d'interagir via des commandes vocales, des entrées de touches ou les deux pour obtenir des informations, acheminer un appel vocal entrant, ou les deux. en parlant, à la place ou en plus de, en appuyant sur les touches de leur téléphone. CXone offre ASR en option à l'aide du moteur Nuance ASR (version 11), leader de l'industrie, qui améliore la précision de la reconnaissance vocale de votre système et vous permet également d'enregistrer en stéréo.

L’ASR est censé simplifier et accélérer vos expériences d’appelant avec votre SVI. Un SVI activé pour ASR devrait reconnaître non seulement des mots mais également des phrases, et les valeurs que vous avez prédéfinies, et acheminer des appels ou y répondre en conséquence.

Terminologie

Vous devriez familiariser avec l’utilisation spécifique d’ASR de la manière suivante :

  • Énonciation - Mots ou phrases prononcés par un appelant en réponse aux invites IVR.
  • Fichier de grammaire - Fournit des règles pour le moteur ASR. Il couvre les mots ou expressions que les appelants doivent dire en réponse à une invite, puis attribue un contenu à des variables en fonction de ces réponses. Cela rend le processus de reconnaissance beaucoup plus efficace et donne des taux de précision beaucoup plus élevés. De nombreuses actions StudioASR disposent de fichiers de grammaire intégrés. Vous pouvez également utiliser des fichiers de grammaire, ou des grammaires, pour certaines actions. Ceux-ci sont généralement écrits en XML et enregistrés en tant que fichiers .grxml. Ils doivent être compilés avant d'être utilisés dans votre CXone système.
  • Liste de phrases - Fournit une liste simple de phrases que les appelants sont supposés de dire en réponse à une invite, une par ligne. Les listes de mots sont généralement saisies en faisant appel à la propriété d'une PhraseList d'une action Studio .
  • Pourcentage de confiance - Également connu sous le nom de pourcentage de reconnaissance. Lorsque le moteur de ASR reconnaît une phrase prononcée par un appelant, celui-ci renvoie également un pourcentage qui indique à quel point il a confiance en l’interprétation, ou qu’il correspond à l'énoncé de la liste de phrases ou de fichiers de grammaire. Le pourcentage de confiance peut être utilisé pour acheminer les appels vers des tronçons différents dans votre script SVI activé pour ASR. Niveaux de confiance utilisés dans le CXone sont:
    • Élevés — Le pourcentage de confiance est élevé; généralement 75 % ou plus. Le contact peut être acheminé par le tronçon OnHighConfidence sans nécessiter aucune autre confirmation de l'énonciation vocale.
    • Moyens — Le pourcentage de confiance est de niveau moyen; c'est-à-dire, quelque part entre élevé et bas. Le contact peut être acheminé par le tronçon OnMedConfidence et requis de confirmer l'énonciation vocale.
    • Minimums — Le pourcentage de confiance se situe au niveau minimum acceptable. Cette valeur est généralement utilisée pour définir un nombre inférieur pour le tronçon OnMedConfidence .
    • Aucune confiance — L'énonciation vocale était méconnaissable et le moteur dASR n’a pas été en mesure de l’interpréter. Le contact peut être acheminé par le tronçon OnNoConfidence et requis de répéter l'énonciation vocale.

Action de l’ASR

Pour la production des scripts SVI, Studio propose sept actions ASR conçues pour des types d'invites spécifiques, ainsi que deux autres actions générales. Toutes ces actions vous permettent de capturer et d’interpréter une énonciation vocale, alimenter une variable en fonction de l'énonciation vocale, et d’acheminer le contact basé sur la valeur de la variable, le pourcentage de confiance, ou les deux. Le choix de la meilleure action pour chaque invite aidera vos scripts à traiter efficacement la parole. Pour afficher les actions ASR dans Studio, ASR doit être activé dans votre profil de sécurité. Voici une liste de chaque action ASR:

  • Asr - Accepte tout type d'énoncé et l'interprète en fonction d'une liste de phrases ou d'un fichier de grammaire personnalisé que vous fournissez. Cette action fournit un niveau de flexibilité élevé, mais est également plus compliqué à mettre en place.
  • Asralphanum - Accepte un énoncé d'une combinaison de lettres, de chiffres ou les deux (par exemple, un mot de passe ou une adresse e-mail). Cette action est exécutée avec un fichier de grammaire.
  • Asrcurrency - Accepte un énoncé d'une valeur monétaire (par exemple, un montant de paiement). Cette action est exécutée avec un fichier de grammaire pour une ou plusieurs devises, basé sur le paquet pour le copropriétaire de votre .
  • Asrdate - Accepte une variété d'énoncés liés aux dates, basés sur son fichier de grammaire intégré. Ceci inclut les dates complètes, les jours de la semaine, les références de dates relatives (comme hier), et plus encore.
  • Asrdigits - Accepte un énoncé d'une chaîne de chiffres (par exemple, un numéro de téléphone ou un numéro de sécurité sociale). Cette action est exécutée avec un fichier de grammaire.
  • Asrmenu - Accepte les énoncés que vous définissez pour créer un menu à reconnaissance vocale. Cette action peut utiliser une liste de phrases ou un fichier grammaire, ou vous pouvez utiliser les variables de tronçons que vous créez pour le menu lui-même en tant que base pour l'interprétation des énonciations vocales de l'appelant.
  • Numéro de référence - Accepte l'énoncé de valeurs numériques. Par exemple, un énoncé de «cinq six» serait interprété par cette action comme «cinquante-six», alors que Asrdigits interpréterait le même énoncé comme 2 chiffres séparés, «cinq» et «six». Cette action est exécutée avec un fichier de grammaire.
  • Asrtime - Accepte une variété d'énoncés liés au temps, basés sur son fichier de grammaire intégré. Ceci inclut les durées (telles que douze heures ») en plus d’heures spécifiques (telles que « quinze heures » de l’après-midi).
  • Asryesno - Accepte les énoncés positifs ou négatifs basés sur son fichier de grammaire intégré. Par exemple, il existe de multiples variations sur la manière dont un appelant peut dire « oui » (oui, ouais, OK, d'accord et ainsi de suite). Cette action reconnaît de telles variations.

Studio offre également deux actions qui peuvent être utilisées pour vous constituer une grammaire personnalisée à partir d'une base de données existante. Par exemple, votre système SVI peut demander un numéro de pièce à un appelant. Ou vous pourriez vouloir permettre à l'appelant de sélectionner une extension en donnant le nom d'un employé. Dans les deux cas, vous disposez probablement déjà d'une base de données contenant les valeurs possibles qu’un appelant peut prononcer, et il est utile de constituer votre fichier en utilisant les données dons vous disposez déjà. Les deux actions utilisées à cet effet sont :

  • Asrcompile - Utilisé pour compiler des fichiers de grammaire personnalisés au format .gram utilisé par le moteur Nuance ASR. Cette action est utilisée dans les scripts qui sont exécutés une seule fois ou, au plus, sur une base occasionnelle. Le script peut être utilisé pour traiter des fichiers .grxml existants ou en combinaison avec Asrsql pour créer un nouveau fichier de grammaire personnalisé.
  • Asrsql - Fonctionne avec la fonctionnalité Connecteur DB pour extraire un fichier de valeurs d'une base de données existante. Ce fichier peut ensuite être formaté et compilé vers un fichier de grammaire pour votre SVI activé pour ASR.

Meilleures pratiques

Étant donné que vous développez des scripts SVI activés pour ASR, gardez les éléments suivants à l'esprit :

  • Familiarisez-vous avec les actions de l’ASR pour vous permettre de choisir l'action appropriée pour chaque invite.
  • Plusieurs actions offrent un choix entre l’entrée verbale et DTMFFermé Tonalités de signalisation générées lorsqu'un utilisateur appuie ou appuie sur une touche du clavier de son téléphone. . Dans certains cas, DTMF peut effectivement fournir à l'appelant une meilleure expérience. Par exemple, la saisie d'un numéro de sécurité sociale est tout aussi facile que le fait de la prononcer oralement, et peut être plus facile à interpréter pour le système.
  • Les langues disponibles pour la reconnaissance vocale varient selon l'endroit où l'unité commerciale est logée, mais peut être réglée à l'aide de l'action VoiceparamsStudio. Renseignez-vous auprès de votre responsable de compte.
  • Vous pouvez également utiliser des orthographes phonétiques dans vos listes de phrases ou vos fichiers de grammaire pour augmenter la précision. Cela peut être particulièrement utile si l'invite peut susciter des réponses souvent mal prononcées. Un exemple pourrait être "fungi" (pluriel de champignon). Vous pouvez ajouter les entrées phonétiques supplémentaires suivantes en plus de l'entrée "fungi": "fun guy", "fun gee", "fun jee". La langue et la prononciation ne sont pas complètement standard d'un point de vue interculturel, par conséquent, l'ajout d'entrées supplémentaires avec une orthographe phonétique pourrait améliorer la précision. Cela met en évidence l'importance de comprendre vos appelants et de régler ou de peaufiner votre RVI.
  • Vous pouvez affiner les paramètres ASR pour chaque script (ou même avant / après des actions ASR individuelles) en définition d'une variable nuanceTuningParamsJson avec une action Fragment.
  • Les scripts devront inclure l’acheminement au cas où il y aurait une défaillance au sein de la fonctionnalité ASR, telle que le fait de revenir vers un mode DTMF seul ou de voir s’afficher un message d'échec avant de mettre fin à l'interaction.
  • Vous pouvez engager des Services professionnels afin de vous aider à développer des scripts SVI activés pour ASR et leurs composants, tels que les fichiers de grammaire personnalisés développés à partir de votre base de données existante. Contactez votre gestionnaire de compte pour en apprendre davantage.

Localisation et ASR

Si votre organisation prévoit d'utiliser ASR pour prendre en charge plusieurs langues, gardez à l'esprit les points suivants :

  • Tout au long de l'analyse, "l'anglais" est codé en dur.

  • Lors de l'analyse de l'argent, seul "$" est pris en charge.

  • En analysant l'argent, '.' est toujours utilisé pour vérifier les valeurs fractionnaires. ',' n'est pas pris en charge.

  • En prononçant l'argent, «dollars» et «cents» sont codés en dur.

  • En prononçant des nombres, «négatif» est codé en dur.

  • Lors de la prononciation des nombres, le "point" est codé en dur.

  • Chaîne de lecture n'est pas localisée (il lit les mots anglais).

Langues prises en charge pour ASR et TTS
Région des États-Unis (PCI, Non-PCI et FedRAMP)
  • Portugais Brésilien
  • Français canadien
  • Anglais: EUA
  • Anglais: ROYAUME-UNI
  • Français
  • Allemand
  • italien
  • Espagnol: Européen
  • Espagnol: EUA
Europe (y compris l'Afrique du Sud)
  • Néerlandais: NE et BE
  • Anglais: ROYAUME-UNI
  • Anglais: EUA
  • Français
  • Allemand
  • italien
  • Portugais
  • Espagnol: Européen
  • Espagnol: EUA
Royaume-Uni (Royaume-Uni)
  • Néerlandais: NE et BE
  • Anglais: ROYAUME-UNI
  • Anglais: EUA
  • Français
  • Allemand
  • italien
  • Portugais
  • Espagnol: Européen
  • Espagnol: EUA
Australie
  • Anglais: AUS
  • Anglais: ROYAUME-UNI
  • Anglais: EUA
  • Français
  • Allemand
  • italien
  • Espagnol: Européen
  • Espagnol: EUA