自动语音识别 (ASR)

自动语音识别 (ASR) 允许联系人通过说话替代或结合按下电话上的按键来回应 IVRClosed 自动电话菜单,允许呼叫者通过语音命令、按键输入或两者进行交互,以获得信息、路由呼入的语音呼叫或两者。 提示。CXone 提供的 ASR 是一项可选功能,使用业界领先的 Nuance ASR 引擎(版本 11),增强了系统语音识别的准确性,还可让您录制立体声。

ASR 旨在简化和加速呼叫者使用 IVR 的体验。支持 ASR 的 IVR 不仅应识别词语,还应识别短语,将它们与预定义的值匹配,并相应地路由或应答呼叫。

术语

您应熟悉以下术语的 ASR 特定用法:

  • 话语 — 呼叫者在回应 IVR 提示时说出的词语或短语。
  • 语法文件 — 为 ASR 引擎提供规则。它将涵盖呼叫者在回应提示时可能会说出的词语或短语,然后根据这些回应将内容分配给变量。这使识别过程变得更加高效,并带来更高的准确率。许多 ASR Studio 操作都具有内置的语法文件。您还可以将自定义语法文件或语法用于某些操作。它们通常以 XML 形式编写并保存为 .grxml 文件。当您在 CXone 系统中使用这些文件之前,应对它们进行编译。
  • 短语列表 — 提供一个包含了预计呼叫者在回应提示时可能说出的短语的简单列表(每行一个短语)。短语列表通常使用 Studio 操作的 PhraseList 属性来输入。
  • 置信百分比 — 也称为识别百分比。当 ASR 引擎识别出呼叫者说出的短语时,它还会返回一个百分比,该百分比指示它在解读或将话语与短语列表或语法文件匹配时的自信程度。置信百分比可以用于将呼叫路由到支持 ASR 的 IVR 脚本中的不同分支。CXone 中使用的置信水平为:
    • High — Confidence percentage is high; typically, 75% or greater. 联系人可以通过 OnHighConfidence 分支进行路由,而不必进一步确认话语。
    • Medium — Confidence percentage is mid-range; that is, somewhere between high and minimum. 联系人可以通过 OnMedConfidence 分支进行路由,且需要确认话语。
    • Minimum — Confidence percentage is at the minimum acceptable level. 此值通常用于为 OnMedConfidence 分支设置下限数值。
    • No Confidence — The utterance was unrecognizable and the ASR engine cannot interpret it. The contact can be routed through the OnNoConfidence branch and asked to repeat the utterance.

ASR 操作

对于生产性 IVR 脚本,Studio 提供了为特定类型提示而设计的七种 ASR 操作,以及两种更通用的操作。所有这些操作都允许您捕获和解读话语,根据话语填充变量,并根据变量值、置信百分比或两者来路由联系。为每条提示选择最合理的操作将有助于脚本有效地处理语音。要查看 Studio 中的 ASR 操作,您必须在安全配置文件中启用 ASR。以下是包含了每种 ASR 操作的列表:

  • Asr — 接受任何类型的话语,并根据您提供的自定义短语列表或语法文件对话语进行解读。此操作可提供很大的灵活性,但设置起来也更复杂。
  • Asralphanum — 接受表现为字母、数字或两者组合(例如,密码或电子邮件地址)的话语。此操作自带内置的语法文件。
  • Asrcurrency — 接受表现为货币价值(例如,付款金额)的话语。此操作自带适用于一种或多种货币的内置语法文件,并基于业务单位的语言包。
  • Asrdate — 根据其内置的语法文件接受与日期相关的各种话语。这包括完整日期、星期几、相对日期参照(例如昨天)等等。
  • Asrdigits — 接受表现为一串数字的话语(例如,电话号码或社会保障号码)。此操作自带内置的语法文件。
  • Asrmenu — 接受您定义的用于创建启用语音菜单的话语。此操作可以使用自定义短语列表或语法文件,或者您也可以使用您为菜单本身创建的分支变量作为解释呼叫者话语的依据。
  • Asrnumber — 接受表现为数值的话语。例如,此操作会将话语“五六”解读为“五十六”,而 Asrdigits 会将该话语解读为 2 个单独的数字,即“五”和“六”。此操作自带内置的语法文件。
  • Asrtime — 根据其内置的语法文件接受与时间相关的各种话语。除了特定时间(例如“下午三点”)之外,此操作还涵盖持续时间(例如“十二小时”)。
  • Asryesno — 根据其内置语法文件接受肯定性或否定性话语。例如,呼叫者可能会说“是”的方式有多种变体(“是”、“对”、“是的”、“没错”、“好”等等)。此操作可识别此类变体。

Studio 还提供了两种可以用于从现有数据库构建自定义语法文件的操作。例如,您的 IVR 可能会要求呼叫者提供部件号。或者,您可能希望通过提供员工姓名来让呼叫者选择分机。不论是在哪一种情况下,您都可能已经拥有一个包含了呼叫者可能说出的可能值的数据库,它将使利用已有的数据来生成文件变得切实可行。以下两种操作用于此目的:

  • Asrcompile — 用于将自定义语法文件编译为 Nuance ASR 引擎使用的 .gram 格式。此操作用于运行一次或最多只是偶尔运行的脚本。脚本可以用于处理现有的 .grxml 文件,或与 Asrsql 结合使用以创建新的自定义语法文件。
  • Asrsql — 与数据库连接器功能结合使用,以从现有数据库中提取值文件。该文件随后可以被格式化并编译为语法文件,以供支持 ASR 的 IVR 使用。

最佳做法

当您开发支持 ASR 的 IVR 脚本时,请牢记以下几点:

  • 熟悉 ASR 操作,以便您可以为每条提示选择正确的操作。
  • 多种操作允许您在语音输入与 DTMFClosed 当用户在电话按键上按下或敲击某个键时产生的信号音。 输入之间作出选择。在某些情况下,DTMF 实际上可能会提供更佳的呼叫者体验。例如,键入社会保障号码就像说出它一样容易,而且对系统而言可能更容易解读。
  • 虽然可用于语音识别的语言因业务单位所在的位置而异,但可以使用 Voiceparams Studio 操作来设置。有关更多信息,请询问客户经理。
  • 您还可以在短语列表或语法文件中使用拼音来提高准确性。如果提示可能会引起经常发音错误的回应,此方法将格外有用。可以举“fungi”(“fungus”的复数形式)为例。除了条目“fungi”之外,您还可以添加以下其他语音条目:“fun guy”、“fun gee”、“fun jee”。语言和发音在不同文化之间并未完全规范化,因此添加带有拼音的额外条目可以提高准确性。这彰显了解呼叫者和调节或调整 IVR 的重要性。
  • 您可以通过使用 Snippet 操作设置 nuanceTuningParamsJson 变量,为每个脚本(乃至在各个 ASR 操作之前/之后)微调 ASR 设置。
  • 脚本应包括路由,以防 ASR 功能出现故障,例如还原至仅 DTMF 模式或在终止交互之前播放故障消息。
  • 您可以聘请专业服务来帮助您开发支持 ASR 的 IVR 脚本及其组件,例如根据现有数据库构建的自定义语法文件。请联系您的客户经理以了解更多信息。

本地化和 ASR

如果您的组织计划使用 ASR 来支持多种语言,请牢记以下几点:

  • 在整个解析过程中,“英语”将被硬编码。

  • 在解析货币时,仅支持“$”。

  • 在解析货币时,总是使用“.”来检查小数值。不支持使用“,”(千位分隔符)。

  • 在读出货币时,“美元”和“美分”将被硬编码。

  • 在读出数字时,“负数”将被硬编码。

  • 在读出数字时,“小数点”将被硬编码。

  • ReadString 不会被本地化(它读取英语单词)。

ASR 和 TTS 支持的语言
美国地区(PCI、非 PCI 和 FedRAMP)
  • 巴西葡萄牙语
  • 加拿大法语
  • 英语:美国
  • 英语:英国
  • 法语
  • 德语
  • 意大利语
  • 西班牙语:欧洲
  • 西班牙语:美国
加拿大
  • 加拿大法语
  • 英语:美国
  • 英语:英国
  • 法语
  • 德语
  • 意大利语
  • 西班牙语:欧洲
  • 西班牙语:美国
欧洲(包括南非)
  • 荷兰语:荷兰和比利时
  • 英语:英国
  • 英语:美国
  • 法语
  • 德语
  • 意大利语
  • 葡萄牙语
  • 西班牙语:欧洲
  • 西班牙语:美国
联合王国(英国)
  • 荷兰语:荷兰和比利时
  • 英语:英国
  • 英语:美国
  • 法语
  • 德语
  • 意大利语
  • 葡萄牙语
  • 西班牙语:欧洲
  • 西班牙语:美国
澳大利亚
  • 英语:澳大利亚
  • 英语:英国
  • 英语:美国
  • 法语
  • 德语
  • 意大利语
  • 西班牙语:欧洲
  • 西班牙语:美国
日本
  • 英语:美国
  • 日语
  • 韩语
  • 普通话