自動音声認識(ASR)

自動音声認識(ASR)を使用すると、連絡先は、電話のキーを押す代わりに、またはそれに加えて話すことにより、IVR閉じた 発信者が音声コマンド、キー入力、またはその両方を介して対話し、情報を取得したり、着信音声通話をルーティングしたり、あるいはその両方を行うことができる自動電話メニュー。プロンプトに応答できます。CXoneは、業界をリードするNuance ASRエンジン(バージョン11)を使用するオプション機能としてASRを提供します。これにより、システムの音声認識の精度が向上し、ステレオを録音することもできます。

ASRは、IVRでの発信者のエクスペリエンスを簡素化および高速化することを目的としています。ASR対応のIVRは、単語だけでなくフレーズも認識し、それらを事前に定義した値と照合し、それに応じて通話をルーティングまたは応答する必要があります。

用語

次の用語のASR固有の使用法に精通している必要があります。

  • 発話 — IVRプロンプトに応答して発信者が話す単語またはフレーズ。
  • 文法ファイル—ASRエンジンのルールを提供します。プロンプトに応答して発信者が言うことが期待できる単語やフレーズをカバーし、それらの応答に基づいて変数にコンテンツを割り当てます。これにより、認識プロセスがはるかに効率的になり、精度が大幅に向上します。多くのASR Studioアクションには、組み込みの文法ファイルがあります。一部のアクションでは、カスタムの文法ファイルまたは文法を使用することもできます。これらは通常、XMLで記述され、.grxmlファイルとして保存されます。CXoneシステムで使用する前にコンパイルする必要があります。
  • フレーズリスト — 1行に1つずつ、プロンプトに応答して発信者が言うと予想できる簡単なフレーズのリストを提供します。フレーズリストは通常、StudioアクションのPhraseListプロパティを使用して入力されます。
  • 信頼度 —認識率とも呼ばれます。ASRエンジンは、発信者が話したフレーズを認識すると、解釈にどの程度自信があるか、または発話とフレーズリストまたは文法ファイルとの一致を示すパーセンテージも返します。信頼度のパーセンテージは、ASR対応のIVRスクリプトのさまざまなブランチにコールをルーティングするために使用できます。CXoneで使用される信頼水準は:
    • —信頼度が高い。通常、75%以上。連絡先は、発話をさらに確認することなく、OnHighConfidenceブランチを介してルーティングできます。
    • —信頼度は中程度です。つまり、高値と最小値の間のどこかです。連絡先をOnMedConfidenceブランチにルーティングし、発話の確認を求めることができます。
    • 最小—信頼度は最小許容レベルです。この値は通常、OnMedConfidenceブランチの最下位の数値を設定するために使用されます。
    • 信頼度なし—発話は認識できず、ASRエンジンはそれを解釈できません。連絡先はOnNoConfidenceブランチを経由してルーティングされ、発話を繰り返すように求められます。

ASRアクション

本番IVRスクリプトの場合、Studioは、特定のタイプのプロンプト用に設計された7つのASRアクションと、さらに2つの一般的なアクションを提供します。これらのすべてのアクションにより、発話をキャプチャして解釈し、発話に基づいて変数を入力し、変数値、信頼度、またはその両方に基づいて連絡先をルーティングできます。各プロンプトに最適なアクションを選択すると、スクリプトが音声を効率的に処理するのに役立ちます。StudioでASRアクションを表示するには、セキュリティプロファイルのでASRを有効にする必要があります。以下は、各ASRアクションのリストです。

  • Asr—あらゆる種類の発話を受け入れ、提供したカスタムフレーズリストまたは文法ファイルに基づいてそれを解釈します。このアクションはかなりの柔軟性を提供しますが、セットアップがさらに複雑です。
  • Asralphanum—文字、数字、またはその両方の組み合わせの発話(たとえば、パスワードやEメールアドレス)を受け入れます。このアクションには、組み込みの文法ファイルが付属しています。
  • Asrcurrency—金額の発話(たとえば、支払い金額)を受け入れます。このアクションには、事業単位の言語パックに基づいて、1つ以上の通貨用の組み込みの文法ファイルが付属しています。
  • Asrdate—組み込みの文法ファイルに基づいて、日付に関連するさまざまな発話を受け入れます。これには、完全な日付、曜日、相対的な日付参照(昨日など)などが含まれます。
  • Asrdigits—数字列の発話(電話番号や社会保障番号など)を受け入れます。このアクションには、組み込みの文法ファイルが付属しています。
  • Asrmenu—音声対応メニューを作成するために定義した発話を受け入れます。このアクションでは、カスタムフレーズリストまたは文法ファイルを使用できます。または、発信者の発話を解釈するための基礎として、メニュー自体に作成したブランチ変数を使用できます。
  • Asrnumber—数値の発声を受け入れます。たとえば、「five six」の発話はこのアクションによって「fifty-six」と解釈されますが、Asrdigitsは同じ発話を「five」と「six」の2つの別々の数字として解釈します。このアクションには、組み込みの文法ファイルが付属しています。
  • Asrtime—組み込みの文法ファイルに基づいて、時間に関連するさまざまな発話を受け入れます。これには、特定の時間(「午後3時」など)に加えて、期間(「12時間」など)が含まれます。
  • Asryesno—組み込みの文法ファイルに基づいて肯定的または否定的な発話を受け入れます。たとえば、発信者が「はい」と言う方法には複数のバリエーションがあります(はい、はい、うん、うん、うん、大丈夫など)。このアクションは、そのようなバリエーションを認識します。

Studioには、既存のデータベースからカスタム文法ファイルを作成するために使用できる2つのアクションも用意されています。たとえば、IVRが発信者にパーツ番号を要求する場合があります。または、従業員の名前を指定して、発信者に内線番号を選択させることもできます。どちらの場合も、発信者が発声する可能性のある値を含むデータベースがすでに存在している可能性が高いため、既存のデータを使用してファイルを構築することは理にかなっています。この目的で使用される2つのアクションは次のとおりです:

  • Asrcompile—カスタム文法ファイルをNuance ASRエンジンで使用される.gram形式にコンパイルするために使用されます。このアクションは、1回または多くても時々実行されるスクリプトで使用されます。このスクリプトを使用して、既存の.grxmlファイルを処理するか、またはAsrsqlと組み合わせて新しいカスタム文法ファイルを作成できます。
  • AsrsqlDBコネクター機能と連携して、既存のデータベースから値のファイルをプルします。次に、このファイルをフォーマットして、ASR対応IVRの文法ファイルにコンパイルできます。

ベストプラクティス

ASR対応のIVRスクリプトを開発するときは、次の点に注意してください。

  • 各プロンプトに対して適切なアクションを選択できるように、ASRアクションをよく理解してください。
  • いくつかのアクションでは、音声入力とDTMF閉じた ユーザーが電話のキーパッドのキーを押すかタップしたときに生成される信号音。入力のどちらかを選択できます。場合によっては、DTMFが実際により優れた発信者エクスペリエンスを提供することがあります。たとえば、社会保障番号をキー入力することは、それを話すのと同じくらい簡単であり、システムが解釈しやすくなる場合があります。
  • 音声認識に使用できる言語は、事業単位の場所によって異なりますが、Voiceparams Studioアクションを使用して設定できます。詳細については、アカウントマネージャーにお問い合わせください。
  • フレーズリストや文法ファイルで音声スペルを使用して、精度を高めることもできます。これは、プロンプトがしばしば発音間違いの多い応答を引き出す場合に特に役立ちます。例としては、「菌類」(複数の菌類)があります。「fungi」エントリに加えて、「fun guy」、「fun gee」、「fun jee」という音声エントリを追加できます。言語と発音は異文化間で完全に標準ではないため、音声スペルを使用してエントリを追加すると、精度が向上する可能性があります。これは、発信者を理解し、IVRを調整または微調整することの重要性を強調しています。
  • SnippetスニペットアクションでnuanceTuningParamsJson変数を設定することで、各スクリプト(または個々のASRアクションの前後でも)のASR設定を微調整できます。
  • 対話を終了する前に、DTMFのみのモードに戻る、またはエラーメッセージを再生するなど、ASR機能に障害が発生した場合に備えて、スクリプトにルーティングを含める必要があります。
  • プロフェッショナルサービスを利用して、ASR対応のIVRスクリプトとそのコンポーネント(既存のデータベースから構築されたカスタム文法ファイルなど)の開発を支援できます。詳細については、アカウントマネージャーにお問い合わせください。

ローカリゼーションとASR

組織がASRを使用して複数の言語をサポートすることを計画している場合は、次の点に注意してください。

  • 解析全体を通して、「英語」はハードコーディングされています。

  • お金の解析では、「$」のみがサポートされます。

  • お金を解析する際に、「。」小数値をチェックするために常に使用されます。'、'はサポートされていません。

  • お金の発音では、「ドル」と「セント」がハードコーディングされています。

  • 数字の発音では、「負」はハードコーディングされています。

  • 数字の発音では、「ポイント」はハードコーディングされています。

  • ReadStringはローカライズされていません(英語の単語を読み取ります)。

ASRおよびTTSでサポートされている言語
米国地域(PCI、非PCI、およびFedRAMP)
  • ブラジルポルトガル語
  • カナダのフランス語
  • 英語: US
  • 英語: UK
  • フランス語
  • ドイツ人
  • イタリア語
  • スペイン語 : ヨーロッパ
  • スペイン語: US
カナダ
  • カナダのフランス語
  • 英語: US
  • 英語: UK
  • フランス語
  • ドイツ人
  • イタリア語
  • スペイン語 : ヨーロッパ
  • スペイン語: US
ヨーロッパ(南アフリカを含む)
  • Arabic
  • オランダの: NEとBE
  • 英語: UK
  • 英語: US
  • フランス語
  • ドイツ人
  • イタリア語
  • ブラジルポルトガル語
  • スペイン語 : ヨーロッパ
  • スペイン語: US
英国(UK)
  • オランダの: NEとBE
  • 英語: UK
  • 英語: US
  • フランス語
  • ドイツ人
  • イタリア語
  • ブラジルポルトガル語
  • スペイン語 : ヨーロッパ
  • スペイン語: US
オーストラリア
  • 英語: AUS
  • 英語: UK
  • 英語: US
  • フランス語
  • ドイツ人
  • イタリア語
  • スペイン語 : ヨーロッパ
  • スペイン語: US
日本
  • 英語: US
  • 日本人
  • 韓国語
  • 中国語(簡体字