ASR-Verwaltung

Dieser Abschnitt enthält Informationen zur Verwaltung Ihres ASR-fähigen IVRGeschlossen Automatisiertes Telefonmenü, das es Anrufern ermöglicht, durch Sprachbefehle, Tasteneingaben oder beides zu interagieren, um Informationen zu erhalten, einen eingehenden Sprachanruf weiterzuleiten oder beides.-Menüsystems in CXone (ASR = Automatic Speech Recognition, automatische Spracherkennung).

Damit Sie ein effizientes ASR-fähiges IVR-System aufbauen können, benötigen Sie ein gutes Verständnis der automatischen Spracherkennung (ASR) und des Nuance-ASR-Moduls. Vollständige Dokumentation zur Nutzung dieses Moduls ist von Nuance erhältlich.

Tuning

Erforderliche Berechtigungen: ASR Tuning-Bericht Anzeigen

Mit dem Tuning können Sie Ihr ASR-System optimieren, indem Sie Daten über die aktuelle Leistung von ASR Studio-Aktionen heranziehen. Dies ist ein wichtiger Teil bei der Entwicklung und Pflege Ihres ASR-Systems.

Der ASR Tuning-Bericht enthält Informationen, die Sie beim Tuning verwenden können. Er enthält Antwortquoten für ASR-Aktionen, die in einem Skript ausgelöst werden, und zeigt Ihnen eine Liste der Äußerungen, die das ASR-System nicht erkennen konnte. Dieser Bericht ist nach Aktionen und jeder Einstellung für die Verzweigungen nach Zuverlässigkeit aufgeschlüsselt.

Wenn Sie das Tuning aktiviert haben, können Sie diese Bereiche erweitern und die aufgezeichneten Audiodateien aus dem jeweiligen Segment anhören. So erhalten Sie Informationen über die Antworten, die das ASR-System nicht verstanden hat. Sie können diese Antworten in Ihre Grammatikdateien und Phrasenlisten aufnehmen.

Das Tuning Ihres ASR-Systems bietet Ihnen die folgenden Möglichkeiten:

  • Sie können den ASR Tuning-Bericht anzeigen und die enthaltenen Daten analysieren.
  • Sie können sich die Aufzeichnungen aus dem ASR Tuning-Bericht anhören, um festzustellen, was die Interaktionen gemeinsam haben.
  • Sie können feststellen, was Ihre Kontakte sagen und wie sie dies ausdrücken.
  • Sie können Ihre Grammatikdateien auf Basis dieser Erkenntnisse aktualisieren.
  • Bei Bedarf können Sie die Werte für die Zuverlässigkeit anpassen.

Aktivieren der Tuning-Funktion

Wenn Ihr IVR-System personenbezogene Daten erfasst, sollten Sie sorgfältig auswählen, welche IVR-Bereiche beim Tuning aufgezeichnet werden. Dadurch vermeiden Sie Bedenken bei der Erfassung persönlicher Daten. Wenn Sie beispielsweise eine Asrdigits-Aktion haben, die eine vertrauliche Ausweisnummer erfasst, können Sie nach dieser Aktion mit dem Tuning beginnen. So vermeiden Sie, dass die Ausweisnummer aufgezeichnet wird.

Deaktivieren Sie das Tuning, wenn Sie das aktive Tuning Ihres IVR-Systems abgeschlossen haben. Wenn Sie die Tuningfunktion eingeschaltet lassen, wird der Server immens aufgebläht und belastet, da bei jeder Interaktion eine neue Audiodatei erstellt wird.

  1. Öffnen Sie Ihr ASR-Skript in Studio und fügen Sie eine Voiceparams-Aktion hinzu. Sie sollte sich vor den ASR-Aktionen befinden, die Sie beim Tuning verwenden möchten.
  2. Wenn diese Aktion in Ihrem Skript nur den Zweck hat, das Tuning ein- und auszuschalten, ändern Sie den Wert für Caption entsprechend. Zum Beispiel Tuning On and Off. Wenn Sie die Aktion auch verwenden, um für Ihr IVR-System die Sprache zu ändern, ist möglicherweise eine andere Beschriftung erforderlich.
  3. Stellen Sie in der Voiceparams-Aktion die Eigenschaft ASRTuningEnabled auf True ein.
  4. Wenn Sie das Tuning abgeschlossen haben, stellen Sie die Eigenschaft ASRTuningEnabled auf False ein.

Tuning-Parameter

Sie können Ihren Nuance ASR-Aktionen skriptspezifische Tuning-Parameter zuweisen. Dazu legen Sie ein dynamisches Datenobjekt in einer Snippet-Aktion fest. Rufen Sie das Objekt nuanceTuningParamsJson auf. Sein Wert muss ein gültiger JSON-String sein, der die Nuance-Parameter enthält, die aus ihren Standardeinstellungen definiert werden sollen. Beispielsweise:

DYNAMIC asrParams
ASSIGN asrParams.sensitivity = "87"
ASSIGN asrParams.Speech_Complete_Timeout = "1000",
ASSIGN asrParams.Speech_Incomplete_Timeout = "1000"
ASSIGN asrParams.No_Input_Timeout = "1000"
ASSIGN global:nuanceTuningParamsJson = "{asrParams.asjson()}" 		

Wenn Parameter auf ungültige Werte eingestellt sind, wird der ungültige Wert durch den Standardwert für diesen Parameter ersetzt und eine Variable namens invalidParamsList wird zurückgegeben, in der die geänderten Werte aufgelistet sind.

In den folgenden Tabellen werden die Tuning-Parameter aufgelistet, die in Studio unterstützt werden:

Nuance-Parameter Beschreibung Studio Unterstützung
Speech_Complete_Timeout Wie lange muss ich warten, bis ich zu dem Schluss komme, dass ein Anrufer mit dem Sprechen fertig ist?

Unterstützt mithilfe von nuanceTuningParamsJson.

Standard: "Speech-Complete-Timeout" : "0"

Speech_Incomplete_Timeout Dauer der Stille, um festzustellen, ob die Anrufer das Sprechen beendet haben.

Unterstützt mithilfe von nuanceTuningParamsJson.

Standard: "Speech-Incomplete-Timeout": "1500"

No_Input_Timeout

Wie lange muss auf eine Rede gewartet werden, nachdem eine Eingabeaufforderung beendet wurde?

Hinweis: Dieser Parameter beginnt mit der Zählung, wenn die Wiedergabe der Aufforderung beginnt. Dies kann dazu führen, dass das Skript die Zeitüberschreitung zu früh erreicht. Die Eigenschaft TimeoutSeconds der ASR-Aktion beginnt mit der Zählung, wenn die Aufforderung endet.

Unterstützt mithilfe von nuanceTuningParamsJson.

Standard: "No-Input-Timeout": "7000"

sensitivity Empfindlichkeit des Sprachdetektors bei der Suche nach Sprache. Standard: 50 (Skala von 0–100)

Die folgenden Nuance-Parameter werden nicht in CXone unterstützt, da die Studio Asr-Aktion Aufforderungen anstelle von Nuance-Elementen wiedergibt.

Nuance-Parameter Beschreibung Standardwert
swiep_suppress_barge_in_time Deaktiviert das Barge-In zu Beginn einer Eingabeaufforderung kurz. 0 (keine Verzögerung)
swiep_in_prompt_sensitivity_percent Steuert, wie laut Anrufer sprechen müssen, um Eingabeaufforderungen zu unterbrechen (Barge-In) und Sprache zu erkennen. 50 (Prozent)
swirec_barge_in_mode Legt spezielle Erkennungsmodi im Erkenner fest. normal

Grammatikdateien

In Grammatikdateien können Sie viele verschiedene Äußerungen auflisten, die ein Kontakt als Antwort auf eine Aufforderung sprechen könnte. Das Nuance-ASR-Modul versucht, die Antwort des Kontakts einem Eintrag in der Grammatikdatei zuzuordnen. Da das ASR-Modul eine Übereinstimmung für die ganze Äußerung finden muss, bieten Grammatikdateien Nuance eine abgestimmte Liste mit Äußerungen zur Auswahl.

Eine Grammatikdatei ist eine der effektivsten Methoden, um die Genauigkeit Ihres ASR-fähigen IVR-Systems zu verbessern. Da ASR tatsächliche menschliche Interaktionen analysiert, gibt es zahllose Optionen, die das System erkennen muss. Daher ist ein ASR-System wesentlich komplexer als ein System, das lediglich auf DTMFGeschlossen Signaltöne, die erzeugt werden, wenn ein Benutzer eine Taste auf seiner Telefontastatur drückt oder antippt.-Töne reagieren muss. DTMF erkennt 12 Töne, folglich muss das IVR-System in der Lage sein, 12 Optionen zu erkennen. Von einem Menschen gesprochene Sprache enthält dagegen deutlich mehr Optionen und eine Kombination aus Lauten, Wörtern und Phrasen, die das ASR-System erkennen muss.

Auf die Aufforderung zur Angabe der Mitgliedsnummer kann ein Kontakt beispielsweise mit diesem Satz antworten: "Meine Mitgliedsnummer ist 123456789". Ein ASR-fähiges Skript erkennt die ganze Phrase, aber andere Skripte würden fehlschlagen, wenn der Satz mit "Meine Mitgliedsnummer ist..." beginnt anstatt nur mit der Nummer.

Höhere Genauigkeit

Grammatikdateien verbessern die Genauigkeit von ASR-Systemen. Sie können einer Grammatikdatei Wörter und Phrasen hinzufügen, die Kontakte wahrscheinlich zusätzlich zu den erwarteten Informationen sagen werden. Angenommen, der Kontakt wird nach seiner Mitgliedsnummer gefragt. In diesem Fall können Sie der Grammatikdatei beispielsweise die folgenden Phrasen hinzufügen: "meine Mitgliedsnummer ist", "ich glaube sie lautet" oder "Moment, ich muss meine Karte suchen".

Die abgestimmte Liste in einer Grammatikdatei begrenzt die Anzahl der möglichen Äußerungen. Je länger die erwartete Antwort ist, desto mehr Antworten sind möglich. Mit Grammatikdateien können Sie die Menge der möglichen Antworten eingrenzen, indem Sie nur die einschließen, die am üblichsten sind.

Sie müssen nicht alle Antworten hinzufügen, die theoretisch möglich sind. Mithilfe des Tuning-Verfahrens können Sie feststellen, wie Kontakte wirklich sprechen. Die Erkenntnisse, die Sie beim Tuning gewinnen, können Sie in Ihre Grammatikdateien einfließen lassen. Die Erstellung von Grammatikdateien ist ein iterativer Prozess, der erfolgt, während Kontakte das System verwenden, da Sie dabei die Stellen identifizieren können, an denen das ASR-System die Antworten nicht versteht.

Unterschiede bei der Aussprache

Achten Sie beim Tuning Ihres ASR-Systems auf Unterschiede bei der Aussprache. Es empfiehlt sich, Ihren Phrasenlisten und Grammatikdateien mehrere Einträge mit unterschiedlichen phonetischen Schreibweisen hinzuzufügen.

Dies kann besonders dann hilfreich sein, wenn die Aufforderung zu Antworten führt, die häufig falsch ausgesprochen werden oder bei denen unterschiedliche Aussprachen möglich sind. Ein Beispiel ist "Fungi" (Plural von Fungus). Sie können zusätzlich zum Eintrag "fungi" die folgenden zusätzlichen phonetischen Einträge hinzufügen: "fun guy", "fun gee", "fun jee".

Unterstützung für mehrere Sprachen

ASR unterstützt mehrere Sprachen. Die Grammatik ist sprachspezifisch. Geben Sie den Namen der Sprache in der Kopfzeile der Datei an, damit das Modul gezielt nach Äußerungen in der angegebenen Sprache sucht.

In jeder Grammatikdatei müssen die Einträge dasselbe Alphabet, dieselbe Satzstruktur usw. wie die angegebene Sprache verwenden. Wenn Sie beispielsweise das Wort "piñata" für eine spanische Grammatik verwenden möchten, muss Ihr Eintrag die Tilde (~) über dem Buchstaben "n" enthalten, damit der Eintrag "piñata" und nicht "pinata" ist.

ASR im Gegensatz zur Verarbeitung natürlicher Sprache

Das ASR-System und Grammatikdateien können zu einem Ergebnis führen, das der Verarbeitung natürlicher Sprache (NLP, Natural Language ProcessingGeschlossen Status, der es einem Agenten ermöglicht, nach dem Ende einer Interaktion erforderliche Aufgaben abzuschließen) ähnelt, die Systeme sind aber nicht gleich. ASR lässt sich mit einer Brücke zwischen DTMF und NLP vergleichen. Es ist nicht dafür vorgesehen, alles Gesagte zu erfassen, kann aber die meisten Aussagen erfassen. Deshalb sind Grammatikdateien so wichtig. Je besser die Grammatikdatei aufgebaut ist, desto mehr Antworten kann das ASR-System erkennen.

Wichtige Fakten über Grammatikdateien

  • Grammatikdateien sollten für die meisten ASR Studio-Aktionen verwendet werden.
  • Die Aktionen Asralphanum, Asrcurrency, Asrdate, Asrdigits, Asrnumber, Asrtime und Asryesno verfügen über integrierte Grammatikdateien. Zusätzlich zu den integrierten Grammatikdateien können Sie auch eigene Grammatikdateien erstellen und verwenden.
  • Die Aktionen Asr und Asrmenu haben keine integrierten Grammatikdateien. Für diese Aktionen müssen Sie eigene Grammatikdateien erstellen.
  • Mit den Asrcompile- und Asrsql-Aktionen können Sie benutzerdefinierte Grammatikdateien auf Basis einer vorhandenen Datenbank erstellen.
  • Symbole können nicht für die Äußerung einer Grammatikdatei verwendet werden, sondern können mit dem Wert zurückgegeben werden.
  • Das Erstellen von Grammatikdateien sollte ein iterativer Prozess sein. Bei jedem Tuning Ihres ASR-Systems identifizieren Sie neue Elemente, die in die Grammatikdatei aufgenommen werden sollten.

Beispiel-Grammatikdateien

Es stehen drei Beispiel-Grammatikdateien zur Verfügung, die Sie herunterladen können.

Color_Grammar_Example.grxml (in einer ZIP-Datei)

Digits_Grammar_Example.grxml (in einer ZIP-Datei)

Format_Grammar_Example.grxml (in einer ZIP-Datei)

Diese Beispiele veranschaulichen den "Regelansatz" zum Erstellen der Struktur einer Grammatikdatei. Das Verfahren basiert auf drei Regeln: einem Präfix, der Hauptgrammatik und einem Suffix. Präfixe sind Äußerungen, die Menschen oft sagen, bevor sie den Hauptteil der Informationen angeben, wie "es ist", "ähm" oder "ich glaube es ist". Suffixe sind kleine Ergänzungen am Ende einer Äußerung, wie "glaube ich" oder "vielleicht". Die mittlere Regel ist die eigentliche Grammatik, in der Sie alle möglichen Einträge für die Daten definieren können, die Sie sammeln möchten, z. B. Farben, Zahlen oder Modelle.

ASR-Parameter und -Einstellungen

In diesem Abschnitt finden Sie Informationen über einige wichtige ASR-Parameter und -Einstellungen.

Parameter für die Zuverlässigkeit

Wenn das ASR-Modul eine Phrase erkennt, die von einem Anrufer gesprochen wurde, gibt es einen Prozentsatz zurück, der angibt, wie zuverlässig die Äußerung einem Eintrag in der Phrasenliste oder in der Grammatikdatei zugeordnet werden konnte. Der Prozentwert für die Zuverlässigkeit kann für die Weiterleitung von Anrufen an verschiedene Verzweigungen in Ihrem ASR-kompatiblen IVR-Skript verwendet werden.

In CXone werden die folgenden Stufen für die Zuverlässigkeit verwendet:

  • Hoch: hohe Zuverlässigkeit, meist 75 % oder mehr. Sie legen den Wert für die Zuverlässigkeit mit der Eigenschaft HighConfidence in ASR-Aktionen fest. Der Kontakt kann über die Verzweigung OnHighConfidence ohne weitere Bestätigung der Äußerung weitergeleitet werden.
  • Mittel: mittlere Zuverlässigkeit, liegt zwischen den Werten für "Hoch" und "Minimum". Der Kontakt kann über die Verzweigung OnMedConfidence mit Bestätigung der Äußerung weitergeleitet werden. Diese Kategorie hat keine Eigenschaft. Alle Äußerungen, die zwischen den konfigurierten Stufen "Minimum" und "Hoch" liegen, können dieser Verzweigung folgen.
  • Minimum: der kleinste akzeptable Wert für die Zuverlässigkeit. Sie legen den Wert für die Zuverlässigkeit mit der Eigenschaft MinConfidence in ASR-Aktionen fest. Mit diesem Wert wird die Zahl für den unteren Bereich der OnMedConfidence-Verzweigung festgelegt.
  • Keine Zuverlässigkeit: Die Äußerung wurde nicht erkannt und kann vom ASR-Modul nicht interpretiert werden. Alle Äußerungen, die unter dem Wert von MinConfidence liegen, fallen in diesen Bereich. Der Kontakt kann über die Verzweigung OnNoConfidence mit Aufforderung zur Wiederholung der Äußerung weitergeleitet werden.

Die meisten ASR-Aktionen haben Verzweigungen für verschiedene Zuverlässigkeitsstufen. So können Sie das Benutzererlebnis anpassen und Abweichungen bei der Genauigkeit berücksichtigen. Variablen für die Zuverlässigkeit sind Systemvariablen, die nicht in einer Skriptablaufverfolgung angezeigt werden, es sei denn, Sie aktivieren Systemvariablen für die Ablaufverfolgung.

Die Werte für die Zuverlässigkeit werden durch verschiedene Faktoren beeinflusst, wie Geräusche und Gespräche im Hintergrund, Akzente oder die Schreibweise der Einträge in den Grammatikdateien.

MAX bietet eine Methode zur Anpassung der Empfindlichkeit, wenn einem Agenten ein zugewiesen wird Personal Connection Geschicklichkeit obwohl die Sprachschwelleneinstellung um das Messen und Herausfiltern von Hintergrundgeräuschen, die Spracherkennung des Agenten usw. zu unterstützen.

Timeout-Einstellung

Die Zeitspanne, in der die Aktion eine Äußerung wahrnimmt und versucht, eine Übereinstimmung zu finden. Die Standarddauer ist 10 Sekunden.

Intervoice Timeout-Einstellung

Dieser Wert bestimmt, wie lange das System wartet, nachdem der Kontakt mit dem Sprechen aufgehört hat. Das System wartet, um sicherzustellen, dass der Kontakt nicht weiterspricht. Die Einstellung ähnelt der Einstellung InterDigitTimeout für DTMFGeschlossen Signaltöne, die erzeugt werden, wenn ein Benutzer eine Taste auf seiner Telefontastatur drückt oder antippt..

Beispiel: Bei der Angabe einer Kontonummer sprechen Menschen die Zahlen meist in Gruppen mit einer Pause dazwischen, also "123 <Pause> 456 <Pause> 789 <Pause>". Die <Pausen> im vorigen Beispiel sind das Intervoice-Timeout. Der Standardwert ist 3 Sekunden. Berücksichtigen Sie beim Erstellen oder Tuning eines Skripts die Sprechzeit des Kontakts, das Intervoice-Timeout und eine kurze Zeitdauer für die Verarbeitung. Wenn zu viele Timeout-Einstellungen festgelegt werden, schlägt die Aktion möglicherweise fehl.

Fehler

Fehler Beschreibung
ASR-Initialisierung fehlgeschlagen Der Medienserver kann den ASR-Server nicht kontaktieren. Dies kann verschiedene Gründe haben, darunter der nicht ausgeführte ASR-Dienst oder nicht geöffnete Ports.
Grammatikdateifehler: Grammatik konnte nicht kompiliert werden. Bitte überprüfen Sie Ihre Grammatik auf Syntaxfehler. Wird in der Regel durch XML-Probleme mit der Grammatik verursacht.
URL-Fehler. Die Erkennungsfunktion konnte nicht auf die angegebene URL zugreifen. Grammatik existiert nicht, wurde nicht korrekt referenziert oder der Dateiserver konnte nicht erreicht werden.
ASRRESULT Bestimmt, ob ASR erkannt wurde.
ASRCONF Der resultierende ASR-Zuverlässigkeitswert, 0-100.
ASRCOMPLETIONCAUSECODE Weist auf den ASR-Abschluss hin.
ASRERRORMESSAGE Eine Textbeschreibung des von Nuance gemeldeten Fehlers.
ASRSTATUSCODE Gibt den Status anhand einer der folgenden Werte an:
  • ASR_STATUS_WAITING = 100 (TCP open is still waiting)
  • ASR_STATUS_OK = 200
  • ASR_STATUS_DTMF = 298
  • ASR_STATUS_RECOGNITION_FAILED = 299
  • ASR_STATUS_MALFORMED_CONFIDENCE_RESULT = 300
  • ASR_STATUS_CLIENT_ERROR = 400
  • ASR_STATUS_SERVER_ERROR = 500
  • ASR_STATUS_SERVER_ESTABLISHMENT_FAILED = 590
  • ASR_STATUS_SERVER_SELECT_WSAEINTR = 591
  • ASR_STATUS_SERVER_CLOSED_TCP_CONNECTION = 592
  • ASR_STATUS_SERVER_TCP_RECV_FAILED = 593
  • ASR_STATUS_NO_RELAY_LINE_AVAILABLE = 594
  • ASR_STATUS_SERVER_TCP_OPEN_TIMED_OUT = 595
  • ASR_STATUS_SERVER_RESPONSE_TIMED_OUT = 596
  • ASR_STATUS_MAX_SESSIONS_EXCEEDED = 597
  • ASR_STATUS_DUPLICATE_ENABLE_REQUEST_ERROR = 598
  • ASR_STATUS_INTERNAL_ERROR = 599
  • ASR_STATUS_STOPPED_BY_MEDIA_CHANNEL = 998