人間と話したいなら、"人間 "と言ってください」。
"人間"
すみません、"キューバ人 "と一致するオプションが見つかりませんでした。もしよろしければ..."
ため息が出る。
対話型音声応答(IVR)システムの名声は、今や泥の中に引きずり込まれている。
つまり、AIボイスエージェント・ファミリーの醜い継子と呼んでもいい。
不格好で、時代遅れで、実用的でない。最も洗練されたアプリケーションが携帯電話で利用できる現代において、ロボットと音声で会話することは、ポケットの中で最も不便な使い方のように感じられる。
なぜ私はまだこの記事を書いているのか?
ああ、そうだね。[咳払い]。
......しかし、音声技術に精通し、洗練されたアプリケーション・デザインの愛好家として、自動電話フローを支持するいくつかの意見がある。
NLP(自然言語処理)やASR(自動音声認識)といったサポート技術も進歩している。
適切なデザインによって、キーワードの聞き間違いや終わりのないメニューは過去の遺物となる。
そこで、システムの各部分と今日の使われ方、そしてこの技術のユニークな利点を紹介しながら、私と一緒に旅に出よう。
IVRについて考えたことはあっても、実際に考えたことはないに違いないからだ。
IVRとは?
IVR(Interactive Voice Response)とは、企業がサポートコールを通じて顧客をナビゲートするためのメニューとして使用する自動電話システムです。これらのシステムには、よくある質問に答えたり、基本的なタスクを実行したり、ライブエージェントに引き継いだりする機能があります。
IVRは、基本的な問い合わせ、派遣、情報収集から生身のエージェントを排除し、より微妙なケースやデリケートなケースのために生身のエージェントを確保する。
通常は事前に録音された)メッセージのライブラリーと、ユーザーの入力を読み取る能力を持つこれらのデジタルエージェントは、カスタマーサポートの手作業のかなりの部分をオフロードすることができる。
IVRシステムはどのようにユーザー入力を読み取るのか?
従来のシステムは、ユーザー入力を読み取るために(Dual-Tone Multi-Frequency)DTMFを使用していた。ダイヤルパッドのキーがオプションに対応するのだ。
(キーパッドの数字によって音が違うのもそのためだ)。
英語は1を押してください」とか。
まだこれを使う人もいる。しかし、ほとんどの場合、物事はかなりスパイシーになっている🌶️。
音声技術の進歩により、これらのシステムは、キーワードを認識したり、自然言語処理(NLP)を実行してユーザーの音声から意味や感情を抽出したりする、より強力なメカニズムを統合できるようになった。
IVRの仕組み

1.イニシャルコール
IVRフローは、顧客が専用電話回線に電話をかけたときに開始される。
2.挨拶とメニュー
顧客は一連の選択肢を提示される。ここでも、これらのオプションはあらかじめ録音されている。
例えば、銀行口座の残高確認、会社の方針に関する簡単なFAQ、ライブ・エージェントに引き継ぐ前の予備情報の入力などである。
3.ユーザー入力
ユーザーはオプションを選択する。システムがユーザーの入力を読み取る方法はいくつかある。
デュアル・トーン・マルチ周波数(DTMF)
DTMFは古典的だ。シンプルでわかりやすい。当然のことながら、DTMFはあまり好まれない-電話をかけるなら、話したいものだ。
その一方で、ユーザーの入力を集めるのに最もリソースを必要としない方法でもある。
まだ本格的なヘルプポータルを構築しておらず、問い合わせが最終的にライブエージェントにつながることを想定しているような、政府機関のサービスに多く使われている。
音声コマンド認識
例えば、「口座残高を確認したい場合は、"balance "と言ってください」。
この技術が登場して以来、この数十年で大きな進歩を遂げた。
イントロの例のように)イライラするような精度の低い認識に慣れているかもしれないが、それは音声コマンド認識の能力というよりも、時代遅れのIVRシステムに関係がある。
自動音声認識(ASR)とNLP
洗練されたシステムでは、NLPシステムによる完全な音声認識を選ぶかもしれない。
そこでは、ユーザーが選択肢を平易な言葉で話し、ディープ・ニューラル・ネットワーク・ベースのアルゴリズムが、例えば「ええ、ええと、私は預金をしたいのですが」というようなユーザーの入力を書き起こして分類する。
比較的低リソースのシステムでも、かなり高速で正確なASRとNLPモデルを実行することができ、企業はこのセットアップで驚異的な成果を上げている。
4.ルーティング
システムの仕組みと顧客の反応に応じて、顧客は次のステップに進む。
クレジットカード番号や生年月日のような個人情報を入力するよう促されるかもしれない。また、より具体的なオプションのある後続のメニューに飛ばされることもある。
IVRとAI音声エージェントの比較
では、カスタマー・サポート・チャットボットの上に音声ラッパーを乗せれば、それはIVRシステムになるのだろうか?
技術的にはそうだと思う。
IVRは、事前に定義されたフローと、事前に録音されたメッセージを持つシステムを指すために使用されますが。
この場合、エージェントは事前に録音されたメッセージを使って、ユーザーにいくつかのオプションの中から一つを選択するよう促し、それに従ってルーティングを行う。
音声AIエージェントの場合、ユーザーはエージェントに話しかけ、応答は動的に生成される。エージェントは、どのツールをいつ呼び出すかを自律的に決定する。
IVRは、事前に録音されたメッセージと厳格なユーザー入力を使用して、フローを通じてユーザーをナビゲートします。ユーザーは各ステップで一連のオプションを提示され、適切なものを選択する必要があります。
一方、AIボイスエージェントは、特定のツールにアクセスし、ユーザーの入力を解釈して、どのツールを呼び出すかを決定する能力を持っている。また、事前に録音されたメッセージを再生するのとは対照的に、応答を動的に生成する。

音声エージェントよりもIVRを使うべき場合とは?
部屋の中の象:滑らかで自律的な会話エージェントが手元にあるのに、なぜわざわざステップバイステップのボイスアクティベートシステムを使うのか?
また、すでにIVRでユーザーの意図を分類するためにAIを使用しているのであれば、なぜ完全な自律型システムを導入しないのでしょうか?
聞いてくれて嬉しいよ。
予算が限られている場合
音声認識(これはどちらのシステムにも存在する)を除けば、IVRにおけるAIの使用は、ユーザーの発話をn個の例(通常は10個以上)のうちの1つに分類することに尽きる。
一方、自律型エージェントは、ユーザーの意図を判断し、応答を作成し、関連する音声を生成するためにテキスト音声合成(TTS)を使用するために、複数のLLM (大規模言語モデル)コールを呼び出します。
例えば、企業ポリシーやFAQページが非常に長く、顧客からの問い合わせが何百件もあるような場合、このような追加コストが必要になることがよくある。
それらをあらかじめ定義しておくことは、そして、神に誓って、顧客が自分の質問を見つけるために録音されたメニューを待つように仕向けることは、実現不可能であろう。この場合、エージェントが明確な選択肢となる。
フローが明確でない場合
自律型エージェントはより強力だが、予測可能性は低い。
覚えておいてほしいのは、彼らは自分で決断を下すということだ。つまり、ターンごとに一連の操作が実行されるため、エラーのデバッグが難しくなるのだ。
デバッグに何時間も費やしたからわかるんだ。
これは構わない。開発の一部ではあるが、データ、ワークフロー構造、必要性がすでにそこにあることが確実な場合に、時間的な投資を節約するのがベストだ。
そしてIVRは、それらの要素をすべて揃える素晴らしい方法なのだ。
ステップを明確に定義し、ユーザーを1つずつ順を追って説明することは、データを整理し、フローを理解する上ではるかに役立つ方法である。
私は、IVRには長所があり、完全なAIエージェントよりも簡単な問題に対処できると主張している。
しかし、何はなくとも、完全自動化への足がかりと考えることはできる。
IVRのメリット
IVRシステムがこれほど普及しているのには理由がある。
そして、私たちは、より大きく、より悪い、音声対応のカスタマーサポート・テクノロジーがある時代に生きていますが、IVRはまだ見る価値があると思います。
セキュリティ
私たちは、AIが人間と同じように何ができるかを語るのに忙しく、AIが私たちを凌駕するあらゆる方法を忘れてしまいがちだ。
そのひとつが音声認識だ。トムの声だ」と「トムじゃない」。

金融や個人情報のような機密性の高い案件では、自動音声フローを利用することで、企業は話し手の音声と身元を照合し、通常であれば発見されない可能性のある不正行為を摘発することができる。
CXの向上
すべての着信に応対できる労働力がない場合、何か不足を補うものが必要になる。
待たされるより、助けられる方がいい。
ライブエージェントは素晴らしい。しかし、入ってくる顧客のニーズについて説明を受け、専門知識に基づいて派遣されるライブ・エージェントは理想的です。
コスト削減
これは2つある。
第一に、カスタマーサービスの些細な業務をオフロードすることは、常にコスト削減につながる。単純な問い合わせをする顧客は、特に個別化されたサービスを必要としないため、IVRは単純なタスクを実行したり、迅速な応答を提供したりすることができる。
ウィンウィンだ
もう一方では、AIエージェントやチャットボットに代わる安価な選択肢となる。
企業は、IVRのような安価な自動化を考慮することなく、カスタマーサポートを自動化するために本格的なAIエージェントの導入に躍起になっている。
ボットにかかるコストは、ツールや技術だけではありません。
ワークフローを明示した低コストのシステムを設計することは、完全な自律型システムの引き金を引く準備をする前に、顧客のニーズに関するデータを収集し、フローを自動化する最適な方法を学ぶための優れた方法です。
より効果的なルーティング
明示的なワークフロー・ステップ(そして理想的にはちょっとしたAIの魔法)を使うことで、派遣を大幅に改善することができる。つまり、顧客が必要とする支援を実際に提供することができるのだ。
AIはノイズの多いデータからパターンを見つけるのが得意だ。
AIはIVRの本質的な部分ではないが、ユーザーの行動パターンを予測するための機械学習を追加することは比較的簡単である。
IVRを使えば、顧客のプロフィール、懸念事項、そしてその懸念事項に対して特定のライブエージェントがどの程度役に立ったかというデータを収集することができます。
ルーティングの際、IVRはどのライブエージェントに引き渡すかを決定しなければならない。
あるエージェントはデータベース移行の問題に詳しく、別のエージェントはログイン認証情報に詳しいのかもしれません。エージェント3は、エンタープライズプランのユーザの認証情報の問題に最適です。
エージェント/コンサルト/プロファイルのさまざまな組み合わせをすべて学ぶことは、生涯の課題だろう。
しかし、AIについては別だ。
24時間365日サポート
ライブ・エージェントは24時間対応できないかもしれないが、変則的な時間帯に必要な情報を収集したり、対応可能な時間帯にコールバックの時間を設定したり、単発の質問に素早く回答したりすることができる。
これにより、顧客側の摩擦を減らし、ライブ・エージェントの活動時間をより効果的にし、リソースを解放してオフピーク時にライブ・エージェントを雇用できる可能性があります。
業種を超えたIVRの使用例
特にIVRとNLPを組み合わせることで、企業は業界を問わず効率性と満足度の向上を実感しています。
バンキング
IVRの素晴らしい利用法だと思うからだ。
どのように考えても、安全な取引を保証するということは、少なくとも数回はユーザーの身元を確認し、取引の詳細を指定することを意味する。
クレジットカード番号や預金額など、比較的シンプルだが機密性の高い情報がほとんどだ。IVRが信頼でき、安全である限り、銀行業務には最適である。
実際、自然言語ベースのIVRを導入することで、銀行はセキュリティの向上とともに、高レベルの封じ込め(ライブ・エージェントに引き継ぐ必要がない)を実現している。
ヘルスケア
COVID-19でのスタッフの課題は、医療における効果的な自動化がいかに重要かを示した。
アイオワ州を拠点とする薬局ネットワークであるGBANK Healthでは、症例別IVRの導入後、電話転送が24%減少した。
これは、医療が高リスク、高負荷の業界であることを思い起こさせる。そして、効果的な自動化は人々の幸福を向上させることを意味する。
カスタマーサポート
カスタマーサポートの問い合わせの大半は、繰り返し発生するものです。着信コールを分類し、フィルタリングすることで、時間を節約し、満足度を向上させます。
その点、米国のある小売業者は、自然言語IVRによって電話の転送を30%削減することに成功した。
IVRを導入することで、ボールはあなたのコートに置かれます。
同じ小売業者は、予測アルゴリズムを使用して追加サービスを推奨し、70%以上の成功率で、フォローアップ電話の必要性を削減した。
IVRのよくある課題を回避する方法
IVRは楽しいことばかりではありません。IVRで発生する可能性のある問題は、楽しいことばかりではありません。
メニューはシンプルに
IVRのメニューは長く、選択肢が不明瞭なことがあります。最初の選択肢を忘れてしまい、残りの選択肢を聞くのを待つこともあります。また、どれが自分に当てはまるのかわからなくなることもあります。
解決策 繰り返し、繰り返し、繰り返し。使用状況に関するデータを収集し、人々がどこでつまづいているかを確認する。
それは、オプションの順序を入れ替えたり、使われていないものをなくしたり、似たようなものを統合したりすることを意味するかもしれない。
あなたの焦点は、通話時間、ユーザーが前のステップに戻ること、およびライブエージェントのハンドオフを最小限に抑えることです。
透明性を保つ
IVRは人間ではない。
しかし、ライブのエージェントと話すことを好む顧客もいる。
ユーザーの感情を読み取ったり反応したりする能力がなければ、不満を抱く顧客は過小評価されていると感じてしまう。
解決策わかりやすさを最適化し、ユーザーがどのようにライブエージェントと話すことができるかをできるだけ早い段階で明らかにする。
自動化されたメニューは、結局のところ、人間よりも個人的なものではない。そして、ユーザーはそれに対して違和感を覚えるだろう。
顧客の気持ちをコントロールすることはできないが、選択肢について常に透明性を保つことはできる。
ボトルネックへの対応
自動化されたシステムにも待ち時間はある。例えば、IVRが一度に対応できる顧客数には限界がある。ライブ・エージェントの待ち時間もさまざまです。
解決策ボトルネックを特定し、その解消に努める。
IVRワークフローを設計する際には、システム内部だけでなく、システム外部で何が必要かを考慮する。
もしかしたら、あるメニューは他のメニューよりも需要があるかもしれない。その場合、労働力をこれらの解決に向け直すことを検討する。
あなたのウェブサイトで答えられるような簡単な問い合わせのために、顧客が電話をかけてくる可能性もあります。このような情報が明確で、簡単に見つけられるようにしましょう。
IVRによる電話の自動化
AIの自動化という深い領域に飛び込む準備ができていないのであれば、IVRを導入すること以上に良い方法はないだろう。
IVRは、コントロールしながらAIの力を活用する素晴らしい方法です。データを収集し、継続的に改善することができます。
必要なのは構築プラットフォームだけです。Botpress ドラッグ&ドロップで簡単に構築でき、低価格のモデルから選べ、電話との連携も簡単です。アナリティクスの収集も可能です。
今日から始めよう。無料です。