「テキスト音声合成」最前線_5分で学べる、なるほど!コールセンターシステム

クラウドコールセンターシステム
(クラウドPBX)
オムニアリンク

なるほど!コールセンターシステム
新たにセンターを作るときのテレフォニー設計

Vol.12 録音はもう古い?「テキスト音声合成」を活用した音声ガイダンス作成の最前線

2022年4月19日
営業時間外に電話をかけてきたお客様に時間外を告げるアナウンスや、業務が休みであることを伝えるアナウンスなどの「音声ガイダンス」。これまではオペレーターの声を録音して流していましたが、最近ではAIを活用した「テキスト音声合成」が活用されつつあります。場所を選ばす素早く簡単にガイダンスを作成できるため、今後は利用が広がっていきそうです。

オペレーターの録音では素早い対応ができない

コールセンターの音声ガイダンスはこれまで、声音の美しいオペレーターに依頼するのが当たり前でした。雑音の入らない部屋でオペレーターに文章を読んでもらって録音し、その音声をPBXに設定するという作業を行うのです。

人気があるオペレーターには別の拠点からも依頼が来て、拠点間で取り合いになるなんてこともありました。特に年末年始の休業を知らせるアナウンスが必要となる際は、その状況が顕著に現れていました。

あるいはインバウンド業務で、1人のオペレーターが複数の窓口を担当している場合、オペレーターが電話をとる直前に「問い合わせ」と音声で伝え、オペレーターに名乗りの内容を知らせる方法があります。この直前の音声を「ささやき」と呼びますが、ささやきも現場のオペレーターやSVが声を吹きこんでいました。

また、録音した音源をPBXに設定するために、システム部門への申請やPBXの保守会社へ設定依頼が必要になることもありました。

こうしたやり方だとオペレーターのシフトや勤務状況に依存してしまったり、他部門・他社を経由したりするため、音声ガイダンスの作成や修正を行おうにも、素早い対応ができなくなります。そうなると災害時に拠点が稼働せず、臨時のアナウンスを発信する必要がある際などに問題が生じます。

そこで昨今注目されているのが、「テキスト音声合成(Text to Speech=TTS)」という技術です。

TTSで簡単に素早くアナウンスを作成

テキスト音声合成(TTS)とは、専用フォームにテキストを打ち込むと、その文字を人間の声のように人工的に作り出す技術です。AI(人工知能)に人の声を学習させることで、テキストをあたかも人間が話しているかのような声色で発話します。この技術はすでに電車の車内アナウンスやAIスピーカー、音声翻訳機などで使われています。
<TTSはテキストを打ち込むと人間の声色で発話する>
TTSを使うと、緊急時でも簡単にアナウンスを作成することができます。TTSの活用が想定される場面として、以下のようなケースが想定されます。
■ 自然災害によってコールセンターがクローズになってしまった。
■ 台風で電車が動かなかったり、大雪で交通網が麻痺してオペレーターが出勤できなくなってしまった。
■ システム障害でコールセンターが一時的に業務を中断してしまった。

こうした際にコールセンターに電話をかけてきたお客様に「現在、窓口が大変込み合っています」や「システム障害のためご迷惑をおかけしております」など簡潔な説明を自動音声でお知らせすることが可能です。

実際、2018年に発生した「北海道胆振東部地震の大停電」では、当社でも札幌センターが3日ほど稼働停止となりました。その時にテキストでガイダンスを入力し、それをTTSで音声化して電話のアナウンスに使うことで、早期に自動音声を用意することができました。短い説明であっても、緊急時に即座に音声ガイダンスを流すことで、お客様を不安にさせず、満足度の低下を抑制することにつながります。

TTSを使ったアナウンスの作成は、パソコンでログインすれば家にいても操作が可能です。簡単な音声ガイダンスであれば、ほんの数十秒で作成することができます。交通網が使えないとか、夜中に急ぎの対応が必要といった際もアナウンスを作成して変更できるのがメリットになります。修正や取り直しも即座に行えます。

このようにTTSによるアナウンスはオペレーターの声を録音する方法に比べて、人や拠点に依存せず、圧倒的な時間短縮を実現できるのが魅力です。

TTSの声が徐々に自然な発話に

TTSを活用した取り組みは、アウトバウンドでも見られます。その1つが、警察が実施した振り込め詐欺予防の啓発活動です。この事例では、アウトバウンドダイヤラーを使って順番に自動発信していき、つながったらテキスト音声合成で作成したアナウンスを自動的に流すという施策を実施しました。こうした活用方法は広がっており、最近では世論調査でもTTSを使った取り組みが増えてきています。

TTSの声は、男性や女性などを選ぶことが可能ですし、テキストを打つ際に漢字で表記したり句読点を打ったりすることで、音声のイントネーションや抑揚がより人間的になっていきます。また、TTSの指示テキスト内に、「マークアップ言語」と言われるタグを用いることで、発声・音量・速度・細かい休止の指定が出来るため、より自然なチューニングが出来るようになりました。英語の発話レベルはかなり高い水準まできており、日本語も徐々にですが自然な発話に近づいています。
<Omnia LINKのTTSの入力フォーム_声のタイプ選択やマークアップ言語による細かい指示が可能>
TTSはまだ発展途上ではありますが、技術はどんどん進化しています。今後はコールセンターの現場でもますます浸透し活用する場面が増えていくと思われます。将来的には無人のコールセンターも誕生するかもしれません。お客様の音声を分析・判断し、最適な返答をTTSが自動で行うというイメージです。
音声ガイダンスを録音するために声のきれいなオペレーターを取り合っていたことが、笑い話になる日もそう遠くないかもしれませんね。
音声ガイダンスの最前線「テキスト音声合成」
PDFを開く

0120-722-782

受付時間:9時30分~18時30分(平日)

コールセンターシステム
機能・コスト比較資料