米Google は2018年5月8日(現地時間)、開発者向けの年次イベントGoogle I/O において、AI が特定のタスクを自然な会話で代行してくれる Google Duplex を発表した。
大手企業やチェーン店であればオンラインの予約システムを用意していることもあるが、中小規模の店舗では電話等で予約や注文をしなければならない機会はまだ多い。Google Duplex は自然な会話を実現する技術を活用して、AIシステムが代行して電話でのやり取りをこなす。
Google Dupluex は自然な会話を実現することを重視しており、相手が機械を相手に特別な発声をすることなく、機械的ではなく人間のイントネーションのような音声で、普通の人間と話をするように会話ができる。会場では実際にヘアサロンにAIが電話で予約を入れるビデオが流されたが、AIが相槌をうつなど会話に不自然さはなく電話の取引が成立していた。
技術的に自然な会話を成立させるための課題は数多くある。自然言語は理解しづらいこと、自然な会話の振る舞いはモデル化が難しいこと、適切なイントネーションによる自然な発声が難しいことといった点が挙げられる。また、私達は人と会話をする時は、相手やその場の状況、文脈によって単語や主語述語等を省くなど、機械に話す時よりも複雑な構文を用いている。たとえば 4(フォー)という言葉が文脈的に時間(4時)と人数(4人)のどちらを意味するのか正しく判断しなければならない。こうした課題を解決して会話を実現させたのが Google Duplex だ。
Google Duplex の根幹は TensorFlow Extended (TXT)で構築したRNN(再帰型ニューラルネットワーク)で、高い精度を得るために匿名化された通話データのコーパス上で Duplex RNN を訓練したという。
Google Duplex: An AI System for Accomplishing Real World Tasks Over the Phone
https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html