米Googleは2010年6月14日、音声で検索できるGoogle Search by Voiceが欧州主要言語に対応したことを発表した。
Google Search by Voiceは、キーワードを発することで音声で検索できるサービス。すでに英語、標準中国語、日本語に対応しているが、新たにフランス語、イタリア語、ドイツ語、スペイン語に対応した。
同社のブログでは、フランス語やスペイン語の音声検索や音声認識技術を開発するにあたっての問題について言及している。フランス語やスペイン語の優れた音声検索を実現するためには、発音区別符号(diacritics)やアクセントマーク(accent marks)をどのように処理するかが課題となる。
Googleは音声検索で要する辞書をユーザ生成コンテンツをベースに構築していくが、フランス語やスペイン語のコンテンツの多くは、正しい正書法(orthography)に従っていないという。たとえば、フランス人が検索窓に "francoise" とタイプしたとき、彼は実際には "Françoise" の結果を期待しているし、また、スペイン人が "espana"とタイプしたときは "España" の結果を期待している。
このように入力される背景には、そもそもドメインネームが発音区別符号に対応していないこと、手間を省くために発音区別符号を省略する習慣が根付いている点にある。
しかし、音声検索においては両者は大きな違いであり、適切でないスペリングは発話者の意図を正確につかむ事ができない。そこで、辞書の正書法を自動的に修正できるように対処した。この方法は完璧ではないものの、上記の問題が発生する多くのケースにおいて、適切に音声をつかめているという。
Google Search by Voice now available in France, Italy, Germany and Spain
http://googleresearch.blogspot.com/2010/06/google-search-by-voice-now-available-in.html
#
公式ブログではドイツ語の課題についても言及されていますが、省略します