gooラボ、日本語解析技術APIを公開

NTTレゾナント株式会社は2014年12月3日、NTT研究所が開発して同社の検索エンジン「goo」で利用してきた、日本語解析技術に関連するAPIを公開した。gooラボから利用できる。

同社は1997年に提供開始した検索エンジン「goo」の運営しており、様々なWeb検索に関わる技術やノウハウを蓄積してきたほか、NTT研究所との連携により、様々な世界有数の技術を有する。同社は今後、こうした技術が企業のビッグデータ解析技術などの分野において活用が見込まれることから、APIの公開を順次行うことを決定した。

第一弾は、ビッグデータ解析などにおいて必要な要素技術である日本語解析に関わる4種類のAPIを公開する。このAPIを利用することで、日本語文章を単なる文字列集計だけでなく、書かれている内容に基づいた分析が可能になるとしている。

公開されたAPIは次の通り。

語句類似度算出：2つの語句に対して、構成単語や音素の情報を踏まえて、その類似度合いを算出する。例えば、「キョート」と「京都」、「カノニカル」と「canonical」といった似通った発音を持つ異なる表記の語句を、その類似度合いにより同一語句とみなすことができる。データ統合作業を自動化すると共にデータ分析の精度と生産性を高めることが可能だ。