SECURITY SHOW

SECURITY SHOW 2019 | 2019年3月5日(火)〜8日(金) 東京ビッグサイト
展示会トップ

音から形・位置を推定、NTTが研究、防犯など応用検討。

 音だけでモノの形や位置を推定する――。NTTは、そんな研究成果を公開した。ディープラーニング(深層学習)を使い、複数のマイクで集音した情報から、モノの形や位置を推定するような研究だ。深層学習では入力した画像から新たな画像を生成するように、入力と出力の形態が一致する形が一般的だが、音声を入力し、画像を出力できるようになる。新たな可能性が広がりそうだ。

 デモでは鉄道玩具「プラレール」が動く様子を4本のマイクで集音。プラレールの動作音から位置や形を推定し、画像として出力する研究成果を披露した。音響特性から物体の形や位置を予測できるような学習データを用意。これによって入力が音声、出力が画像という新たな深層学習モデルを考案したという。

 「浴室などカメラで監視したくない場所でも、音だけで空間の様子が把握できるようになる」(NTTの研究員)。防犯や見守りなどへの応用を考えているという。

 現段階では技術的課題も残る。物体の位置や形を推定できるのは、部屋の大きさが学習したデータと一致する場合に限られているという。「部屋の大きさが変わると、音響特性が変わってしまい、予測結果がずれてしまうことがある」(同)。

 NTTコミュニケーション科学基礎研究所の山田武士所長は「文章内容から情景画像を生成するなど、様々な飛躍が期待できる」と話す。

関連情報一覧

メニュー

同時開催の展示会+ 展示会一覧を見る