電子デバイスを音声コントロールできる——ユカイ工学とNTTドコモ、開発者向け音声対話開発キット「codama」発売
2018/12/04 14:00
ユカイ工学とNTTドコモは、XMOSのボイスプロセッサーを使った音声対話開発キット「codama(こだま)」を共同開発し、ユカイ工学より発売する。
codamaは、NTTドコモのオープンパートナーイニシアティブのデバイスオープン機能「ドコモAIエージェントAPI」に対応し、NTTドコモが提供するRaspberryPi用ソフトウェアを利用することで動作する。
codamaとAPIの連携により、電子機器やIoTデバイスの音声操作が可能となる。設定した呼びかけに反応するウェイクアップワードや、クリアに音声をキャプチャーするビームフォーミングおよびノイズキャンセリングにより、音声によるAIサービスへのアクセスを可能にしている。
基板に搭載されたXMOSのボイスプロセッサー「XVF3100」は、音楽を再生するデバイスを中断または一時停止できるバージイン機能を備えた全二重音響エコーキャンセラ(AEC)と、話者の追従が可能な適応型ビームフォーマを含むDSPを備え、残響除去、オートゲイン制御、ノイズ抑制により、騒々しい環境下でも機器との音声対話が可能だ。
自分の音声をウェイクワードとしてユカイ工学のウェブサイトで登録して、キーワードだけに反応させることで、パーソナル音声対話デバイスとして利用できる。
4つのリニアマイクアレイを搭載し、Raspberry Piの40PIN GPIOに接続して作動する。市販のスピーカーをAUX端子に接続する以外に、ボードに搭載されたアンプを使い、電子工作用スピーカーをスピーカー出力に接続できる。サイズは64×55×20mmで、予定価格は1万5000円。