口頭で伝えた言葉を基に生成AIが作った物語を「読み聞かせ」するスピーカー
2024/06/27 06:30
生成AIを使用して物語を自動生成しつつ、合成音声で読み上げる自作のスピーカー型デバイスをRaspberry Pi公式ブログが紹介した。
大規模言語モデル(LLM)の進化に興味を持っていたStefano Mazzocchi氏は、物語の読み聞かせをしてもらうのが好きな自分の娘のために、AIが生成した物語を読み上げるデバイス「Fably」を考案し作製した。
Fablyの主要なハードウェア構成は至ってシンプルで、集音マイクを2個備えたマイク拡張ボード「ReSpeaker 2-Mics Pi HAT」をRaspberry Pi Zero 2 Wに装着しているだけだ。「○○についての物語を聞かせて」という定型文で、物語の元となるアイデアをFablyに口頭で伝えると、生成AIを使用してアイデアに沿った文章を生成し、合成音声で読み上げてくれる。
Mazzocchi氏によると、低コストでレスポンスの早いハードウェアが必要であるため、Raspberry Pi Zero 2 Wの採用に至ったという。対象ユーザーはあまり辛抱強くない子どもを想定しているので、口頭でのアイデア伝達からFablyが音声出力開始するまでの時間はなるべく短くなるように設計している。
また、特定のトピックについての物語を生成しないように設定することも可能で、生成された物語は保存されるので後でチェックできるような仕組みも整えている。
生成AIはクラウドAPI経由で使用しており、記事執筆時点ではOpenAIのクラウドAPIのみサポートしているが、将来的には他のAIクラウドAPIにも対応したいとのことだ。