撮影画像を基にAIが「創作」した詩をプリントアウトするラズパイ搭載インスタントカメラ型デバイス
2024/06/01 06:30
シャッターボタンを押すと撮影したものをベースに詩を「創作」して印刷出力するインスタントカメラ型デバイス「Poetry Camera」を、Raspberry Pi公式ブログが紹介した。
Poetry Cameraは、旧Twitter(現X)でスペースのデザインに携わっていたKelin Carolyn Zhang氏と、ライター向け創作支援AIツール「Sudowrite」のデザイナーであるRyan Mather氏によるプロジェクトだ。
このプロジェクトでは撮影画像データから詩を生成するために、OpenAIの「GPT-4」モデルを採用している。Poetry Camera本体上部のシャッターボタンを押すと写真を撮影し、その画像データを「GPT-4 Vision」に渡す。すると、画像のキャプションが生成されるので、GPT-4にそのキャプションを詩に変換するよう指示する。GPT-4が生成した詩をRaspberry Piに送ると、その詩をサーマル(熱転写)プリンターで印刷してレシートのように出力するという仕組みだ。
必要なハードウェアは、Raspberry Pi Zero 2 W、Raspberry Pi Camera Module 3、小型サーマルプリンター、シャッターボタン用のプッシュボタンとLEDなどだ。ピンヘッダー未実装のRaspberry Pi Zero 2 Wには、自分で20ピンヘッダー2個を入手してはんだ付けする必要がある。
処理能力と基板サイズとのバランスからRaspberry Pi Zero 2 Wを採用したとのことだ。Raspberry Pi 3B+でも動作はしたが、電力消費量の面からRaspberry Pi 4の採用は難しかったようだ。
サーマルプリンターはTTLシリアル経由で接続する必要があり、このプロジェクトではAdafruitの「Mini Thermal Receipt Printer」を搭載しているので、対応するPythonライブラリーのサーマルプリンタードライバーを使用している。なお、GPT-4を使用するにはOpenAIアカウントとAPIキーを取得する必要があり、従量制課金になるので注意が必要だ。
GitHubでは初心者向けにハードウェアの選択理由や構築手順などをステップバイステップで説明している。Raspberry Pi、カメラ、プリンターの動作確認やAIのセットアップ、起動時にPythonスクリプトを実行するcronジョブの設定、Wi-Fiネットワークの変更についても解説している。
また、Raspberry Pi Camera Moduleは静電気に弱く損傷しやすいので注意すべきとしている。Poetry Cameraの作成過程では3つも壊したとのことで、使わないときは必ず静電気防止袋に入れて保管することを推奨している。