米Microsoft、ChatGPTを使って自然言語によるロボット制御を研究中
2023/03/29 07:30
米Microsoftは2023年2月20日、ロボットアーム、ドローン、ホームアシスタントなどのロボットを直感的な言語で制御する技術として、米OpenAIのAI言語モデル「ChatGPT」を応用した研究を進めていることを、Webサイトで明らかにした。
研究の目的は、ChatGPTがテキストの入力情報から実世界の状況を推論し、ロボットのタスクを支援することだ。この成果によって、プログラミング言語やロボット工学の専門知識を持たない一般の人々が、ロボットと簡単に対話できる仕組みづくりを目指す。
具体的には、実世界の物理法則を理解し、ロボットの動作が実世界にどのように影響を及ぼすか、といった因果関係を推論する。その過程で、ロボットの制御を通して問題を解く手段をChatGPTに学習させる。
研究者らは、ロボット用の高水準APIや関数ライブラリを開発し、その挙動をChatGPTが容易に類推できるよう、各機能に「説明的な名称」をつけた。さらに、ChatGPTのプロンプト(入力)にタスクの目標を示す際、利用できる関数名を挙げて推論を補助した。
ロボットのタスクを開発する作業は、ChatGPTが出力したコードを、ロボットやシミュレーターで実行させて評価する。また、動作の質や安全性の評価を、自然言語によってChatGPTにフィードバックした。完成したコードは、ロボットにデプロイ(展開)する。
実際に、ChatGPTにドローンを制御させて実験したところ、ユーザーの指示内容が曖昧だった場合、ChatGPTがユーザーに質問を返してきた。その結果、棚の外観を検査するというタスクを実行するために、ジグザグパターンで飛行する複雑なコードをドローンにデプロイしただけでなく、自撮りの方法まで発見した。
(fabcross for エンジニアより転載)