大規模言語モデルを利用して数学の未解決問題で新たな解を発見——実用的な課題でもその性能を実証

2024/01/15 06:30

研究転載記事

Google DeepMindは、大規模言語モデル（LLM）を利用した新手法「FunSearch」を用いて、数理科学において長年の未解決問題である「cap set（キャップ集合）問題」の新しい解を発見した。さらに、現実世界で多様な応用が可能な「ビンパッキング（箱詰め）問題」の、より効果的なアルゴリズムも見つけた。この研究は2023年12月14日付で『Nature』に掲載され、科学や数学の未解決問題に対して、LLMを使って新しい発見をした初めての研究例になるという。

LLMは概念を組み合わせることに優れており、読み書きやコーディングができて、問題解決を支援する便利なアシスタントだ。しかし、LLMはまるで「幻覚」を見たかのように、事実とは異なる情報をもっともらしく生成して出力することがあるという点が明らかになっており、LLMを使用して立証可能な正しい発見をすることは困難だ。

そこで研究者らは、創造的な解決策をコンピューターコードの形で提供するよう事前に訓練されたLLMと、「幻覚」や誤ったアイデアを防ぐように自動化された「評価装置」をペアにして機能するFunSearchを考案した。このシステムは、コンピューターコードに書かれた「関数（function）」を「検索（search）」することから「FunSearch」と名付けられた。

FunSearchは、LLMと評価装置との間で繰り返される反復処理を行う。生成済みプログラムの中からいくつか選択してLLMに送ると、LLMはそれらを元にして独創的に新たなプログラムを生成する。LLMが生成した新プログラムは自動的に評価され、最も優れたプログラムはデータベースに追加されて、次のサイクルで選択される。こうして自己改善ループが形成される。

FunSearchで最初に取り組んだキャップ集合問題は、何十年も数学者たちを悩ませてきた未解決問題だ。高次元格子において3つの点が直線上には存在しない点の集合で最大のものを求めるというものだが、しらみつぶしに演算して解こうとすると、考えるべき可能性の数がすぐに宇宙に存在する原子の数より多くなってしまうためうまくいかない。

この問題について重要なブレークスルーを明らかにした、米ウィスコンシン大学マディソン校数学部のJordan Ellenberg教授と共同で研究した結果、FunSearchはプログラムの形で解決策を生成し、いくつかの設定においてはこれまでに発見された中で最大のキャップ集合を発見した。また、FunSearchは単に問題の解を生成するだけでなく、その解がどのようにして導き出されたかを説明するプログラムを、研究者が理解しやすい形で生成するといった利点もある。そのおかげで、研究者は実用的な洞察を得られ、さらに優れた解決策を導き出すのに役立ったという。

次に取り組んだビンパッキング問題は、異なるサイズの物品すべてを詰め込むために必要な一定容量のビン（箱）の数を最小にするような方法を求めるというものだ。オンラインのビンパッキング問題は、通常、人間の経験に基づくアルゴリズム的経験則（ヒューリスティックス）を用いて対処される。しかし、サイズ、タイミング、容量が異なるそれぞれの状況ごとのルールを見つけることは困難だ。

キャップ集合問題とはまったく異なる問題にもかかわらず、FunSearchは簡単な設定をするだけで、データ仕様に適応し、自動的にそれぞれの目的に合ったプログラムを生成した。このプログラムは、定評のあるヒューリスティックスを上回り、同じ数の物品を詰めるために必要なビンの数は少なくなった。FunSearchは導入しやすいコードを出力するので、さまざまな産業システムで迅速に利益をもたらす可能性がある。

FunSearchは、LLMの「幻覚」を防げば、その能力を数学的な新発見だけでなく、現実世界の重要な問題に対して、影響力の強い解決策を明らかにすることにも活用できることを実証したといえる。

研究チームは、科学や産業における多くの問題に対して、LLM駆動型アプローチを用いて、効果的で目的に合ったアルゴリズムを生成することが一般的な方法になると予想しているという。

（fabcross for エンジニアより転載）

関連情報

ニュース

GE Hitachi Nuclear Energy製の小型原子炉「BWRX-300」、イギリスでの配備に向け前進

気球での宇宙遊覧サービス開始に向け、岩谷技研とJALが協業

ispaceの月探査プロジェクト「ミッション2」のランダー打ち上げ成功、無事予定軌道へ

ソレノイドを使った発明品コンテスト「第12回ソレコン」募集開始

寒い冬の造形に——レジン加熱に対応したSLA方式3Dプリンターのクラファン開始

編集部のおすすめ

fabcross週間アクセスランキング（2025年1月6日～1月12日）

マウス操作で痩せるの!? 「DDR風の足マウス」を自作キーボード界で有名なPro Microで作製してみた

ラズパイPicoで始める自作キーボード入門 | PIOで4×4キーパッドを制御

スイッチサイエンス年間売上ランキングベスト100に見る 2024年電子部品ヒット商品のトレンド

fabcross工作ライターが今年買って良かった #推しグッズ2024

誕生から50年！ タミヤの「楽しい工作シリーズ」年間ベスト10を聞いてみた

日本のファブ施設調査2024——10年を振り返る

築90年古民家を通じて地域社会とつながる——小規模ファブ施設が広がる理由

連載・シリーズ

今さらきけない「ラズパイってなんですか？」

土日で完成！ 趣味のラズパイ

それ、ラズパイでつくれるよ

それ、M5でつくれるよ

ギャル電きょうこの意識の低い工具入門

頭の悪いメカ by 藤原麻里菜

メイカースペースの作り方

アジアのMakers by 高須正和

Dr.片山の100均ロボット研究室

梨衣名が教えるものづくり中国語講座

Dig up the underground「プロダクト一機一会」 by 松崎順一

マイコンボードをはじめませんか？

ギャル電子工作

ギャル電きょうこのストリート電子工作

在宅ものづくり応援企画

fabなび—日本全国のファブ施設（ファブスペース/メイカースペース）を紹介

ジモトをつくる

「バラしてみたらオドろいた」家電分解ジャーニー

ミルノラボ

身近なモノで、あるある工作

1カ月1000円工作

2020年プログラミング必修化！「作る」ことで分かるSTEM教育

短期連載：スタートアップの古都、京都を訪ねる

イベントレポート

部品自作 超入門講座

てらおか機構機構 Teraoka Mechanism Organization

位置情報×IoTの最前線

素材の話を聞きに行こう

今月もクラウドファンディングに◯◯万円使っちゃいました by Kibidango

かんたん3Dモデリング～Fusion 360はじめの一歩

ものづくりの人が知っておくべき権利

注目のキーワード

誕生から50年！タミヤの「楽しい工作シリーズ」年間ベスト10を聞いてみた

土日で完成！趣味のラズパイ

部品自作超入門講座