今回の生成AI論文ピックアップでは、革新的なニューラルネットワークアーキテクチャとして注目のKAN (Kolmogorov-Arnold Network)に科学知識を組み込み、AIによる新たな科学的発見を目指す研究「KAN 2.0」を取り上げます。
生成AIウィークリー連載記事一覧 | テクノエッジ TechnoEdge
新星ニューラルネットワーク「KAN」の科学分野に特化したバージョン「KAN 2.0」登場
「KAN 2.0」は、「KAN」(Kolmogorov-Arnold Network)を科学分野に活用するためのフレームワークです。KANとは、最近登場したニューラルネットワーク(NN)アーキテクチャで、これまで多用されてきた「MLP」(Multi-Layer Perceptron、多層パーセプトロン)とは異なるアイディアでありながら高性能と期待されている新星です。
KANの特性を簡単にいうと、MLPがノードに固定の活性化関数を持つのとは異なり、KANはエッジに学習可能な活性化関数を特徴としています。
現在主流のMLPは、複雑なデータ構造や関数に対して学習の効率が低く、正確性が落ちる制約があるのに対して、KANではより小さな規模でより正確に処理できること、結果の解釈可能性の高さが期待されています。
本研究では、そのようなKANと科学的知識を融合させる双方向のアプローチを提案しています。科学からKANへの方向では、既知の科学的知識をKANに組み込む方法を示しています。例えば、重要な特徴量、モジュール構造、数式などの形で科学的知識を表現し、それらをKANの初期構造に反映させます。
一方、KANから科学への方向では、訓練されたKANから科学的洞察を抽出する手法を提案しています。具体的には、重要な特徴量の特定、モジュール構造の発見、数式の導出などが可能になります。
KAN 2.0を用いた例として、保存量の発見、ラグランジアンの学習、隠れた対称性の発見、構成則の学習など、様々な物理学の問題に適用しています。これらの実験から、科学的発見のための強力なツールとなる可能性が示唆されています。