AIがRNA新種ウイルス7万以上を発見。中国の研究チームが新AIモデルLucaProtでサンプル分析(生成AIクローズアップ)

テクノロジー AI
山下裕毅(Seamless)

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。

特集

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深い技術や研究にスポットライトを当てる生成AIクローズアップ。

今回は、AIがRNAの未知なる領域を解析し、7万以上の新種ウイルスを発見した論文「Using artificial intelligence to document the hidden RNA virosphere」に注目します。

RNAは「リボ核酸」(Ribonucleic Acid)の略称で、DNAの遺伝情報を基に合成され、タンパク質の生成に必要な情報を運ぶ一本鎖の核酸です。

中国の中山大学やアリババグループなどに所属する研究チームは、世界中の多様な環境から採取された1万487のサンプルを分析しました。これらのサンプルには、海洋、河川、湖沼、土壌、湿地帯、温泉、深海熱水噴出孔など、さまざまな生態系が含まれています。分析には、研究チームが新たに開発した「LucaProt」と呼ばれるAIモデルが使用されました。

▲さまざまなサンプルをLucaProtで多数のRNAウイルスを検出

LucaProtは、Metaの研究者らが開発した「ESMFold」というタンパク質予測ツールを組み込んだAIモデルです。深層学習を用いたトランスフォーマーベースのモデルで、RNAウイルスの特徴的な酵素であるRNA依存性RNAポリメラーゼ(RdRP)を高精度で検出するよう設計されています。

このAIモデルの特筆すべき点は、タンパク質の配列情報だけでなく、構造情報も利用している点です。これにより、従来の手法では見逃されていた非常に変異の大きいウイルスも検出することが可能になりました。

この新しい手法を用いた分析の結果、16万1979種の推定RNAウイルス種が発見されました。さらに、180の新しいRNAウイルスの「スーパーグループ」も特定されました。これらのスーパーグループは、既知のウイルス目や門に匹敵する大きな分類群です。特筆すべきは、LucaProtによって新たに7万458種の固有のウイルス種が同定されたことです。

▲RNAウイルススーパーグループの信頼性の評価

発見されたウイルスの中には、これまでに知られている中で最も長いRNAゲノムを持つものも含まれていました。土壌サンプルから見つかったこのウイルスのゲノムは、約4万7250塩基対の長さがあり、既知のRNAウイルスの中でも最長クラスです。


日経テクノロジー展望2024 世界を変える100の技術
¥2,376
(価格・在庫状況は記事公開時点のものです)
《山下裕毅(Seamless)》

Amazon売れ筋ランキング

山下裕毅(Seamless)

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。