コンピューターはプログラムコードで動作しますが、このコードは人間が記述している以上、どうしてもエラーを含んでしまうことが避けられません。
しかし、最近は大規模言語モデルを使ったGPTなどジェネレーティブAIの急速な進歩により、目的とする処理を文章として渡すだけで、AIがある程度プログラムコードを出力できるようになってきました。
そして、BioBootloaderと名乗る開発者による新しい試みでは、プログラム開発の際にどうしても必要となるデバッグ作業を、GPT-4をベースとするAIで行うことを可能にしました。このツールは、プログラムを自動修正することから、似た能力を持つアメコミヒーローにちなんで「Wolverine(ウルヴァリン)」と名付けられています。
WolverineはPythonで書かれたコードを実行し、処理がクラッシュすると、その部分に修正を自動的に加えます。そして、コードのなかにいくつものバグが含まれていても、それらがすべてなくなるまで、実行と修正を繰り返します。BioBootloaderがTwitterに投稿したデモ動画を見ると、左側に実行するPythonコード、右柄にWolverineの動作結果が出力されるようになっているとのことです。
WolverineのコードはGitHubに公開されており、開発者はこの手法を他のプログラミング言語にも適用できると述べています。また使用する大規模言語モデルはGPT-3.5またはGPT-4とされているため、このどちらかのAPIキーが使える必要があります。GPT-3.5のAPIキーはOpenAIアカウントを持つユーザーすべてが利用可能ですが、3月にリリースされたばかりのGPT-4 APIは、記事執筆時点では利用するために待機リストへのエントリーが必要です。
Wolverineのようなツールはいまはまだ概念実証の段階ですが、もしこれが実用化されるようなら、ソフトウェア開発の現場で、人が発見できないようなバグも自動的に探し出して直せてしまう未来がやって来そうです。ただ、そうなったとしても、コンピューターが自動修正したあとのセキュリティ的な安全性などの検証は必要かもしれません。