発表から10カ月。OpenAIの動画生成AI「Sora」がついに一般ユーザーにも利用できます。
アドベントカレンダーのように、日めくりで新しい発表を行うOpenAIの「12 Days of OpenAI」。Day 1は(月額200ドル、約3万円)のChatGPT ProとGPT o1 pro modeが大きな話題となりました。
Day 2ではReinforcement Fine-Tuning(強化ファインチューニング)という技術についての説明。一般ユーザーには縁遠い技術で、o1-miniという下位モデルで、さらにすぐに提供されるわけではないというので、ちょっと肩透かし感はありました。
そして週末を挟んでのDay 3は、ついにSoraです。
最大1080p、20秒の動画生成が、Text to Video、Image to Videoの両方で可能という、現時点の動画生成AIでは最高レベルのものです。
米太平洋時間の12月9日中(later today)には全世界(EUや英国などを除く)で利用可能になるとしています。
利用できるのはChatGPTの2つのプラン。ウォーターマークなしで最大20秒の動画を500本まで生成できるProプラン(月額200ドル)がここで生きてきます。
月額20ドルのPlusプランでは50本までで、ウォーターマーク付きです。
ただし、生成する動画のサイズ、長さで消費するクレジットが異なる点に注意です。Plusユーザーに与えられたクレジットは1000。これでは1080p、20秒の動画で使う2000クレジットに届きません。
50本生成、500本生成というのは、480pの正方形動画で5秒の長さです。
この最高水準動画を生成するためにはProプランが必要ということになります。Proプランは毎月10000クレジットが付与されますが、それでも生成できるのは5本。
Soraの利用はsora.comから使えますが、執筆時点ではログインできない状態です。
Storyboard機能では、タイムラインで異なる指示を持つカードを組み合わせることも可能です。
なお、Slow cue mode、つまりすぐに生成するのでなければ(キューに入れて空き時間を待つ)、Proユーザーが生成できる動画の本数は無制限となります。このあたりはRunwayのExploreモード(月額95ドルのUnlimitedプラン)と同様です。
今日の公開は、サム・アルトマン氏のポストでも匂わせられていました。soを何度も繰り返し、so far awayという、Soraの文字が含まれていたからです。
一方で、子供の虐待やディープフェイクなどの対策として強いモデレーションが施されており、少なくとも初期段階では人物の画像をアップロードしたImage to Videoは制限を受けているようです。