猫も杓子も128GB M4 Max MacBook Proなのはどういうことでしょうか。
128GB M3 Max構成のMacBook Proを使っているのにサーマルスロットリングでポッドキャスト収録もままならない散財王ドリキンは気にならなかったのに、最新機種であるM4 Max MacBook Proを128GBメモリ構成にした清水亮さん、西川和久さんの話を聞いていると、これは買わないといけない気にさせられます。
【西川和久の不定期コラム】M4 Max/メモリ128GB/1TB SSDを搭載した「MacBook Pro 14インチ」を購入! - PC Watch
【西川和久の不定期コラム】M4 Max搭載「MacBook Pro 14」のメモリ128GBをLLMでほぼ使い切ってみた! - PC Watch
コンシューマー向けGPUの最高峰であるGeForce RTX 4090をもってしても24GBまでしかメモリが使えません。それに対してUnified Memory ArchitectureのMシリーズであれば、演算性能は(NVIDIA GPUと比べれば)そこそこでも、高速なメモリを潤沢に使えるメリットは大きく、そのおかげで巨大な大規模言語モデルをローカルマシンで動かせるというわけです。
その性能が現在の最高峰のLLMサービスに比肩するようになったというのが、清水亮さん、西川和久さんの記事で明かされました。
清水さんが試しているQwQとはQwen with Questionの略で、QwenはアリババのオープンソースLLMです。西川さんが試しているQwen2.5-Coder-32Bも同じくQwen。
そういえば、こんなPR記事がテクノエッジに上がっていましたが、そのQwenですね。12月10日に技術カンファレンスがあるそうです。
そんなわけで、買ってしまったのです。M4 Maxで128GBのユニファイドメモリ、2TB SSDの14インチMacBook Pro。81万3800円。
Apple Store + オリコによる24回0%金利の審査が通ったおかげで、月々3万3900円の支払い。現在、AI関連サービスのサブスク出費が8万円超えているので、それを多少抑えられると考えられれば……。いや、減らないだろうなあ。
支払いは2025年1月から。ちょうど良いことに、明日(12月4日)に、我が家の30年ローンが完済となります。このくらいのご褒美はあってもいいのではないでしょうか。
到着は12月9日以降ということなので、まだ現物はないのですが、ここは景気良くいきたい。というわけで、曲とミュージックビデオを作ってみました。
まず、Suno v4の作詞エンジンであるReMiに曲のテーマを与え、歌詞を考えさせます。
この歌詞を、自分用にモディファイしていきます。レンダリングというよりは大規模言語モデルをローカルで使いたいというのがメインの目的だから、歌詞を適当に変えて、あと、メモリ帯域が大きく広がったというのも入れて、といった感じで歌詞を修正。
歌詞の読み間違いをした箇所はひらがな・カタカナに変えたりして試行錯誤の末、およそ160曲(80回)のガチャを繰り返してできたのが次のバージョン。
グラハム・ボネット、ジョー・リン・ターナー時代のレインボウを思わせるアップテンポで、タッタカタッタカなギターバッキング(Heavy Metal Gallopという奏法)も入っている、非常に好みな曲です。
曲ができたら、ミュージックビデオの制作です。
これは男性ボーカルなので、妻の歌声やアバターを使うわけにはいきません。
今回は、自分の歌声を元にしたSunoペルソナで行きます。
それに合ったアバターも用意しなければなりません。
ついに禁断の、自分の顔のファインチューニングに手を出すことになったのです。
妻のアバターと時代を合わせる意味で、若い頃(20代から30代)の写真10枚ほど(それ以上は顔がはっきり写っているものがあまりなかった)を用意して、HeyGenのAI Photo Avatarに学習させます。
学習が終わると、プロンプトでリップシンク用のアバターを生成できるようになります。1回のプロンプトにつき、4個ずつ生成されるのですが、たまにエラーが出てしまいます。
この中で、ロン毛のアバターを選んで、リップシンクさせます。
この辺のやり方は、前回の連載コラムと同じ。
今回はPortraitを選んで縦動画にしてみました。
これに、Suno v4で出力したWAVファイル(2分25秒)を読み込ませ、リップシンクを始めます。最近はすぐにスタートしてくれなくて、かなり待たされますが、HeyGenの自分のプランでは最長で5分までのリップシンク生成ができるので、一発で可能なのはありがたいところ。
完成品を後で見直すと、歌詞をところどころ読み間違っています。「LPDDR -5X 8533 SDRAM」をちゃんと読めてなかったり、大規模言語モデルを「だいきぼゆうげんモデル」とかに間違ってます。
読み間違えないような歌詞に変えて、Cover機能を使って歌いなおさせます。1箇所の修正であればReplace Sectionでも可能なのですが、構成がぐちゃぐちゃになったりまだバグが多いので、Cover機能で直した方が良さそうです。
再度HeyGenのAI Photo Avatarでリップシンクを出力。そこにFinal Cut Proで歌詞を載せて、新しいMacBook Proの画像を重ねて、我がニューマシンの応援歌ができました。
この歌を聴きながら、到着までワクワクしながら待ちたいと思います。
でも、SunoもHeyGenもローカルでは動かないんだよなあ。