CloseBox

1993年に創刊したMacUser誌から続けている、松尾公也の私的コラム連載。コンピュータ、ネット、音楽などをテーマに現在と過去を行き来しつつ書いていきます。

日本人をうまく動かせる動画生成AI「Hailuo」が3日間無制限モード開放中。有償プランスタートに合わせ(CloseBox) 画像
テクノロジー

日本人をうまく動かせる動画生成AI「Hailuo」が3日間無制限モード開放中。有償プランスタートに合わせ(CloseBox)

中国製の動画生成AIサービス「Hailuo」の紹介をし、その中でサブスクリプションサービスが待たれる、と書いていましたが、意外なほど早くきました。本日(10月11日)スタートです。

Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox) 画像
テクノロジー

Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox)

これはすごいと話題になっていたYouTube動画。これに対抗しようとやってみました。

動画生成AIにまたもや新星。「Hailuo」は写真を6秒の動画にできて(今のところは)無料。かつ人物の一貫性に優れている(CloseBox) 画像
テクノロジー

動画生成AIにまたもや新星。「Hailuo」は写真を6秒の動画にできて(今のところは)無料。かつ人物の一貫性に優れている(CloseBox)

Image to Video、つまり静止画を短い動画にできる動画生成AIの新サービスが登場しました。中国の「Hailuo」(ハイルオ)がそれで、中国製動画生成AIとしては、KLING、Viduに次ぐ3番手となります。

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に(CloseBox) 画像
テクノロジー

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に(CloseBox)

AIリップシンクサービスのHedraが新バージョン「Character-2」を公開したので使ってみました。

遅れに遅れたChatGPT高度な音声モードが公開開始されたので、AIパーソナリティーのポッドキャストを作ってみた(CloseBox) 画像
テクノロジー

遅れに遅れたChatGPT高度な音声モードが公開開始されたので、AIパーソナリティーのポッドキャストを作ってみた(CloseBox)

OpenAIがようやくAdvanced Voice Modeのロールアウトを始めました。

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox) 画像
テクノロジー

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox)

話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。

AI作曲のSunoがネガティブプロンプト「Exclude Styles」投入「この楽器や歌声いらない」ができて超便利(CloseBox) 画像
テクノロジー

AI作曲のSunoがネガティブプロンプト「Exclude Styles」投入「この楽器や歌声いらない」ができて超便利(CloseBox)

Sunoが投入してきた新機能、ネガティブプロンプト「Exclude Styles」について解説します。

生まれた時にはこの世にいない「写真1枚だけの父親」がAIで動く姿を親父に見せた(CloseBox) 画像
テクノロジー

生まれた時にはこの世にいない「写真1枚だけの父親」がAIで動く姿を親父に見せた(CloseBox)

今年90歳になった僕の父は、自分の父親の記憶がありません。生まれた時には亡くなっていたからです。唯一残された写真をAIで動画にして見せてみました。

80×80×100cmの巨大3Dプリンタ、日本でもクラファン開始。自分が買ったのと同じ低価格で買える?(CloseBox) 画像
ガジェット

80×80×100cmの巨大3Dプリンタ、日本でもクラファン開始。自分が買ったのと同じ低価格で買える?(CloseBox)

「ELEGOO OrangeStorm Giga」という巨大な3DプリンタをKickstarter経由で購入し、自宅に設置している途中の記事を先日書きましたが、その続報です。

AIがカバー曲を作れるように。Suno AI曲の音楽スタイルや歌詞を変えて新しいアレンジで(CloseBox) 画像
テクノロジー

AIがカバー曲を作れるように。Suno AI曲の音楽スタイルや歌詞を変えて新しいアレンジで(CloseBox)

作曲AIサービスのSunoが、新しい機能「Covers」を追加しました。楽曲のアレンジや歌詞を変えた「カバー曲」を作るためのものです。

一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて(CloseBox) 画像
テクノロジー

一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて(CloseBox)

中国産動画生成AI「Vidu」に、Reference to Videoという新機能が加わりました。AI動画生成でObject Consistency、つまり対象物の一貫性を保つことが可能になったのです。

Apple Intelligenceをフル活用するならiPhone 16やApple Watch 10を買わないとダメ?(CloseBox) 画像
テクノロジー

Apple Intelligenceをフル活用するならiPhone 16やApple Watch 10を買わないとダメ?(CloseBox)

今回のAppleの発表で気になるのは、「新製品は、Apple Intelligenceのために必要なものかどうか」です。

高さ1メートルの立体物を印刷できる3Dプリンタが我が家にやってきた(CloseBox) 画像
ガジェット

高さ1メートルの立体物を印刷できる3Dプリンタが我が家にやってきた(CloseBox)

深圳の3DプリンタメーカーELEGOOが2023年12月にKickstarterで実施していたクラウドファンディングにプレッジ(出資)していたのですが、その現物が届きました。「ELEGOO OrangeStorm Giga」という製品です。

プロンプトで画像生成ストリートファイトするAIアーケードゲーム大会「VS AI街頭對戰」、台湾で世界大会決勝(CloseBox) 画像
テクノロジー

プロンプトで画像生成ストリートファイトするAIアーケードゲーム大会「VS AI街頭對戰」、台湾で世界大会決勝(CloseBox)

画像生成AIのプロンプト技を競う世界大会が10月、台湾で開催されます。

AmazonスマイルSALEで買ったもの。Xiaomiの3万円43インチ4Kチューナーレステレビ、買う必要ないのに買ってしまった(CloseBox) 画像
ガジェット

AmazonスマイルSALEで買ったもの。Xiaomiの3万円43インチ4Kチューナーレステレビ、買う必要ないのに買ってしまった(CloseBox)

Xiaomiの43インチテレビ(チューナーなし)がニーキュッパ。2万9800円だというじゃありませんか。買ってしまいました。

Suno酷似のAI作曲サービス「LoudMe」、課金サービス開始したが実態はSunoへの違法アクセスか(CloseBox) 画像
テクノロジー

Suno酷似のAI作曲サービス「LoudMe」、課金サービス開始したが実態はSunoへの違法アクセスか(CloseBox)

AI音楽生成サービス「LoudMe」が、実はSunoから違法にアクセスしているという指摘が浮上。LoudMeはSunoの無料アカウントを利用し、無断で楽曲を生成しているとの情報が公開された。

今そこにある最強動画生成AI「Runway Gen-3 Alpha」が40秒の動画生成可能に。リップシンクもできる(CloseBox) 画像
テクノロジー

今そこにある最強動画生成AI「Runway Gen-3 Alpha」が40秒の動画生成可能に。リップシンクもできる(CloseBox)

Runway Gen-3 Alphaで40秒までの動画生成ができるようになったので、試してみました。

Googleの新画像生成AI『ImageFX』が考える非実在日本アイドル史(1968~83)。超リアルだが全部偽物(CloseBox) 画像
テクノロジー

Googleの新画像生成AI『ImageFX』が考える非実在日本アイドル史(1968~83)。超リアルだが全部偽物(CloseBox)

非常に高性能な画像生成AI「ImageFX(Imagen 3)」の登場です。

最高峰の画像生成AI「FLUX.1」で顔LoRA学習(2ドル)したら、AI動画生成も捗った話(CloseBox) 画像
テクノロジー

最高峰の画像生成AI「FLUX.1」で顔LoRA学習(2ドル)したら、AI動画生成も捗った話(CloseBox)

なんといっても現在のトレンドはFLUX.1。これを自分の制作ワークフローに取り入れることができたのでご報告します。

謎の音楽生成AI「LoudMe」登場。Suno激似で作曲し放題、日本語もOK(CloseBox) 画像
テクノロジー

謎の音楽生成AI「LoudMe」登場。Suno激似で作曲し放題、日本語もOK(CloseBox)

SunoとUdioの2強だったボーカル付きAI作曲サービスに新たなライバル「LoudMe」が登場しました。8月15日に発表されたもののあまり話題になっていなかったサービスですが、その実力は相当なもの。実際に試してその実力を探ってみることにします。

10秒のAI動画を17秒で生成。Runway Gen-3 Alpha Turboの7倍高速化とUnlimitedプランでAI動画のワークフロー激変(CloseBox) 画像
テクノロジー

10秒のAI動画を17秒で生成。Runway Gen-3 Alpha Turboの7倍高速化とUnlimitedプランでAI動画のワークフロー激変(CloseBox)

動画生成AIの老舗、Runwayが新しいモデル「Gen-3 Alpha Turbo」を公開しました。これがすごいのです。

XのチャットAI新バージョン「Grok 2 mini(beta)」の画像生成(実はFLUX.1)を使ってみた(CloseBox) 画像
テクノロジー

XのチャットAI新バージョン「Grok 2 mini(beta)」の画像生成(実はFLUX.1)を使ってみた(CloseBox)

イーロン・マスクが8月12日にほのめかしてた、Xと連動した生成AI「Grok」新バージョンGrok 2 mini(beta)の画像生成機能が、自分のアカウントでも使えるようになりました。

動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した(CloseBox) 画像
テクノロジー

動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した(CloseBox)

AIリップシンクにまた大きな波が訪れました。

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に(CloseBox) 画像
テクノロジー

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に(CloseBox)

しばらくベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版がついにリリースされたので、購入しました。

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい?(CloseBox) 画像
テクノロジー

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい?(CloseBox)

1枚の人物画像から動画を生成するAIモデルが4種類、揃いました。Luma AI Dream Machine、Runway Gen-3 Alpha、KLING、Vidu。これらを同じ人物写真(画像)、同じプロンプトで比較してみます。

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか(CloseBox) 画像
テクノロジー

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか(CloseBox)

KLINGのサブスクリプションが開始されたばかりですが、翌日の7月31日に早くもライバルが登場しました。同じく中国の動画生成AIサービスで、「Vidu」というものです。といってもぽっと出ではなく、4月末辺りからSoraクラスの動画生成AIとして発表され、注目はされていました。このViduが一般利用可能になったのです。

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか?(CloseBox) 画像
テクノロジー

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか?(CloseBox)

7月30日、動画生成AIサービスの老舗であるRunwayが、最新モデルであるGen-3 AlphaでImage to Videoを使えるようにしました。

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る(CloseBox) 画像
ガジェット

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る(CloseBox)

動画生成AIはわずか1カ月ちょっとで急激な進化を遂げました。この期間の進化を、人物Image to Videoに絞ってまとめてみます。

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した(CloseBox) 画像
テクノロジー

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した(CloseBox)

音質が爆上がりして長さも2分10秒と完成曲が作りやすくなったUdio。1970年代初期のバラード(ユーミンとか)を作ろうと思ってやってみたら、なぜか昭和歌謡っぽいものを連発してきました。

AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に(CloseBox) 画像
テクノロジー

AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に(CloseBox)

AI作曲サービスのSunoに、ステム分離機能が追加されました。翌日、Udioがステム分離を含む大幅な機能強化。

アジア系に強い新世代動画生成AI「KLING」がやってきたので試した。実用性高く無料生成も可能、静止画KOLORSも使える(CloseBox) 画像
テクノロジー

アジア系に強い新世代動画生成AI「KLING」がやってきたので試した。実用性高く無料生成も可能、静止画KOLORSも使える(CloseBox)

Soraに匹敵する高品質の動画生成AIとして注目を浴びながら、中国の携帯電話番号が必須だったことから世界中の羨望を集めていた、KLINGが一般ユーザーも利用可能になりました。

無限ループ動画が簡単にできる。Luma AIのDream Machineが進化してまた楽しみが増えた(CloseBox) 画像
テクノロジー

無限ループ動画が簡単にできる。Luma AIのDream Machineが進化してまた楽しみが増えた(CloseBox)

ポストSoraというか、ビフォーSoraというか、新世代の動画生成AIも老舗であるRunway Gen-3登場以降、目新しいニュースがなかったのですが、Luma AIのDream Machineがちょっとした新機能を追加しました。

日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった(CloseBox) 画像
テクノロジー

日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった(CloseBox)

AI研究家の清水亮さんが面白いことをやっています。「Lispっぽい記法で書けるけど他の言語に慣れた人にも使える言語」の処理系だそうです。

世界的にWindows死のブルースクリーンが多発する中、Suno AIの歌詞・ビデオ修正機能を試した(CloseBox) 画像
テクノロジー

世界的にWindows死のブルースクリーンが多発する中、Suno AIの歌詞・ビデオ修正機能を試した(CloseBox)

Windows用エンタープライズセキュリティソフトのCrowdStrikeが原因でWindowsが世界的にブルースクリーンが多発している問題が起きているようです。

ラベルレスコーラから1万円切るマンドリンまで。Amazonプライムデーセールで買ったものたち(CloseBox) 画像
ガジェット

ラベルレスコーラから1万円切るマンドリンまで。Amazonプライムデーセールで買ったものたち(CloseBox)

今年最大の大物、Apple Vision Proを購入したばかりですが、今年のプライムデーセールでも買っているのでご紹介。

結局、Apple Vision Pro日本版を買いました。メガネをかけたまま使えるノーズパッドも入手(CloseBox) 画像
ガジェット

結局、Apple Vision Pro日本版を買いました。メガネをかけたまま使えるノーズパッドも入手(CloseBox)

紆余曲折を経てApple Vision Proを買いました。

AIプログラミングにリミックス文化が? Claude Artifacts生成物がページ公開できて自由な改変も可能に(CloseBox) 画像
テクノロジー

AIプログラミングにリミックス文化が? Claude Artifacts生成物がページ公開できて自由な改変も可能に(CloseBox)

Claude ArtifactsにPublish Artifact、Remix Artifactという新機能が追加されました。

万能系Artifacts登場。「Poe Previews」ならGeminiもGPT-4もClaudeもAI共同開発者にできる(CloseBox) 画像
テクノロジー

万能系Artifacts登場。「Poe Previews」ならGeminiもGPT-4もClaudeもAI共同開発者にできる(CloseBox)

このところプログラミングの楽しみを覚えて毎日Claude ArtifactsとChatGPT Artifactsで遊んでいる筆者ですが、またまた新しいツールに出会ってしまいました。

ChatGPT Artifactsができた? GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ(CloseBox) 画像
テクノロジー

ChatGPT Artifactsができた? GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ(CloseBox)

大規模言語モデルのClaudeが送り出した新機能、Artifactsを使った記事が思いのほか好評のようですが、問題が一つ。使用量制限がかかってしまい、次のアクションまで数時間待たされることが頻発しているのです。

45年前の初代ウォークマンからiPod、iPhoneと進化した音楽リスニング体験。Suno AI公式アプリの登場でどう変わるか(CloseBox) 画像
テクノロジー

45年前の初代ウォークマンからiPod、iPhoneと進化した音楽リスニング体験。Suno AI公式アプリの登場でどう変わるか(CloseBox)

45年前に発売された革命的デバイス、ウォークマン。そのアニバーサリーにふさわしいエポックメイキングなアプリが登場しました。

現実と超現実を動画AIが描く「Gen-3 Alpha」にできること、できないこと。老舗Runwayが投入したSora世代の高性能動画生成AI(CloseBox) 画像
テクノロジー

現実と超現実を動画AIが描く「Gen-3 Alpha」にできること、できないこと。老舗Runwayが投入したSora世代の高性能動画生成AI(CloseBox)

動画生成AIでは老舗のRunwayがGen-3 Alphaを一般公開しました。使えるユーザーはStandardプラン以上。筆者はそれに該当しているので使ってみました。

ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える(CloseBox) 画像
テクノロジー

ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える(CloseBox)

ノンプログラマーな自分が、大規模言語モデル(LLM)の助力で、初めてまともに動くプログラムを完成させることができました。