Generative AI

「Suno」と一味違う音楽生成AI登場。音楽から新しい音楽をパート毎に生成「StemGen」、着せ替えAI「Outfit Anyone」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

「Suno」と一味違う音楽生成AI登場。音楽から新しい音楽をパート毎に生成「StemGen」、着せ替えAI「Outfit Anyone」など重要論文5本を解説(生成AIウィークリー)

音楽生成に新たな展開が。Music to Musicによる生成をパートごとに出せる技術が登場しています。生成AIに関する論文5つを紹介します。

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので(CloseBox) 画像
テクノロジー

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので(CloseBox)

AI作曲サービスSunoのUIがガラリと変わったので、使い方をまとめてみました。

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった(CloseBox) 画像
テクノロジー

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった(CloseBox)

Suno短期連載第3弾。Suno + ChatGPT + Stable Diffusionを連携させてAI楽曲を作る試みです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第14回:2023年下半期まとめ+α 13回分を振り返る (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第14回:2023年下半期まとめ+α 13回分を振り返る (西川和久)

生成AIは技術の進歩/進化が凄まじいペースで数ヶ月前はもうかなり古い話になることもあり、今回はこれまでの13回分をまとめてみたい。 

生成AI「Suno」が作った楽曲は再利用できる? 分解して想像した、「Suno以降」の音楽制作と音楽体験(CloseBox) 画像
テクノロジー

生成AI「Suno」が作った楽曲は再利用できる? 分解して想像した、「Suno以降」の音楽制作と音楽体験(CloseBox)

Sunoで作った楽曲を音源分離し、再構築して歌ってみました。そこで、Suno以降の音楽制作と音楽体験のあり方について考えてみました。

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した(CloseBox) 画像
テクノロジー

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した(CloseBox)

感動できるボーカル曲をAIがほぼ一発で生成できるようになりました。

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説(生成AIウィークリー) 画像
テクノロジー

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説(生成AIウィークリー)

今週は重要論文が多くて6本です。画像の深度情報を推定する技術を大幅に進化させた「Marigold」などの生成AIの最新情報をお届けします。

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales) 画像
テクノロジー

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし(Google Tales)

動画がすごすぎると話題を呼んだGoogle Gemini Ultraですが……。

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ 画像
テクノロジー

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

日本時間12月7日、Googleは新開発のAIモデル「Gemini」を発表しました。モバイル機器からデータセンターまで、あらゆる用途に対応すべく、Gemini Ultra、Gemini Pro、Gemini Nanoの3種類を用意しています。

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い 画像
テクノロジー

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。

現実の魔法具、iPhoneサイズの立体映像装置「Looking Glass Go」。2台も買って何をするのか(CloseBox) 画像
テクノロジー

現実の魔法具、iPhoneサイズの立体映像装置「Looking Glass Go」。2台も買って何をするのか(CloseBox)

手のひらに乗る立体視ディスプレイ「Looking Glass Go」を2台買ってしまいました。その理由は……。

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー)

先週大きな話題となった、画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」など5本の生成AI論文を紹介。

ChatGPTに同じ言葉を連呼させると、壊れて学習データ(個人情報入り)を吐き出す?Google DeepMind研究者らのチームが論文発表 画像
テクノロジー

ChatGPTに同じ言葉を連呼させると、壊れて学習データ(個人情報入り)を吐き出す?Google DeepMind研究者らのチームが論文発表

Google DeepMindや複数の大学の研究者からなるチームが、AI企業に対し、単純な攻撃がプライバシー関連の問題を起こす可能性があるとして、大規模言語モデル(LLM)をリリースする前に内部や第三者による安全性テストを実施するよう求めています。

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える? アクセサリは? 画像
テクノロジー

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える? アクセサリは?

元アップル社員が開発し、OpenAIのサム・アルトマンも出資したと話題になっていたAIウェアラブルがついに発売(米国のみ)。これを購入できた五島正浩さんに、購入時の様子をレポートしてもらいました。