Generative AI

テクノロジー 2023 Dec 18

「Suno」と一味違う音楽生成AI登場。音楽から新しい音楽をパート毎に生成「StemGen」、着せ替えAI「Outfit Anyone」など重要論文5本を解説（生成AIウィークリー）

音楽生成に新たな展開が。Music to Musicによる生成をパートごとに出せる技術が登場しています。生成AIに関する論文5つを紹介します。

山下裕毅（Seamless）

テクノロジー 2023 Dec 15

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので（CloseBox）

AI作曲サービスSunoのUIがガラリと変わったので、使い方をまとめてみました。

松尾公也

テクノロジー 2023 Dec 14

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった（CloseBox）

Suno短期連載第3弾。Suno + ChatGPT + Stable Diffusionを連携させてAI楽曲を作る試みです。

松尾公也

テクノロジー 2023 Dec 14

生成AIグラビアをグラビアカメラマンが作るとどうなる？第14回：2023年下半期まとめ+α　13回分を振り返る (西川和久)

生成AIは技術の進歩/進化が凄まじいペースで数ヶ月前はもうかなり古い話になることもあり、今回はこれまでの13回分をまとめてみたい。　

西川和久

テクノロジー 2023 Dec 13

生成AI「Suno」が作った楽曲は再利用できる？　分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）

Sunoで作った楽曲を音源分離し、再構築して歌ってみました。そこで、Suno以降の音楽制作と音楽体験のあり方について考えてみました。

松尾公也

テクノロジー 2023 Dec 11

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した（CloseBox）

感動できるボーカル曲をAIがほぼ一発で生成できるようになりました。

松尾公也

テクノロジー 2023 Dec 11

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説（生成AIウィークリー）

今週は重要論文が多くて6本です。画像の深度情報を推定する技術を大幅に進化させた「Marigold」などの生成AIの最新情報をお届けします。

山下裕毅（Seamless）

テクノロジー 2023 Dec 11

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし（Google Tales）

動画がすごすぎると話題を呼んだGoogle Gemini Ultraですが……。

佐藤由紀子

テクノロジー 2023 Dec 7

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

日本時間12月7日、Googleは新開発のAIモデル「Gemini」を発表しました。モバイル機器からデータセンターまで、あらゆる用途に対応すべく、Gemini Ultra、Gemini Pro、Gemini Nanoの3種類を用意しています。

Munenori Taniguchi

テクノロジー 2023 Dec 6

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。

kogu

テクノロジー 2023 Dec 6

現実の魔法具、iPhoneサイズの立体映像装置「Looking Glass Go」。2台も買って何をするのか（CloseBox）

手のひらに乗る立体視ディスプレイ「Looking Glass Go」を2台買ってしまいました。その理由は……。

松尾公也

テクノロジー 2023 Dec 4

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説（生成AIウィークリー）

先週大きな話題となった、画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」など5本の生成AI論文を紹介。

山下裕毅（Seamless）

テクノロジー 2023 Nov 30

ChatGPTに同じ言葉を連呼させると、壊れて学習データ(個人情報入り)を吐き出す？Google DeepMind研究者らのチームが論文発表

Google DeepMindや複数の大学の研究者からなるチームが、AI企業に対し、単純な攻撃がプライバシー関連の問題を起こす可能性があるとして、大規模言語モデル（LLM）をリリースする前に内部や第三者による安全性テストを実施するよう求めています。

Munenori Taniguchi

テクノロジー 2023 Nov 27

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える？　アクセサリは？

元アップル社員が開発し、OpenAIのサム・アルトマンも出資したと話題になっていたAIウェアラブルがついに発売（米国のみ）。これを購入できた五島正浩さんに、購入時の様子をレポートしてもらいました。

五島正浩

「Suno」と一味違う音楽生成AI登場。音楽から新しい音楽をパート毎に生成「StemGen」、着せ替えAI「Outfit Anyone」など重要論文5本を解説（生成AIウィークリー）

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので（CloseBox）

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第14回：2023年下半期まとめ+α　13回分を振り返る (西川和久)

生成AI「Suno」が作った楽曲は再利用できる？　分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した（CloseBox）

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説（生成AIウィークリー）

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし（Google Tales）

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

現実の魔法具、iPhoneサイズの立体映像装置「Looking Glass Go」。2台も買って何をするのか（CloseBox）

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説（生成AIウィークリー）

ChatGPTに同じ言葉を連呼させると、壊れて学習データ(個人情報入り)を吐き出す？Google DeepMind研究者らのチームが論文発表

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える？　アクセサリは？

テクノエッジへのご寄付のお願い

AI時代の自作PCを極める！西川善司さんと学ぶオンラインワークショップ

テクノエッジ創刊のご挨拶

西川善司のバビンチョなテクノコラム（西川善司）

生成AIグラビアをグラビアカメラマンが作るとどうなる？（西川和久）

人知れず消えていったマイナーCPUを語ろう（大原雄介）

Google Tales（佐藤由紀子）

てくのじ何でも実験室（宮里圭介）

Generative AI

「Suno」と一味違う音楽生成AI登場。音楽から新しい音楽をパート毎に生成「StemGen」、着せ替えAI「Outfit Anyone」など重要論文5本を解説（生成AIウィークリー）

作曲歌唱AI「Suno」、今からでも間に合う制作マニュアル。やり方がちょっと変わったので（CloseBox）

AI作曲でマルチモーダル活用。Suno + ChatGPT + Stable Diffusionを連携させたらエモくなった（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第14回：2023年下半期まとめ+α 13回分を振り返る (西川和久)

生成AI「Suno」が作った楽曲は再利用できる？ 分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）

「人のぬくもり、理解できない」AI「Suno」が作詞・作曲・演奏し、歌う美しいバラードに感動した（CloseBox）

写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説（生成AIウィークリー）

Googleの新AIモデル「Gemini」。Ultraすごいマルチモーダルデモの種明かし（Google Tales）

Google、新AIモデル「Gemini」発表。動画もネイティブに理解するマルチモーダル、Pixel 8 Proにも導入へ

AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

現実の魔法具、iPhoneサイズの立体映像装置「Looking Glass Go」。2台も買って何をするのか（CloseBox）

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説（生成AIウィークリー）

ChatGPTに同じ言葉を連呼させると、壊れて学習データ(個人情報入り)を吐き出す？Google DeepMind研究者らのチームが論文発表

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える？ アクセサリは？

生成AIグラビアをグラビアカメラマンが作るとどうなる？第14回：2023年下半期まとめ+α　13回分を振り返る (西川和久)

生成AI「Suno」が作った楽曲は再利用できる？　分解して想像した、「Suno以降」の音楽制作と音楽体験（CloseBox）

Humaneのバッジ型AIウェアラブル「Ai Pin」を注文してわかったこと。米国外で使える？　アクセサリは？