Generative AI

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」など重要論文5本を解説(生成AIウィークリー)

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」などを解説します。

生成AIで大統領候補のフェイク画像作成、Midjourneyが禁止検討。トランプおよびバイデン両氏を含む 画像
テクノロジー

生成AIで大統領候補のフェイク画像作成、Midjourneyが禁止検討。トランプおよびバイデン両氏を含む

Midjourneyは今後1年間、同社の人工知能ソフトウェアを使って政治的な画像を作成すること、特にジョー・バイデン氏とドナルド・トランプ氏の画像生成を禁止することを検討しています。

アップル、文章で画像を編集するAIモデル「MGIE」開発。GitHubにオープンソース公開 画像
テクノロジー

アップル、文章で画像を編集するAIモデル「MGIE」開発。GitHubにオープンソース公開

アップルの研究者らが、入力した文章によって画像を編集できるAIモデル「MGIE」を発表、公開しました。MGIEとはMLLM-Guided Image Editingの略で、テキストベースのコマンドを解釈するマルチモーダル大規模言語モデル(MLLM)を使用しています。

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説(生成AIウィークリー)

iPhone 15 Proで0.2秒以内に高品質な512×512画像を生成することにGoogleが成功。生成AIに関する最新論文5本を解説します。

生成AIおじさんをおじさん好きが作るとどうなる?(第1回) ありふれたモチーフ「おじさん」を生成するための手法 画像
テクノロジー

生成AIおじさんをおじさん好きが作るとどうなる?(第1回) ありふれたモチーフ「おじさん」を生成するための手法

生成AIによりおじさんの画像を作り出すためのツールや生成のコツのようなものをご紹介します。

Googleの会話AI『Bard』、賢いGemini Proが日本語でも利用可能に。回答のダブルチェックも対応 画像
テクノロジー

Googleの会話AI『Bard』、賢いGemini Proが日本語でも利用可能に。回答のダブルチェックも対応

GoogleのチャットAIサービスBardで、日本語でもGemini Proを利用可能になりました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第17回:新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第17回:新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久)

Stable Diffusionで生成AI画像を作る時、もっとも一般的なインターフェースはAUTOMATIC1111だろう。デファクトスタンダードと言ってもいいほどで、検索すると、インストール方法や使い方など、それこそ山盛り出てくる。ところが最近、ComfyUIがちょっとした人気だ。

アーティストのAIへの反発をどう考える? 台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました(CloseBox) 画像
テクノロジー

アーティストのAIへの反発をどう考える? 台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました(CloseBox)

台湾の台北当代芸術館(MoCA TAIPEI)で開催されているAIアート展覧会「你好,人類!Hello, Human!」にアーティストとして参加。この展示会のキュレータにAIとアートの関係について聞いてきました。

Amazonが服の仮想試着AI「Diffuse to Choose」、画像内の物体分離指示できる「Grounded SAM」、動画の高品質な奥行き推定「Depth Anything」など重要論文6本を解説(生成AIウィークリー) 画像
テクノロジー

Amazonが服の仮想試着AI「Diffuse to Choose」、画像内の物体分離指示できる「Grounded SAM」、動画の高品質な奥行き推定「Depth Anything」など重要論文6本を解説(生成AIウィークリー)

今回の生成AI論文解説はいつもより1本多い、6本分です。中でもAmazonのバーチャル試着技術は実用性が高そうです。

伝説のコメディアンをAIで「復活」させたYouTube番組を遺族が提訴「不謹慎な人間が作った粗悪な模造品」 画像
テクノロジー

伝説のコメディアンをAIで「復活」させたYouTube番組を遺族が提訴「不謹慎な人間が作った粗悪な模造品」

米国の伝説的スタンダップコメディアン、ジョージ・カーリンの声をAIで模倣して製作された1時間のYouTube番組に対し、カーリンの娘は「偉大な米国人アーティストの業績」を盗んだとして、遺産管理団体を通じて著作権侵害とパブリシティ権侵害の訴訟を起こしました。

GPT-4のコード生成精度を2倍以上向上させる「AlphaCodium」、写真1枚から本人性を維持した画像を量産できる「InstantID」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

GPT-4のコード生成精度を2倍以上向上させる「AlphaCodium」、写真1枚から本人性を維持した画像を量産できる「InstantID」など重要論文5本を解説(生成AIウィークリー)

PhotoMakerのライバルともいうべき技術やAppleのLLMなど、生成AI最新論文の概要5つを紹介します。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第16回:指問題解決!?Hand Refiner (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第16回:指問題解決!?Hand Refiner (西川和久)

Hand Refinerは2023年12月1日に論文、その後、2024年1月初旬にAUTOMATIC1111のADetailerとComfyUIで使用可能になった手(指)に関する新手法だ。今回ご紹介するHand Refinerはかなりロジカル。具体的には、画像から手を認識、認識した位置での形や5本指などリファレンスになる手を深度情報で取得、その深度情報を使って手をInpaintする、ざっくりこの3段構えとなる。

Steamが生成AI使用ゲーム全面禁止から原則受け入れに転換。理由と影響をゲーム開発者目線で考える 画像
テクノロジー

Steamが生成AI使用ゲーム全面禁止から原則受け入れに転換。理由と影響をゲーム開発者目線で考える

PC向けゲーム配信プラットフォーム最大手のSteamがAIコンテンツについての新たな方針を発表しました。生成AIを用いて作られた大半のゲームを受け入れるという大きな変更です。

最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた(CloseBox) 画像
テクノロジー

最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた(CloseBox)

最低1枚の写真があれば、その人物の画像をいくらでも生成できる。そんな技術が登場したので使ってみた。