AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第19回:ComfyUIで最新のStable Cascadeを試す+アナログ風の後処理ProPost (西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第19回:ComfyUIで最新のStable Cascadeを試す+アナログ風の後処理ProPost (西川和久)

前回標準のWorkflowにLoRAを追加してみたが、今回は画像が出来た後、つまり後処理用のNodeを追加してみたい。

生成AIおじさんをおじさん好きが作るとどうなる?(第2回) なぜおじさんを生成するのか 画像
AI

生成AIおじさんをおじさん好きが作るとどうなる?(第2回) なぜおじさんを生成するのか

今回は、なぜおじさんをAIで生成するのか、そこから何を得たいのか、その理由について語ります。

Suno AI作曲のV3はインストOK、2分の曲を20秒で作曲。音質も向上したアルファ版が生み出す名曲が時間を溶かす(CloseBox) 画像
AI

Suno AI作曲のV3はインストOK、2分の曲を20秒で作曲。音質も向上したアルファ版が生み出す名曲が時間を溶かす(CloseBox)

AI作曲サービスのSunoのバージョン2を大幅に改良したバージョン3(V3)のアルファ版が、有償プランであるProとPremiumユーザー向けに提供開始されたので試してみました。

音楽含むマルチモーダルAIモデル「AnyGPT」、AIの“パラメータ”を生成するAI「P-diff」など重要論文5本を解説(生成AIウィークリー) 画像
AI

音楽含むマルチモーダルAIモデル「AnyGPT」、AIの“パラメータ”を生成するAI「P-diff」など重要論文5本を解説(生成AIウィークリー)

今週の生成AIウィークリーは、AIの“パラメータ”を生成するAI「P-diff」、過去最高精度のリアルタイム物体検出器「YOLOv9」など重要論文5本を解説します。

Google、企業向け生成AI『Gemini for Google Workspace』提供開始。GmailやDocs、シート等をAIがアシスト 画像
AI

Google、企業向け生成AI『Gemini for Google Workspace』提供開始。GmailやDocs、シート等をAIがアシスト

Googleは2月21日(現地時間)、Google WorkspaceユーザーがGmailやドキュメント、スライド、スプレッドシート、MeetでGeminiを利用できるGemini for Google Workspaceの提供を開始しました。

GoogleのGemini AI、多様性に配慮して「黒人ナチスドイツ兵士」や「米国建国を率いた黒人政治家」画像を生成してしまう。改善に取り組むと声明 画像
AI

GoogleのGemini AI、多様性に配慮して「黒人ナチスドイツ兵士」や「米国建国を率いた黒人政治家」画像を生成してしまう。改善に取り組むと声明

Googleの生成AIであるGeminiが、多様性に配慮するあまり「1943年のドイツ軍兵士の画像を作って」に対してナチスドイツ風軍装の黒人男性やアジア人女性の画像を生成してしまい、Googleは歴史的に不正確だったと認める声明を発表するできごとがありました。

Adobeも独自AIアシスタント、PDF文書の要約・質問回答・作成を手伝い。AcrobatとAcrobat Readerに無料ベータ提供 画像
AI

Adobeも独自AIアシスタント、PDF文書の要約・質問回答・作成を手伝い。AcrobatとAcrobat Readerに無料ベータ提供

マイクロソフトがWindowsやOfficeに生成AIアシスタントCopilotを組み込み、Googleも独自AIのBard改めGeminiで検索からGmail・カレンダー・マップ等々をこれまでになく使いやすくすると宣言する状況に、従来からAIに注力してきたAdobe が黙っているわけはありません。

天の川銀河の中心を指し示すiPhoneアプリ『Galactic Compass』公開。開発者はChatGPTの助けを借りて制作 画像
Space

天の川銀河の中心を指し示すiPhoneアプリ『Galactic Compass』公開。開発者はChatGPTの助けを借りて制作

デザイナーのマット・ウェッブ氏は先週木曜日、天の川銀河の中心を矢印で指し示す、無料のiPhone向けARアプリ『Galactic Compass』をApp Storeに公開しました。

CES 2024報告会&テクノエッジ新年会を開催しました(動画あり) 画像
AI

CES 2024報告会&テクノエッジ新年会を開催しました(動画あり)

CES 2024報告会&テクノエッジ新年会を開催しました。

Google、AIでファイル種類を高速正確に判別する「Magika」をオープンソース公開 画像
AI

Google、AIでファイル種類を高速正確に判別する「Magika」をオープンソース公開

AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をGoogleがオープンソースで公開。

画像生成AI「Stable Diffusion」の基本から最新テクニックまで。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第5回)参加者募集 画像
AI

画像生成AI「Stable Diffusion」の基本から最新テクニックまで。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第5回)参加者募集

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第4回を1月23日に開催いたします。なお、今回お申し込みいただいた方は、第3回分の動画アーカイブを視聴いただけます。

さよなら吟遊詩人。Bardから双子のGeminiにバトンタッチしたGoogleのAIはどう変わったのか(Google Tales) 画像
AI

さよなら吟遊詩人。Bardから双子のGeminiにバトンタッチしたGoogleのAIはどう変わったのか(Google Tales)

GoogleのAIはBardからGeminiに変わりました。名前以外にどこが変わったのかをまとめてみました。

1時間超のYouTubeを解釈できるオープンなマルチモーダルAI「LWM」、Windowsをプロンプトで自動操作するMS製AI「UFO」など重要論文5本を解説(生成AIウィークリー) 画像
AI

1時間超のYouTubeを解釈できるオープンなマルチモーダルAI「LWM」、Windowsをプロンプトで自動操作するMS製AI「UFO」など重要論文5本を解説(生成AIウィークリー)

1週間分の生成AI関連論文の中から重要なものをピックアップする連載。今回は、Gemini 1.5、LoRA改良版、WindowsのAIエージェント、長時間動画にも対応するマルチモーダルAIなど5本を紹介します。

マルチモーダルAIメガネ『Frame』詳細。39gにOLED画面とカメラ搭載、見たものを翻訳やナビなど。4月出荷で予約受付中 画像
ウェアラブル

マルチモーダルAIメガネ『Frame』詳細。39gにOLED画面とカメラ搭載、見たものを翻訳やナビなど。4月出荷で予約受付中

シンガポールのAIデバイス企業 Brilliant Labs が、メガネ型端末「Frame」を発表しました。

OpenAI、文章から驚異的品質の動画を生成するモデル「Sora」発表。試せる一般公開はまだ先、世界を描ける汎用の生成AIレンダラになり得るか 画像
AI

OpenAI、文章から驚異的品質の動画を生成するモデル「Sora」発表。試せる一般公開はまだ先、世界を描ける汎用の生成AIレンダラになり得るか

OpenAIから新しい動画生成モデル「Sora」が発表され、合わせて技術レポートも公開されました。Soraはテキストから最長1分の動画を生成できるモデルで、画像から動画の生成や動画の補完も可能。作例を見る限り、現在公開されているどの動画生成モデルよりも優れています。

Slack AI提供開始、長いスレッド要約や会話で検索など。まずはEnterpriseプラン有料アドオンから、日本では4月予定 画像
AI

Slack AI提供開始、長いスレッド要約や会話で検索など。まずはEnterpriseプラン有料アドオンから、日本では4月予定

Slackは2月14日(現地時間)、2023年に予告していた生成AI機能「Slack AI」の一般提供を米国と英国にて開始したと発表しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第18回:バレンタイン編。ComfyUIの環境を整える (西川和久) 画像
Science

生成AIグラビアをグラビアカメラマンが作るとどうなる?第18回:バレンタイン編。ComfyUIの環境を整える (西川和久)

グラビアカメラマンでありソフトウェアエンジニアでもある西川和久氏による生成AI
グラビア実践講座 第18回をお届けします

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」など重要論文5本を解説(生成AIウィークリー) 画像
AI

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」など重要論文5本を解説(生成AIウィークリー)

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」などを解説します。

生成AIで大統領候補のフェイク画像作成、Midjourneyが禁止検討。トランプおよびバイデン両氏を含む 画像
AI

生成AIで大統領候補のフェイク画像作成、Midjourneyが禁止検討。トランプおよびバイデン両氏を含む

Midjourneyは今後1年間、同社の人工知能ソフトウェアを使って政治的な画像を作成すること、特にジョー・バイデン氏とドナルド・トランプ氏の画像生成を禁止することを検討しています。

Google One加入者数が1億人を突破、ピチャイCEOが発表。Gemini AI機能追加で加入者増を狙う 画像
Other

Google One加入者数が1億人を突破、ピチャイCEOが発表。Gemini AI機能追加で加入者増を狙う

米Googleのスンダー・ピチャイCEOは、同社の有料クラウドストレージサービス「Google One」の加入者が1億人を突破したことを発表しました。

Google最高峰AIモデル「Gemini Ultra」解禁。月額2900円のGoogle One新プラン「AIプレミアム」で提供開始 画像
AI

Google最高峰AIモデル「Gemini Ultra」解禁。月額2900円のGoogle One新プラン「AIプレミアム」で提供開始

Googleは新開発したAIモデルの最高峰「Gemini Ultra」の提供を開始しました。また、対話型AIサービスの名前を「Bard」から「Gemini」に変更します。

アップル、文章で画像を編集するAIモデル「MGIE」開発。GitHubにオープンソース公開 画像
AI

アップル、文章で画像を編集するAIモデル「MGIE」開発。GitHubにオープンソース公開

アップルの研究者らが、入力した文章によって画像を編集できるAIモデル「MGIE」を発表、公開しました。MGIEとはMLLM-Guided Image Editingの略で、テキストベースのコマンドを解釈するマルチモーダル大規模言語モデル(MLLM)を使用しています。

マイクロソフト、Copilot(新しいBing)1周年で刷新。スーパーボウルCMも放送 画像
AI

マイクロソフト、Copilot(新しいBing)1周年で刷新。スーパーボウルCMも放送

Microsoftは2月7日(現地時間)、AIを搭載した新しいBing検索(現在のCopilot)の提供開始から1周年を記念し、Copilotのアップデートを発表しました。

米Amazonがショッピング向けAIアシスタント「Rufus」発表。製品カタログやレビューなどをもとに買い物をサポート 画像
AI

米Amazonがショッピング向けAIアシスタント「Rufus」発表。製品カタログやレビューなどをもとに買い物をサポート

米Amazonは2月2日(現地時間)、ショッピング向けのAIアシスタント「Rufus」を発表しました。米国でAmazonのモバイルアプリを利用する一部ユーザーに対してベータ版が提供開始されており、今後数週間のうちに米国のさらに多くのユーザーに展開されるとのことです。

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説(生成AIウィークリー) 画像
AI

スマホ高品質画像生成、わずか0.2秒で。Google「MobileDiffusion」がiPhone 15 Proで達成。重要論文5本を解説(生成AIウィークリー)

iPhone 15 Proで0.2秒以内に高品質な512×512画像を生成することにGoogleが成功。生成AIに関する最新論文5本を解説します。

生成AIおじさんをおじさん好きが作るとどうなる?(第1回) ありふれたモチーフ「おじさん」を生成するための手法 画像
AI

生成AIおじさんをおじさん好きが作るとどうなる?(第1回) ありふれたモチーフ「おじさん」を生成するための手法

生成AIによりおじさんの画像を作り出すためのツールや生成のコツのようなものをご紹介します。

Googleの会話AI『Bard』、賢いGemini Proが日本語でも利用可能に。回答のダブルチェックも対応 画像
AI

Googleの会話AI『Bard』、賢いGemini Proが日本語でも利用可能に。回答のダブルチェックも対応

GoogleのチャットAIサービスBardで、日本語でもGemini Proを利用可能になりました。

「アップルAI」は今年発表へ、クックCEOが明言。WWDCでLLM版 Siri搭載のiOS 18発表? 画像
スマートフォン

「アップルAI」は今年発表へ、クックCEOが明言。WWDCでLLM版 Siri搭載のiOS 18発表?

アップルが未発表製品に関して言及することは、厳しい秘密主義のためか滅多にありません。

サムスン、生成AI機能Galaxy AI はS23やZ Fold5 / Flip5 など既存モデルにも提供。有料化は未定 画像
スマートフォン

サムスン、生成AI機能Galaxy AI はS23やZ Fold5 / Flip5 など既存モデルにも提供。有料化は未定

サムスンの最新フラッグシップ・スマートフォンGalaxy S24シリーズでは、生成AIの「Galaxy AI」が大きなセールスポイントとなっています。

Mac生誕40周年。人々を徐々に変えていった稀有なマシンのこと(CloseBox) 画像
PC

Mac生誕40周年。人々を徐々に変えていった稀有なマシンのこと(CloseBox)

Mac雑誌の創刊を経験したことのある、それなりに長いMacとの関わりを持つ筆者が、Macの40年を個人的な関わりから振り返ります。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第17回:新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久) 画像
Science

生成AIグラビアをグラビアカメラマンが作るとどうなる?第17回:新技術をすぐ試せるComfyUIのインストール・使いかた (西川和久)

Stable Diffusionで生成AI画像を作る時、もっとも一般的なインターフェースはAUTOMATIC1111だろう。デファクトスタンダードと言ってもいいほどで、検索すると、インストール方法や使い方など、それこそ山盛り出てくる。ところが最近、ComfyUIがちょっとした人気だ。

日本HP、Core Ultra搭載の2 in 1「Spectre x360」&ゲーミングノート「OMEN」発表。AI PCに先駆けるAIテクノロジー内蔵PC 画像
PC

日本HP、Core Ultra搭載の2 in 1「Spectre x360」&ゲーミングノート「OMEN」発表。AI PCに先駆けるAIテクノロジー内蔵PC

2024年1月18日、日本HPが2024年度の事業説明会を開始し、同時にCore Ultra搭載のプレミアム2in1「HP Spectre x360 14」、「HP Spectre x360 16」およびゲーミングノートPC「HP Omen Transcend 14」の国内向けの発表を行いました。

中国向けGalaxy S24シリーズ、AI機能はGoogleではなく百度の「Ernie 4.0」に。製品ページにもGoogleへの言及なし 画像
スマートフォン

中国向けGalaxy S24シリーズ、AI機能はGoogleではなく百度の「Ernie 4.0」に。製品ページにもGoogleへの言及なし

サムスンの最新フラッグシップスマートフォン Galaxy S24シリーズは、「Galaxy AI」搭載が特徴のひとつです。それら機能の多くは、Googleの大規模言語モデルGemini Proと画像生成モデル Imagen 2をクラウド経由で活用するもの。しかし、サムスンは中国向けGalaxy S24シリーズにはGeminiではなく、現地企業の百度(Baidu)が開発したAIチャットボット「Ernie 4.0」を採用したことを発表しました。

アーティストのAIへの反発をどう考える? 台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました(CloseBox) 画像
AI

アーティストのAIへの反発をどう考える? 台北当代芸術館のAIアート展覧会「Hello Human!」で、キュレーターにAIアートの課題を聞きました(CloseBox)

台湾の台北当代芸術館(MoCA TAIPEI)で開催されているAIアート展覧会「你好,人類!Hello, Human!」にアーティストとして参加。この展示会のキュレータにAIとアートの関係について聞いてきました。

Amazonが服の仮想試着AI「Diffuse to Choose」、画像内の物体分離指示できる「Grounded SAM」、動画の高品質な奥行き推定「Depth Anything」など重要論文6本を解説(生成AIウィークリー) 画像
AI

Amazonが服の仮想試着AI「Diffuse to Choose」、画像内の物体分離指示できる「Grounded SAM」、動画の高品質な奥行き推定「Depth Anything」など重要論文6本を解説(生成AIウィークリー)

今回の生成AI論文解説はいつもより1本多い、6本分です。中でもAmazonのバーチャル試着技術は実用性が高そうです。

伝説のコメディアンをAIで「復活」させたYouTube番組を遺族が提訴「不謹慎な人間が作った粗悪な模造品」 画像
AI

伝説のコメディアンをAIで「復活」させたYouTube番組を遺族が提訴「不謹慎な人間が作った粗悪な模造品」

米国の伝説的スタンダップコメディアン、ジョージ・カーリンの声をAIで模倣して製作された1時間のYouTube番組に対し、カーリンの娘は「偉大な米国人アーティストの業績」を盗んだとして、遺産管理団体を通じて著作権侵害とパブリシティ権侵害の訴訟を起こしました。

Google、Chromeのタブ増えすぎ問題をAIで解決。スマートタブ整理やどこでも文例生成など3つの実験AI機能を導入 画像
AI

Google、Chromeのタブ増えすぎ問題をAIで解決。スマートタブ整理やどこでも文例生成など3つの実験AI機能を導入

米Googleはデスクトップ用Chromeブラウザの最新版「M121」をリリースし、実験的な生成AI機能を3つ導入すると発表しました。

GPT-4のコード生成精度を2倍以上向上させる「AlphaCodium」、写真1枚から本人性を維持した画像を量産できる「InstantID」など重要論文5本を解説(生成AIウィークリー) 画像
AI

GPT-4のコード生成精度を2倍以上向上させる「AlphaCodium」、写真1枚から本人性を維持した画像を量産できる「InstantID」など重要論文5本を解説(生成AIウィークリー)

PhotoMakerのライバルともいうべき技術やAppleのLLMなど、生成AI最新論文の概要5つを紹介します。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第16回:指問題解決!?Hand Refiner (西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第16回:指問題解決!?Hand Refiner (西川和久)

Hand Refinerは2023年12月1日に論文、その後、2024年1月初旬にAUTOMATIC1111のADetailerとComfyUIで使用可能になった手(指)に関する新手法だ。今回ご紹介するHand Refinerはかなりロジカル。具体的には、画像から手を認識、認識した位置での形や5本指などリファレンスになる手を深度情報で取得、その深度情報を使って手をInpaintする、ざっくりこの3段構えとなる。

Steamが生成AI使用ゲーム全面禁止から原則受け入れに転換。理由と影響をゲーム開発者目線で考える 画像
AI

Steamが生成AI使用ゲーム全面禁止から原則受け入れに転換。理由と影響をゲーム開発者目線で考える

PC向けゲーム配信プラットフォーム最大手のSteamがAIコンテンツについての新たな方針を発表しました。生成AIを用いて作られた大半のゲームを受け入れるという大きな変更です。

空間AIディスプレイ #LookingGlassGo 、CES 2024報告会イベントで体験できます。日本戦略担当 GOROman氏が語るセッションも 画像
AI

空間AIディスプレイ #LookingGlassGo 、CES 2024報告会イベントで体験できます。日本戦略担当 GOROman氏が語るセッションも

日本を代表するテクノロジージャーナリスト各氏をお招きするCES 2024報告会&テクノエッジ新年会イベント、いよいよ今週末1月19日(金)開催です。

最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた(CloseBox) 画像
AI

最低1枚の元写真があれば、高品質本人画像をすぐに生成できる「PhotoMaker」を試したらお手軽すぎた(CloseBox)

最低1枚の写真があれば、その人物の画像をいくらでも生成できる。そんな技術が登場したので使ってみた。