Generative AI

Windows 11の「ペイント」大進化。26日に画像生成AIや背景除去、レイヤー機能を含むアップデート配信 画像
ガジェット

Windows 11の「ペイント」大進化。26日に画像生成AIや背景除去、レイヤー機能を含むアップデート配信

米マイクロソフトは9月21日(現地時間)に開催したスペシャルイベントで、26日にWindows 11の最新アップデートを実施すると発表しました。

AI画像生成ツール「DALL・E 3」発表。ChatGPTとの統合で対話的に生成し、プロンプトの理解度向上も 画像
テクノロジー

AI画像生成ツール「DALL・E 3」発表。ChatGPTとの統合で対話的に生成し、プロンプトの理解度向上も

OpenAIが、AI画像生成ツールの新バージョン「DALL・E 3」を発表しました。DALL・E 3は、入力したテキスト文を従来より忠実に、生成するアートへ反映することが可能になっています。

“好きな人の声”のオーディオブックを電子書籍から作るAI、AI画像を超高速生成する「InstaFlow」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

“好きな人の声”のオーディオブックを電子書籍から作るAI、AI画像を超高速生成する「InstaFlow」など重要論文5本を解説(生成AIウィークリー)

生成AIの注目すべき論文を解説する連載。今週は、マイクロソフトによる、“好きな人の声”のオーディオブックを電子書籍から作るAI、0.09秒で画像を生成するAI「InstaFlow」など。

Photoshopに心から感謝を。生成AI「Firefly」が大事な1枚の写真を甦らせてくれました(CloseBox) 画像
テクノロジー

Photoshopに心から感謝を。生成AI「Firefly」が大事な1枚の写真を甦らせてくれました(CloseBox)

この写真は部分的に欠けているけど、残りを見たい。そんな大事な写真をお持ちの方は、Photoshopを使うといいです。

Stable Diffusion開発元によるAI音楽生成サービス「Stable Audio」の可能性(CloseBox) 画像
テクノロジー

Stable Diffusion開発元によるAI音楽生成サービス「Stable Audio」の可能性(CloseBox)

Stable Audioという新しい生成AIサービスが始まりました。さっそく使ってみました。

Adobe、無料ですぐ使える画像生成AI『Firefly』ウェブ版提供開始。Photoshopの「生成塗りつぶし」「生成拡張」も。権利クリア画像で学習 画像
テクノロジー

Adobe、無料ですぐ使える画像生成AI『Firefly』ウェブ版提供開始。Photoshopの「生成塗りつぶし」「生成拡張」も。権利クリア画像で学習

Adobeが独自の画像生成AI『Firefly』の正式提供を開始しました。

忘れられない人とのデュエットが、映像でも。それを実現してくれたAIサービス「HeyGen」のさらなる野望(CloseBox) 画像
テクノロジー

忘れられない人とのデュエットが、映像でも。それを実現してくれたAIサービス「HeyGen」のさらなる野望(CloseBox)

静止画とオーディオがあればリップシンクができる動画技術を使い、長年の夢を実現しました。その一方で、ディープフェイク悪用の可能性がある技術も登場しています。

生成AIに高校スポーツ記事を書かせた大手新聞社、誤りや品質の苦情続き一時取り下げ。所属記者も「掲載すべきでなかった」と発言 画像
テクノロジー

生成AIに高校スポーツ記事を書かせた大手新聞社、誤りや品質の苦情続き一時取り下げ。所属記者も「掲載すべきでなかった」と発言

米国の新聞社Gannettは8月、AIが生成した地域の高校スポーツ大会の結果を伝える複数の記事が、非常に不自然な文章構成になっていたり、誤りや文章生成に失敗していると読者から指摘され問題化したのを受け、該当する記事のチェックと更新を行っています。

“最適化”した回答を出すGoogleの言語モデル「OPRO」、3D都市を無制限に生成するAI「CityDreamer」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

“最適化”した回答を出すGoogleの言語モデル「OPRO」、3D都市を無制限に生成するAI「CityDreamer」など重要論文5本を解説(生成AIウィークリー)

1週間分のAI論文をまとめる生成AIウィークリーは、“最適化”した回答を出すGoogleの言語モデル「OPRO」、無制限に3D都市を生成するAI「CityDreamer」など重要論文5本を解説しています。

妻の歌声を合成して10年が経って、本人不在のミュージックビデオがAIでこんな感じになりました(CloseBox) 画像
テクノロジー

妻の歌声を合成して10年が経って、本人不在のミュージックビデオがAIでこんな感じになりました(CloseBox)

9月はいろいろ個人的なイベントがあります。自分の誕生日と、その前日の結婚記念日がまずあって、まあそれはもう誰も祝う人がいないので一人でケーキを買ってきたり英国リバプールの郷土料理であるスカウスを、クックパッドに残された妻のレシピで作ったりしています。

1本50円で外注できるAIソフトウェア開発環境「ChatDEV」、人の声を理解する言語モデル「LLaSM」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

1本50円で外注できるAIソフトウェア開発環境「ChatDEV」、人の声を理解する言語モデル「LLaSM」など重要論文5本を解説(生成AIウィークリー)

先週発表されたAI関連論文から、50円で外注できるAIソフトウェア開発会社「ChatDEV」、人の声を理解する言語モデル「LLaSM」など5本を解説します。

これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales) 画像
テクノロジー

これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales)

待望の「Search Generative Experience」が8月30日に日本とインドでも使えるようになりました。5月から使えていた米国以外で使えるようになったのは、今のところこの2カ国のみだそうです。

Google「Duet AI」サービス多数発表。Gmail代筆やMeet議事録、データ分析からコード生成まで全面採用(Google Cloud Next '23) 画像
テクノロジー

Google「Duet AI」サービス多数発表。Gmail代筆やMeet議事録、データ分析からコード生成まで全面採用(Google Cloud Next '23)

開催中のイベント「Google Cloud Next '23」で発表されたサービス群の刷新はAI「Duet AI」を冠したものだ。

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) 画像
テクノロジー

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox)

「使い方を誤ればティープフェイクの音声版にもなり得る」とまでマイクロソフトが危険視していた技術が別の開発者によってオープンソース公開されました。