Generative AI

テクノロジー 2023 Nov 6

文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説（生成AIウィークリー）

その週の重要論文5本を解説する連載。今回は、OpenAIの文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで自分の声を別人の声に即時変換するモデル「LLVC」など。

山下裕毅（Seamless）

テクノロジー 2023 Nov 3

スカーレット・ヨハンソン、AI生成フェイク広告に法的措置。似せた顔と声でアプリを宣伝

俳優のスカーレット・ヨハンソンが、AI画像生成アプリ『Lisa AI: 90s Yearbook & Avatar』の広告にAI生成した自身の肖像と声が使われていることに対して法的措置を講じ、取り下げさせました。

Munenori Taniguchi

テクノロジー 2023 Nov 2

ビートルズ最後の新曲「Now And Then」はどのように現代に復活したか。公式ドキュメンタリーで分かったAIの貢献（CloseBox）

ビートルズの「新曲」が11月3日に公開されます。その制作ドキュメンタリーが本日公開され、その曲の一部を聴くことができましたので、そこでどんなことが行われていたのかをまとめ

松尾公也

テクノロジー 2023 Oct 30

画像内キャラを3D変換する強力モデル「Zero123++」、文章から高品質3Dモデル生成するAI「DreamCraft3D」など重要論文5本を解説（生成AIウィークリー）

今回は3Dモデルで大きな躍進がありました。画像1枚から3Dモデルを高品質に生成する拡散モデル「Zero123++」をはじめとする、生成AI最新論文の概要5つをお届けします。

山下裕毅（Seamless）

テクノロジー 2023 Oct 25

生成AIグラビアをグラビアカメラマンが作るとどうなる？第11回：Stable Diffusion 1.5の注目ModelやLoRAを紹介+α版 (西川和久)

ここのところ、生成AI画像環境構築やアプリの使い方などで3回、顔LoRA制作…と少し重いネタが続いたので、今回は軽めの気になるModelやLoRAを作例と共にご紹介したい。

西川和久

テクノロジー 2023 Oct 23

ベートーヴェンやクレオパトラなど、偉人になりきるAI「Character-LLM」、“グリグリ動かせる3Dシーン”をリアルタイム生成する「4D Gaussian Splatting」など重要論文5本を解説（生成AIウィークリー）

生成AIの重要論文5つを紹介する連載。今回はWeb上のサービスを言語指示でフル活用できるChrome拡張機能を用いたAI「OpenAgents」、偉人を完コピするAI「Character-LLM」など。

山下裕毅（Seamless）

テクノロジー 2023 Oct 23

Python互換言語「Mojo」、Appleシリコンにネイティブ対応したMac版が公開。Pythonの9万倍、C言語に比肩する高速性

今回のAppleシリコンにネイティブ対応したMac版のリリースは、Linux版に続くもの。Windows版のリリース時期は未定です。

新野淳一

テクノロジー 2023 Oct 18

生成AIグラビアをグラビアカメラマンが作るとどうなる？第十回：実在モデルからSDXL用顔LoRAを作る (西川和久)

Modelに無い顔や彼女の顔を出したい！

西川和久

テクノロジー 2023 Oct 17

Pythonの高速スーパーセット「Mojo」がAppleシリコン搭載Macに対応間近。Windowsより先に

Pythonのスーパーセット言語として注目されているMojoは現在Linux版のみ。次はWindows版ではなくMac版になりそうだ。

新野淳一

テクノロジー 2023 Oct 16

アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明（生成AIウィークリー）

アップルらが開発したMultimodal Large Language Modelの「Ferret」など、5本の生成AI関連論文を紹介します。

山下裕毅（Seamless）

テクノロジー 2023 Oct 13

Google検索で直接AIによる画像生成が可能に。米国のSGE登録ユーザー対象

Googleは8月30日より、Google Search labs登録ユーザーを対象に「生成AIによる検索体験（SGE）」の提供を開始していますが、10月12日にこの機能を拡張し、SGEにオプトインしたユーザーは、通常のGoogle検索バーからAIによる画像生成を行うことが可能になりました。

Munenori Taniguchi

テクノロジー 2023 Oct 12

生成AI時代の新技術てんこ盛り。Adobe MAX 2023「Sneaks」を深掘りする（西田宗千佳）

今年も、Adobeの年次イベント「Adobe MAX 2023」の取材で米ロサンゼルスに来ている。Adobeのイベントでは多数の新技術が発表になるが、やはり「華」でありハイライトは、開発途上の技術を先出しする「Sneaks」だ。

西田宗千佳

テクノロジー 2023 Oct 11

生成AIグラビアをグラビアカメラマンが作るとどうなる？第九回：Fooocus-MREでimage-2-imageやControlNetを試す (西川和久)

■画像生成は出来たけど…何かもう一捻りしたい！

西川和久

テクノロジー 2023 Oct 9

どんなに長い文章でも破綻しない生成AI「StreamingLLM」、キャラクターの性格や話し方を模倣するAIなど重要論文5本を解説（生成AIウィークリー）

生成AIの重要論文を解説する連載。今回は、大規模言語モデルでどんなに長い文章でも破綻しない手法、キャラクターの性格や話し方を模倣するAIなど紹介します。

山下裕毅（Seamless）

文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説（生成AIウィークリー）

スカーレット・ヨハンソン、AI生成フェイク広告に法的措置。似せた顔と声でアプリを宣伝

ビートルズ最後の新曲「Now And Then」はどのように現代に復活したか。公式ドキュメンタリーで分かったAIの貢献（CloseBox）

画像内キャラを3D変換する強力モデル「Zero123++」、文章から高品質3Dモデル生成するAI「DreamCraft3D」など重要論文5本を解説（生成AIウィークリー）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第11回：Stable Diffusion 1.5の注目ModelやLoRAを紹介+α版 (西川和久)

ベートーヴェンやクレオパトラなど、偉人になりきるAI「Character-LLM」、“グリグリ動かせる3Dシーン”をリアルタイム生成する「4D Gaussian Splatting」など重要論文5本を解説（生成AIウィークリー）

Python互換言語「Mojo」、Appleシリコンにネイティブ対応したMac版が公開。Pythonの9万倍、C言語に比肩する高速性

生成AIグラビアをグラビアカメラマンが作るとどうなる？第十回：実在モデルからSDXL用顔LoRAを作る (西川和久)

Pythonの高速スーパーセット「Mojo」がAppleシリコン搭載Macに対応間近。Windowsより先に

アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明（生成AIウィークリー）

Google検索で直接AIによる画像生成が可能に。米国のSGE登録ユーザー対象

生成AI時代の新技術てんこ盛り。Adobe MAX 2023「Sneaks」を深掘りする（西田宗千佳）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第九回：Fooocus-MREでimage-2-imageやControlNetを試す (西川和久)

どんなに長い文章でも破綻しない生成AI「StreamingLLM」、キャラクターの性格や話し方を模倣するAIなど重要論文5本を解説（生成AIウィークリー）

テクノエッジへのご寄付のお願い

AI時代の自作PCを極める！西川善司さんと学ぶオンラインワークショップ

テクノエッジ創刊のご挨拶

西川善司のバビンチョなテクノコラム（西川善司）

生成AIグラビアをグラビアカメラマンが作るとどうなる？（西川和久）

人知れず消えていったマイナーCPUを語ろう（大原雄介）

Google Tales（佐藤由紀子）

てくのじ何でも実験室（宮里圭介）