その週の重要論文5本を解説する連載。今回は、OpenAIの文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで自分の声を別人の声に即時変換するモデル「LLVC」など。
俳優のスカーレット・ヨハンソンが、AI画像生成アプリ『Lisa AI: 90s Yearbook & Avatar』の広告にAI生成した自身の肖像と声が使われていることに対して法的措置を講じ、取り下げさせました。
ビートルズの「新曲」が11月3日に公開されます。その制作ドキュメンタリーが本日公開され、その曲の一部を聴くことができましたので、そこでどんなことが行われていたのかをまとめ
今回は3Dモデルで大きな躍進がありました。画像1枚から3Dモデルを高品質に生成する拡散モデル「Zero123++」をはじめとする、生成AI最新論文の概要5つをお届けします。
ここのところ、生成AI画像環境構築やアプリの使い方などで3回、顔LoRA制作…と少し重いネタが続いたので、今回は軽めの気になるModelやLoRAを作例と共にご紹介したい。
生成AIの重要論文5つを紹介する連載。今回はWeb上のサービスを言語指示でフル活用できるChrome拡張機能を用いたAI「OpenAgents」、偉人を完コピするAI「Character-LLM」など。
今回のAppleシリコンにネイティブ対応したMac版のリリースは、Linux版に続くもの。Windows版のリリース時期は未定です。
Modelに無い顔や彼女の顔を出したい!
Pythonのスーパーセット言語として注目されているMojoは現在Linux版のみ。次はWindows版ではなくMac版になりそうだ。
アップルらが開発したMultimodal Large Language Modelの「Ferret」など、5本の生成AI関連論文を紹介します。
Googleは8月30日より、Google Search labs登録ユーザーを対象に「生成AIによる検索体験(SGE)」の提供を開始していますが、10月12日にこの機能を拡張し、SGEにオプトインしたユーザーは、通常のGoogle検索バーからAIによる画像生成を行うことが可能になりました。
今年も、Adobeの年次イベント「Adobe MAX 2023」の取材で米ロサンゼルスに来ている。Adobeのイベントでは多数の新技術が発表になるが、やはり「華」でありハイライトは、開発途上の技術を先出しする「Sneaks」だ。
■画像生成は出来たけど…何かもう一捻りしたい!
生成AIの重要論文を解説する連載。今回は、大規模言語モデルでどんなに長い文章でも破綻しない手法、キャラクターの性格や話し方を模倣するAIなど紹介します。