イーロン・マスク氏が、7月に発表した人工知能開発企業xAIの初のAIモデルを11月4日に公開するとX(Twitter)で発表しました。
俳優のスカーレット・ヨハンソンが、AI画像生成アプリ『Lisa AI: 90s Yearbook & Avatar』の広告にAI生成した自身の肖像と声が使われていることに対して法的措置を講じ、取り下げさせました。
ビートルズの「新曲」が11月3日に公開されます。その制作ドキュメンタリーが本日公開され、その曲の一部を聴くことができましたので、そこでどんなことが行われていたのかをまとめ
今回は3Dモデルで大きな躍進がありました。画像1枚から3Dモデルを高品質に生成する拡散モデル「Zero123++」をはじめとする、生成AI最新論文の概要5つをお届けします。
音楽ストリーミングアプリYouTube Musicは、生成AIによりプレイリスト用のオリジナル画像を作るテスト機能の提供を開始しました。
ここのところ、生成AI画像環境構築やアプリの使い方などで3回、顔LoRA制作…と少し重いネタが続いたので、今回は軽めの気になるModelやLoRAを作例と共にご紹介したい。
人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップを開始します。
生成AIの重要論文5つを紹介する連載。今回はWeb上のサービスを言語指示でフル活用できるChrome拡張機能を用いたAI「OpenAgents」、偉人を完コピするAI「Character-LLM」など。
今回のAppleシリコンにネイティブ対応したMac版のリリースは、Linux版に続くもの。Windows版のリリース時期は未定です。
Modelに無い顔や彼女の顔を出したい!
Pythonのスーパーセット言語として注目されているMojoは現在Linux版のみ。次はWindows版ではなくMac版になりそうだ。
アップルらが開発したMultimodal Large Language Modelの「Ferret」など、5本の生成AI関連論文を紹介します。
Googleは8月30日より、Google Search labs登録ユーザーを対象に「生成AIによる検索体験(SGE)」の提供を開始していますが、10月12日にこの機能を拡張し、SGEにオプトインしたユーザーは、通常のGoogle検索バーからAIによる画像生成を行うことが可能になりました。
今年も、Adobeの年次イベント「Adobe MAX 2023」の取材で米ロサンゼルスに来ている。Adobeのイベントでは多数の新技術が発表になるが、やはり「華」でありハイライトは、開発途上の技術を先出しする「Sneaks」だ。
■画像生成は出来たけど…何かもう一捻りしたい!
生成AIの重要論文を解説する連載。今回は、大規模言語モデルでどんなに長い文章でも破綻しない手法、キャラクターの性格や話し方を模倣するAIなど紹介します。
Googleは、日本時間10月4日夜に開催されたMade By GoogleイベントでAndroidとiOS向けの「Assistant with Bard」を発表しました。
GoogleはクラウドサービスGoogle Cloudの最新技術と導入事例を発表するイベント Google Cloud Next Tokyo を4年ぶりに開催します。
米国の女優・監督兼プロデューサー、ゼルダ・ウィリアムズ氏は、すでに亡くなった人の遺志を考慮することなくAIで再現したり、置き換えたりする試みに対して「個人的に不快だ」と述べています。
生成AIの重要論文5本を解説する連載。今回は、3Dモデルを高速生成する「DreamGaussian」、ネット記事量産AI「InternLM-XComposer」などです。
アップルが完全自動運転のEV(電気自動車)関連技術を開発していることは、公然の事実です。
マイクロソフトは2009年からGoogleのライバルとしてウェブ検索サービス「Bing」を展開してきました。今年2月にはOpenAIの大規模言語モデルを統合したBing AIを発表して、ユーザー数を増やしています。
Stable Diffusionを使う新たなインターフェース、Fooocusをご紹介したい。インストールはbat一発、起動/アップデートもbat一発、Modelも初期起動時に自動的にダウンロードと非常にシンプル。そしてなにより、出てくる絵が驚異的という優れたインターフェースなのだ。
「Meta Connect」という開発者向けイベントに参加した。なぜQuestシリーズに力を入れるのか、なぜAI技術に投資を行うのか。その答えの先には、常にSNSの存在がある。Metaにとっての生成AIとはコミュニケーションを円滑に行うための道具なのだ。
生成AIで学習して生成した顔写真を元に、3Dデジタルヒューマンを作成し、それを等身大のアニメーションにしてみました。
Microsoftは9月26日(現地時間)、Windows 11 22H2向けに非セキュリティプレビュー更新プログラム(KB5030310)の配信を開始しました。
全米脚本家組合(WGA)は、生成AI使用の規制や動画ストリーミングからの報酬などに関し、大手スタジオとの間で約5か月にわたるストライキを終了させるための暫定的な合意に達したと発表しました。
OpenAIは9月25日、ChatGPTのバージョンアップを発表しました。今後2週間でロールアウトし、Plusプランのユーザーは、iOSとAndroidアプリではChatGPTと音声で会話することが可能になり、画像を含んだ会話ができるようになります。
生成AIを利用してバーチャルヒューマンを制作してみました。
■生成AIグラビアを実際作るには!?
生成AIの重要論文5本を解説。「数行のコードを足すだけ…」生成画像・動画の品質が向上「FreeU」、LLaMA2を10万トークンに低コストで増やす手法「LongLoRA」など。
OpenAIが、AI画像生成ツールの新バージョン「DALL・E 3」を発表しました。DALL・E 3は、入力したテキスト文を従来より忠実に、生成するアートへ反映することが可能になっています。
サンノゼで開催中のイベント Intel Innovation 2023基調講演より。インテルのゲルシンガーCEOが、最新のクライアントPC向けプロセッサ『Core Ultra』を発表しました。
年に一度の自社イベント Intel Innovation にさきがけて、インテルが2020年代後半の実用化を目指す「ガラス基板」を公開しました。
生成AIの注目すべき論文を解説する連載。今週は、マイクロソフトによる、“好きな人の声”のオーディオブックを電子書籍から作るAI、0.09秒で画像を生成するAI「InstaFlow」など。
この写真は部分的に欠けているけど、残りを見たい。そんな大事な写真をお持ちの方は、Photoshopを使うといいです。
Stable Audioという新しい生成AIサービスが始まりました。さっそく使ってみました。
Pythonの上位互換で高速性をうたう新言語のMojoが、待望のコンパイラ登場となった。ただしLinuxのみ。
静止画とオーディオがあればリップシンクができる動画技術を使い、長年の夢を実現しました。その一方で、ディープフェイク悪用の可能性がある技術も登場しています。
米国の新聞社Gannettは8月、AIが生成した地域の高校スポーツ大会の結果を伝える複数の記事が、非常に不自然な文章構成になっていたり、誤りや文章生成に失敗していると読者から指摘され問題化したのを受け、該当する記事のチェックと更新を行っています。
1週間分のAI論文をまとめる生成AIウィークリーは、“最適化”した回答を出すGoogleの言語モデル「OPRO」、無制限に3D都市を生成するAI「CityDreamer」など重要論文5本を解説しています。
先月、サンフランシスコで発生した救急搬送患者の死亡例に関して、サンフランシスコ消防局はロボタクシーが道路を塞いでいたせいで、救急車の現場への到着および要救護者の搬出が遅れたと主張しています。