OpenAIは、ChatGPTの音声コマンドを利用して動作する電動セントリーガン(全自動回転砲塔)を開発する様子をSNSに投稿していたユーザーのAPIアクセスを遮断したと発表しました。
人には聞こえないノイズを音楽に埋め込み、その音声をAIモデルが学習できないようにする防御フレームワークを提案した論文「HarmonyCloak: Making Music Unlearnable for Generative AI」を取り上げます。
Adobe MAX 2024が始まりました。Sneak Previewについては西田宗千佳さんに速報を執筆いただいているところなのですが、生成AI機能が使えるようになった動画エディターのPremier Proのベータ版がすでに公開されていて試すことができたので、ファーストインプレッションを。
AIアート作品コンテスト「第三回AIアートグランプリ」の予選通過作品が決定しました。
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第55回)では、1枚の完成したイラスト絵を入力に、そのイラストの制作過程のタイムラプス動画を生成する「PaintsUndo」や、画像とテキストをペアにした1コマを入力に、続きの物語を生成する「SEED-Story」などを取り上げます。
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第54回)では、KLINGを開発した快手が、画像内のキャラクターの顔を自在に動かす技術「LivePortrait」を発表しました。
ノンプログラマーな自分が、大規模言語モデル(LLM)の助力で、初めてまともに動くプログラムを完成させることができました。
Soraレベルの超高性能動画生成AI、Luma AIの「Dream Machine」に新しい機能が投入されました。プロンプトでの指定以外に、2枚の参照画像を入力し、それを始点と終点にできる、ある意味モーフィング的な機能です。
いずれ起きるかなと思っていた、米音楽業界団体からAI作曲サービスへの訴訟がついに来ました。
この1週間の気になる生成AI技術をピックアップして解説する、生成AIウィークリー(第52回)では、オープンソースで成長する動画生成AI「Open-Sora」の新バージョンや、精度の伸び代が見込まれるAIによる3Dメッシュ生成分野から「Unique3D」と「MeshAnything」を取り上げます。
オーディオに合わせたリップシンクができる新しい技術が登場しました。「Hedra」という、これまで聞いたことのないサービスです。
SoraやKLINGレベルの「今使える代替動画生成AIサービス」として登場したLuma AIの「Dream Machine」が機能追加のアップデートしました。従来の5秒からのExtend(延長)が可能になりました。
第51回の生成AIウィークリーでは、この1週間の興味深い生成AIに関する研究論文をピックアップし、解説します。特に注目したいのは、大規模言語モデル(LLM)の開発において、常識とされている行列乗算を排除するという「MatMul-Free LM」です。この研究は、GitHubにおいて2000件(執筆現在)のStarを獲得しており、注目されています。
テキストプロンプトからリアルな動きのある映像を生成できる動画生成AISora、KLINGが使えずにヤキモキしていた人々が大挙して押し寄せた「Luma Dream Machine」。このサービスの有償プランに申し込んで使ってみたので、その使い方のコツをお伝えします。
今使えるSoraのライバルが登場しました。
オーディオをアップロードして、そこから曲を拡張していく機能がようやくSunoでも使えるようになりました。
週次で生成AI関連技術5つを紹介する連載。中国のショート動画アプリ開発チーム「快手」が手がけるSoraに匹敵する動画生成AI「KLING」など。
生成AIの重要論文5本を解説する連載。今週は、アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」、1枚の画像とモーションデータからダンス動画を生成するAIモデル「MusePose」など。
生成AIに関する重要論文を解説する連載。今回は、“文学作品”を翻訳する実際の出版社を真似たAI会社「TransAgents」、GPT-4で企業の財務諸表を分析し将来の利益を予測……など5本。
このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。
中国国家サイバースペース管理局(CAC)は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル(LLM)を搭載するAIシステムを開発しました。
1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。今回は、GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」、大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査などを紹介。
AI作曲サービスのUdioは5月8日、有料プランを含むサブスクリプションをスタートしました。同時に、生成した楽曲の部分修正を行う「Audio Inpainting」機能を追加しています。
動画生成AIにまつわる最新の話題をお届けしている、この短期連載。今回は、(おそらく)世界中のAI動画クリエイターたちが使ってみたいと考えているOpenAIのSoraによる映像制作が、そんなに簡単なものではないという裏話と、複数の人気動画生成AIに同じプロンプトで動画を生成させて比較してみます。
生成AIの重要論文5本を解説する連載。今回は、自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIなど。
10秒の歌声オーディオデータがあれば、本人そっくりのリアルタイム歌唱ができるという「Vocoflex」。ベータテスターの申し込みをしていたのですが、ついに試用できたので、そのファーストインプレッションをお届けします。
1996年に死去したラッパーの2PACことトゥパック・シャクールの遺産管理団体が、故人の声をAI生成し、ケンドリック・ラマーへのディス曲「Taylor Made Freestyle」に使ったドレイクに対し、早急に撤回するよう求め、さもなくば訴訟を起こすと警告しています。
ポストSunoのAI作曲サービスとして、同時期にリリースされたものの、Udioの音質の方ばかりが注目され、イマイチな評価を浴びていたSonautoですが(書いているのは筆者くらいですが)、かなりやばい機能を搭載してきました。
アドビは、4月23日(現地時間)にスタートした「Adobe Max London」にて、生成AI「Adobe Firefly」と「Adobe Photoshop」に関する複数の発表を行った。どのような変化が起きたのか? アドビ・Photoshop製品マーケティング担当シニアディレクターのエリン・ボイス氏に話を聞いた。
Stability AIからStable Diffusionの新しいバージョン「Stable Diffusion 3」がAPI限定で公開されました。アプリケーションに組み込んで特徴やコストなどを確認しました。
API経由ながらStable Diffusion 3が利用可能に!
経済産業省は、経済安全保障推進法に基づく特定重要物資、具体的には主に生成AIに関するシステムの安定供給確保をはかるためのであるクラウドプログラムの認定を相次いで発表しました。
「年末のライブなんですが、今回、とりちゃんにコーラスをやってもらいたいと思っていて、リアルタイムで歌うことってできないですか?」
AmazonのCEOが言うプリミティブなセットとは何か、そしてそれがどのように画期的な顧客体験を実現するのか、などについて公開書簡から紹介していきましょう。
生成AIを利用したミュージックビデオ制作に知見のあるテクノロジーライター、大谷和利さんに、実例を使ってその使い方を解説してもらいました。
SonautoやUdioといった作曲AI新興勢力の登場が影響したのかどうか、Sunoが改良を加えてきました。
AIアート作品コンテスト「AIアートグランプリ」の3回目開催が決まりました。第一回は2023年3月、第二回は同年11月に結果発表が行われましたが、第三回は、2024年8月から作品のエントリーを受け付け、最終審査は11月となります。
生成AIの重要論文5本を解説する連載。今回は、GPT-4越えで直接スマホ上で処理できるオンデバイス生成AI「Octopus v2」などを取り上げます。
Microsoft Copilot版SunoのV3化を記念して、書籍向けに執筆していたCopilot版Sunoの操作マニュアルを公開します。
OpenAIは15秒ほどの短い音声を元に、本人そっくりで、感情を込めたリアルな音声を生成できるAIモデル「Voice Engine」を発表しました。元音声と生成音声のサンプルがいくつか公開されています。
生成AIに関する重要論文5本を解説する連載。今週は、生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など。
出荷間近となったAIデバイス「Ai Pin」。日本ではソフトバンクが取り扱うことが発表され、注目を浴びています。いち早く米国で購入した著者が、購入前の各種手続きについて解説します。