Generative AI

“株”選びにGPT-4の利益予測は使えるのか? “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

“株”選びにGPT-4の利益予測は使えるのか? “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説(生成AIウィークリー)

生成AIに関する重要論文を解説する連載。今回は、“文学作品”を翻訳する実際の出版社を真似たAI会社「TransAgents」、GPT-4で企業の財務諸表を分析し将来の利益を予測……など5本。

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox) 画像
テクノロジー

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox)

このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化 画像
テクノロジー

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化

中国国家サイバースペース管理局(CAC)は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル(LLM)を搭載するAIシステムを開発しました。

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説(生成AIウィークリー)

1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。今回は、GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」、大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査などを紹介。

AI作曲のUdio、有料サービス開始。部分修正も可能に(CloseBox) 画像
テクノロジー

AI作曲のUdio、有料サービス開始。部分修正も可能に(CloseBox)

AI作曲サービスのUdioは5月8日、有料プランを含むサブスクリプションをスタートしました。同時に、生成した楽曲の部分修正を行う「Audio Inpainting」機能を追加しています。

Pika、RunwayMLなど動画生成AIサービスを同一プロンプトで比較した結果。OpenAI Soraでも実際は膨大なガチャと後編集 画像
テクノロジー

Pika、RunwayMLなど動画生成AIサービスを同一プロンプトで比較した結果。OpenAI Soraでも実際は膨大なガチャと後編集

動画生成AIにまつわる最新の話題をお届けしている、この短期連載。今回は、(おそらく)世界中のAI動画クリエイターたちが使ってみたいと考えているOpenAIのSoraによる映像制作が、そんなに簡単なものではないという裏話と、複数の人気動画生成AIに同じプロンプトで動画を生成させて比較してみます。

自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIを発表など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIを発表など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本を解説する連載。今回は、自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIなど。

その人の声になりきってリアルタイム歌唱できるAIボイチェン「Vocoflex」を使ってタイムトラベル体験した(CloseBox) 画像
テクノロジー

その人の声になりきってリアルタイム歌唱できるAIボイチェン「Vocoflex」を使ってタイムトラベル体験した(CloseBox)

10秒の歌声オーディオデータがあれば、本人そっくりのリアルタイム歌唱ができるという「Vocoflex」。ベータテスターの申し込みをしていたのですが、ついに試用できたので、そのファーストインプレッションをお届けします。

ラッパーDrake、故2PACのAI生成音声でケンドリック・ラマーへのディス曲を公開。遺産管理団体が強く抗議 画像
テクノロジー

ラッパーDrake、故2PACのAI生成音声でケンドリック・ラマーへのディス曲を公開。遺産管理団体が強く抗議

1996年に死去したラッパーの2PACことトゥパック・シャクールの遺産管理団体が、故人の声をAI生成し、ケンドリック・ラマーへのディス曲「Taylor Made Freestyle」に使ったドレイクに対し、早急に撤回するよう求め、さもなくば訴訟を起こすと警告しています。

AI作曲で再びパンドラの箱が開く。Sonautoで既存曲のメロディーと音楽スタイルを参照して別曲が作れるようになって替え歌思うがまま(CloseBox) 画像
テクノロジー

AI作曲で再びパンドラの箱が開く。Sonautoで既存曲のメロディーと音楽スタイルを参照して別曲が作れるようになって替え歌思うがまま(CloseBox)

ポストSunoのAI作曲サービスとして、同時期にリリースされたものの、Udioの音質の方ばかりが注目され、イマイチな評価を浴びていたSonautoですが(書いているのは筆者くらいですが)、かなりやばい機能を搭載してきました。

Adobeの画像生成AI「Firefly Image 3」提供開始。Photoshopに「画像を生成」追加、「生成塗りつぶし」強化など新機能を解説(西田宗千佳) 画像
テクノロジー

Adobeの画像生成AI「Firefly Image 3」提供開始。Photoshopに「画像を生成」追加、「生成塗りつぶし」強化など新機能を解説(西田宗千佳)

アドビは、4月23日(現地時間)にスタートした「Adobe Max London」にて、生成AI「Adobe Firefly」と「Adobe Photoshop」に関する複数の発表を行った。どのような変化が起きたのか? アドビ・Photoshop製品マーケティング担当シニアディレクターのエリン・ボイス氏に話を聞いた。

Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した 画像
テクノロジー

Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した

Stability AIからStable Diffusionの新しいバージョン「Stable Diffusion 3」がAPI限定で公開されました。アプリケーションに組み込んで特徴やコストなどを確認しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久)

API経由ながらStable Diffusion 3が利用可能に!

生成AIのためのGPU投資、さくらインターネットとKDDIが1000億円規模の投資を発表。経済産業省の認定プログラムを受け 画像
テクノロジー

生成AIのためのGPU投資、さくらインターネットとKDDIが1000億円規模の投資を発表。経済産業省の認定プログラムを受け

経済産業省は、経済安全保障推進法に基づく特定重要物資、具体的には主に生成AIに関するシステムの安定供給確保をはかるためのであるクラウドプログラムの認定を相次いで発表しました。