Generative AI

Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した 画像
テクノロジー

Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した

Stability AIからStable Diffusionの新しいバージョン「Stable Diffusion 3」がAPI限定で公開されました。アプリケーションに組み込んで特徴やコストなどを確認しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久)

API経由ながらStable Diffusion 3が利用可能に!

生成AIのためのGPU投資、さくらインターネットとKDDIが1000億円規模の投資を発表。経済産業省の認定プログラムを受け 画像
テクノロジー

生成AIのためのGPU投資、さくらインターネットとKDDIが1000億円規模の投資を発表。経済産業省の認定プログラムを受け

経済産業省は、経済安全保障推進法に基づく特定重要物資、具体的には主に生成AIに関するシステムの安定供給確保をはかるためのであるクラウドプログラムの認定を相次いで発表しました。

Synthesizer Vのメーカーが作った、10秒の音声ファイルがあればリアルタイム歌声変換できるAI技術「Vocoflex」はRVCを超える?(CloseBox) 画像
テクノロジー

Synthesizer Vのメーカーが作った、10秒の音声ファイルがあればリアルタイム歌声変換できるAI技術「Vocoflex」はRVCを超える?(CloseBox)

「年末のライブなんですが、今回、とりちゃんにコーラスをやってもらいたいと思っていて、リアルタイムで歌うことってできないですか?」

Amazon CEOが重要視する「生成AIのプリミティブなセット」とは何か。見えてきたAWSの生成AI戦略 画像
テクノロジー

Amazon CEOが重要視する「生成AIのプリミティブなセット」とは何か。見えてきたAWSの生成AI戦略

AmazonのCEOが言うプリミティブなセットとは何か、そしてそれがどのように画期的な顧客体験を実現するのか、などについて公開書簡から紹介していきましょう。

架空バンド「The Midnight Odyssey」のリアルなPVを作る。生成AIをフル活用した世界観の創出と動画制作の手順 画像
テクノロジー

架空バンド「The Midnight Odyssey」のリアルなPVを作る。生成AIをフル活用した世界観の創出と動画制作の手順

生成AIを利用したミュージックビデオ制作に知見のあるテクノロジーライター、大谷和利さんに、実例を使ってその使い方を解説してもらいました。

作曲AIサービスのSuno、Udioなど強力なライバルたち登場のタイミングでプチ改良(CloseBox) 画像
テクノロジー

作曲AIサービスのSuno、Udioなど強力なライバルたち登場のタイミングでプチ改良(CloseBox)

SonautoやUdioといった作曲AI新興勢力の登場が影響したのかどうか、Sunoが改良を加えてきました。

第三回AIアートグランプリ開催決定。絵画部門を新設 画像
テクノロジー

第三回AIアートグランプリ開催決定。絵画部門を新設

AIアート作品コンテスト「AIアートグランプリ」の3回目開催が決まりました。第一回は2023年3月、第二回は同年11月に結果発表が行われましたが、第三回は、2024年8月から作品のエントリーを受け付け、最終審査は11月となります。

GPT-4超え精度でスマホ上実行できるオンデバイス生成AI「Octopus v2」、Google「生成AIは大きければいいってものではない」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

GPT-4超え精度でスマホ上実行できるオンデバイス生成AI「Octopus v2」、Google「生成AIは大きければいいってものではない」など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本を解説する連載。今回は、GPT-4越えで直接スマホ上で処理できるオンデバイス生成AI「Octopus v2」などを取り上げます。 

Microsoft CopilotがSuno V3に対応。チャットAIで超お手軽に作曲する最新操作マニュアル(CloseBox) 画像
テクノロジー

Microsoft CopilotがSuno V3に対応。チャットAIで超お手軽に作曲する最新操作マニュアル(CloseBox)

Microsoft Copilot版SunoのV3化を記念して、書籍向けに執筆していたCopilot版Sunoの操作マニュアルを公開します。

OpenAIのAI音声技術「Voice Engine」、アバターサービスのHeyGenが採用 画像
テクノロジー

OpenAIのAI音声技術「Voice Engine」、アバターサービスのHeyGenが採用

OpenAIは15秒ほどの短い音声を元に、本人そっくりで、感情を込めたリアルな音声を生成できるAIモデル「Voice Engine」を発表しました。元音声と生成音声のサンプルがいくつか公開されています。

生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など重要論文5本を解説(生成AIウィークリー)

生成AIに関する重要論文5本を解説する連載。今週は、生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など。

いよいよ出荷が始まる手のひらAIデバイス「Humane Ai Pin」のやっておくことリスト 画像
テクノロジー

いよいよ出荷が始まる手のひらAIデバイス「Humane Ai Pin」のやっておくことリスト

出荷間近となったAIデバイス「Ai Pin」。日本ではソフトバンクが取り扱うことが発表され、注目を浴びています。いち早く米国で購入した著者が、購入前の各種手続きについて解説します。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第21回:ComfyUI応用編。ControlNetでポーズ・構図を指定する (西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第21回:ComfyUI応用編。ControlNetでポーズ・構図を指定する (西川和久)

ComfyUIでControlNet(Canny/Depth/OpenPose)を使うには