Generative AI

ChatGPTで動作するセントリーガンを作った男、OpenAIにAPIアクセスを遮断される 画像
テクノロジー

ChatGPTで動作するセントリーガンを作った男、OpenAIにAPIアクセスを遮断される

OpenAIは、ChatGPTの音声コマンドを利用して動作する電動セントリーガン(全自動回転砲塔)を開発する様子をSNSに投稿していたユーザーのAPIアクセスを遮断したと発表しました。

「“毒入り音楽”でAIに学習させない」――人には聞こえないノイズを音声にこっそり入れ訓練不能にする技術(生成AIクローズアップ) 画像
テクノロジー

「“毒入り音楽”でAIに学習させない」――人には聞こえないノイズを音声にこっそり入れ訓練不能にする技術(生成AIクローズアップ)

人には聞こえないノイズを音楽に埋め込み、その音声をAIモデルが学習できないようにする防御フレームワークを提案した論文「HarmonyCloak: Making Music Unlearnable for Generative AI」を取り上げます。

実写もAI動画も2秒だけ伸ばせるAdobe Premiere ProのAI新機能『生成拡張』を試したら、違和感がなさすぎて驚いた(CloseBox) 画像
テクノロジー

実写もAI動画も2秒だけ伸ばせるAdobe Premiere ProのAI新機能『生成拡張』を試したら、違和感がなさすぎて驚いた(CloseBox)

Adobe MAX 2024が始まりました。Sneak Previewについては西田宗千佳さんに速報を執筆いただいているところなのですが、生成AI機能が使えるようになった動画エディターのPremier Proのベータ版がすでに公開されていて試すことができたので、ファーストインプレッションを。

第三回AIアートグランプリ、一次審査通過10作品、絵画部門11作品決まる。最終審査会は11月9日 画像
テクノロジー

第三回AIアートグランプリ、一次審査通過10作品、絵画部門11作品決まる。最終審査会は11月9日

AIアート作品コンテスト「第三回AIアートグランプリ」の予選通過作品が決定しました。

漫画の1コマから続く20コマ以上を作り出す物語生成AI「SEED-Story」、イラストの制作過程動画を生成するAI「PaintsUndo」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

漫画の1コマから続く20コマ以上を作り出す物語生成AI「SEED-Story」、イラストの制作過程動画を生成するAI「PaintsUndo」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第55回)では、1枚の完成したイラスト絵を入力に、そのイラストの制作過程のタイムラプス動画を生成する「PaintsUndo」や、画像とテキストをペアにした1コマを入力に、続きの物語を生成する「SEED-Story」などを取り上げます。

他人の顔でYouTuber? 写真内の顔を思うように動かして話をさせるAI「LivePortrait」を動画生成AI「KLING」開発元が発表など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

他人の顔でYouTuber? 写真内の顔を思うように動かして話をさせるAI「LivePortrait」を動画生成AI「KLING」開発元が発表など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第54回)では、KLINGを開発した快手が、画像内のキャラクターの顔を自在に動かす技術「LivePortrait」を発表しました。

ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える(CloseBox) 画像
テクノロジー

ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える(CloseBox)

ノンプログラマーな自分が、大規模言語モデル(LLM)の助力で、初めてまともに動くプログラムを完成させることができました。

Soraレベルの超高性能動画生成Luma AI「Dream Machine」が2枚の元絵指定できる「キーフレーム」機能追加。弱点の「別人化問題」がこれで解消するか、試してみた(CloseBox) 画像
テクノロジー

Soraレベルの超高性能動画生成Luma AI「Dream Machine」が2枚の元絵指定できる「キーフレーム」機能追加。弱点の「別人化問題」がこれで解消するか、試してみた(CloseBox)

Soraレベルの超高性能動画生成AI、Luma AIの「Dream Machine」に新しい機能が投入されました。プロンプトでの指定以外に、2枚の参照画像を入力し、それを始点と終点にできる、ある意味モーフィング的な機能です。

米国の主要レコード会社がAI作曲サービスSunoとUdioを提訴。訴訟の根拠となったヒット曲再現プロンプトを検証してみる(CloseBox) 画像
テクノロジー

米国の主要レコード会社がAI作曲サービスSunoとUdioを提訴。訴訟の根拠となったヒット曲再現プロンプトを検証してみる(CloseBox)

いずれ起きるかなと思っていた、米音楽業界団体からAI作曲サービスへの訴訟がついに来ました。

プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する、生成AIウィークリー(第52回)では、オープンソースで成長する動画生成AI「Open-Sora」の新バージョンや、精度の伸び代が見込まれるAIによる3Dメッシュ生成分野から「Unique3D」と「MeshAnything」を取り上げます。

新世代AIリップシンク対決。感情豊かで高速な「Hedra Character-1」とオープンソースだがNVIDIA GPU必須「Hallo」。どっちが使い物になるか試してみた結果(CloseBox) 画像
テクノロジー

新世代AIリップシンク対決。感情豊かで高速な「Hedra Character-1」とオープンソースだがNVIDIA GPU必須「Hallo」。どっちが使い物になるか試してみた結果(CloseBox)

オーディオに合わせたリップシンクができる新しい技術が登場しました。「Hedra」という、これまで聞いたことのないサービスです。

直感的コントロールも予告した話題の高性能動画AI、Luma AI「Dream Machine」、10秒以上の動画生成が可能になったので試してみた(CloseBox) 画像
テクノロジー

直感的コントロールも予告した話題の高性能動画AI、Luma AI「Dream Machine」、10秒以上の動画生成が可能になったので試してみた(CloseBox)

SoraやKLINGレベルの「今使える代替動画生成AIサービス」として登場したLuma AIの「Dream Machine」が機能追加のアップデートしました。従来の5秒からのExtend(延長)が可能になりました。

画像内キャラに楽曲を歌わせる「Hallo」、“行列の掛け算なし”にLLMの開発が可能な「MatMul-Free LM」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

画像内キャラに楽曲を歌わせる「Hallo」、“行列の掛け算なし”にLLMの開発が可能な「MatMul-Free LM」など重要論文5本を解説(生成AIウィークリー)

第51回の生成AIウィークリーでは、この1週間の興味深い生成AIに関する研究論文をピックアップし、解説します。特に注目したいのは、大規模言語モデル(LLM)の開発において、常識とされている行列乗算を排除するという「MatMul-Free LM」です。この研究は、GitHubにおいて2000件(執筆現在)のStarを獲得しており、注目されています。

もうSoraは不要なのか。動画生成AIの新基準、Luma AI「Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術(CloseBox) 画像
テクノロジー

もうSoraは不要なのか。動画生成AIの新基準、Luma AI「Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術(CloseBox)

テキストプロンプトからリアルな動きのある映像を生成できる動画生成AISora、KLINGが使えずにヤキモキしていた人々が大挙して押し寄せた「Luma Dream Machine」。このサービスの有償プランに申し込んで使ってみたので、その使い方のコツをお伝えします。

今そこにあるSora、現時点最高クラスの誰でも使える動画生成AI「Luma Dream Machine」が人気すぎて数時間の待ち行列(CloseBox) 画像
テクノロジー

今そこにあるSora、現時点最高クラスの誰でも使える動画生成AI「Luma Dream Machine」が人気すぎて数時間の待ち行列(CloseBox)

今使えるSoraのライバルが登場しました。

短い演奏・歌を十数秒で4分の完成曲に。作曲AIが未完成曲をフィニッシュするSunoの新機能を試して見つけた黄金パターン(CloseBox) 画像
テクノロジー

短い演奏・歌を十数秒で4分の完成曲に。作曲AIが未完成曲をフィニッシュするSunoの新機能を試して見つけた黄金パターン(CloseBox)

オーディオをアップロードして、そこから曲を拡張していく機能がようやくSunoでも使えるようになりました。

中国AIが加速。Soraに匹敵する中国の動画生成AI「KLING」、中国アリババの最新オープンLLM「Qwen 2」登場など生成AI関連技術5つを紹介(生成AIウィークリー) 画像
テクノロジー

中国AIが加速。Soraに匹敵する中国の動画生成AI「KLING」、中国アリババの最新オープンLLM「Qwen 2」登場など生成AI関連技術5つを紹介(生成AIウィークリー)

週次で生成AI関連技術5つを紹介する連載。中国のショート動画アプリ開発チーム「快手」が手がけるSoraに匹敵する動画生成AI「KLING」など。

動画AIが豊作。アニメ絵2枚の間の“中割り”を生成し映像化するAI「ToonCrafter」、画像内キャラを滑らかに踊らせるAI「MusePose」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

動画AIが豊作。アニメ絵2枚の間の“中割り”を生成し映像化するAI「ToonCrafter」、画像内キャラを滑らかに踊らせるAI「MusePose」など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本を解説する連載。今週は、アニメの“中割り”を生成してアニメーションに仕上げる「ToonCrafter」、1枚の画像とモーションデータからダンス動画を生成するAIモデル「MusePose」など。

“株”選びにGPT-4の利益予測は使えるのか? “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

“株”選びにGPT-4の利益予測は使えるのか? “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説(生成AIウィークリー)

生成AIに関する重要論文を解説する連載。今回は、“文学作品”を翻訳する実際の出版社を真似たAI会社「TransAgents」、GPT-4で企業の財務諸表を分析し将来の利益を予測……など5本。

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox) 画像
テクノロジー

AI作曲「Suno」新バージョンがWAV高音質化、最長4分の曲を一発でエンディングまで完成。無修正で良曲量産可能に(CloseBox)

このところUdioやSonautoの新機能搭載で押され気味だったAI作曲サービスの「Suno」が反撃に出ました。

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化 画像
テクノロジー

中国で『AI習近平』誕生。「習近平思想」記した著書十数冊や公式文書で強化

中国国家サイバースペース管理局(CAC)は、習近平国家主席の思想と政治哲学に関する著書などでトレーニングされた大規模言語モデル(LLM)を搭載するAIシステムを開発しました。

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説(生成AIウィークリー)

1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。今回は、GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」、大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査などを紹介。

AI作曲のUdio、有料サービス開始。部分修正も可能に(CloseBox) 画像
テクノロジー

AI作曲のUdio、有料サービス開始。部分修正も可能に(CloseBox)

AI作曲サービスのUdioは5月8日、有料プランを含むサブスクリプションをスタートしました。同時に、生成した楽曲の部分修正を行う「Audio Inpainting」機能を追加しています。

Pika、RunwayMLなど動画生成AIサービスを同一プロンプトで比較した結果。OpenAI Soraでも実際は膨大なガチャと後編集 画像
テクノロジー

Pika、RunwayMLなど動画生成AIサービスを同一プロンプトで比較した結果。OpenAI Soraでも実際は膨大なガチャと後編集

動画生成AIにまつわる最新の話題をお届けしている、この短期連載。今回は、(おそらく)世界中のAI動画クリエイターたちが使ってみたいと考えているOpenAIのSoraによる映像制作が、そんなに簡単なものではないという裏話と、複数の人気動画生成AIに同じプロンプトで動画を生成させて比較してみます。

自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIを発表など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIを発表など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本を解説する連載。今回は、自分の声のまま多言語な声に変換できる商用利用可能な音声クローンAI「OpenVoice V2」、AppleとMicrosoftがスマホ上でも動く生成AIなど。

その人の声になりきってリアルタイム歌唱できるAIボイチェン「Vocoflex」を使ってタイムトラベル体験した(CloseBox) 画像
テクノロジー

その人の声になりきってリアルタイム歌唱できるAIボイチェン「Vocoflex」を使ってタイムトラベル体験した(CloseBox)

10秒の歌声オーディオデータがあれば、本人そっくりのリアルタイム歌唱ができるという「Vocoflex」。ベータテスターの申し込みをしていたのですが、ついに試用できたので、そのファーストインプレッションをお届けします。

ラッパーDrake、故2PACのAI生成音声でケンドリック・ラマーへのディス曲を公開。遺産管理団体が強く抗議 画像
テクノロジー

ラッパーDrake、故2PACのAI生成音声でケンドリック・ラマーへのディス曲を公開。遺産管理団体が強く抗議

1996年に死去したラッパーの2PACことトゥパック・シャクールの遺産管理団体が、故人の声をAI生成し、ケンドリック・ラマーへのディス曲「Taylor Made Freestyle」に使ったドレイクに対し、早急に撤回するよう求め、さもなくば訴訟を起こすと警告しています。

AI作曲で再びパンドラの箱が開く。Sonautoで既存曲のメロディーと音楽スタイルを参照して別曲が作れるようになって替え歌思うがまま(CloseBox) 画像
テクノロジー

AI作曲で再びパンドラの箱が開く。Sonautoで既存曲のメロディーと音楽スタイルを参照して別曲が作れるようになって替え歌思うがまま(CloseBox)

ポストSunoのAI作曲サービスとして、同時期にリリースされたものの、Udioの音質の方ばかりが注目され、イマイチな評価を浴びていたSonautoですが(書いているのは筆者くらいですが)、かなりやばい機能を搭載してきました。

Adobeの画像生成AI「Firefly Image 3」提供開始。Photoshopに「画像を生成」追加、「生成塗りつぶし」強化など新機能を解説(西田宗千佳) 画像
テクノロジー

Adobeの画像生成AI「Firefly Image 3」提供開始。Photoshopに「画像を生成」追加、「生成塗りつぶし」強化など新機能を解説(西田宗千佳)

アドビは、4月23日(現地時間)にスタートした「Adobe Max London」にて、生成AI「Adobe Firefly」と「Adobe Photoshop」に関する複数の発表を行った。どのような変化が起きたのか? アドビ・Photoshop製品マーケティング担当シニアディレクターのエリン・ボイス氏に話を聞いた。

Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した 画像
テクノロジー

Stable Diffusionの文字がちゃんと描ける新バージョン「SD3」、APIを組み込んで検証した

Stability AIからStable Diffusionの新しいバージョン「Stable Diffusion 3」がAPI限定で公開されました。アプリケーションに組み込んで特徴やコストなどを確認しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる? 第22回:Stable Diffusion 3リリース。ComfyUIを使いAPI経由で生成(西川和久)

API経由ながらStable Diffusion 3が利用可能に!

生成AIのためのGPU投資、さくらインターネットとKDDIが1000億円規模の投資を発表。経済産業省の認定プログラムを受け 画像
テクノロジー

生成AIのためのGPU投資、さくらインターネットとKDDIが1000億円規模の投資を発表。経済産業省の認定プログラムを受け

経済産業省は、経済安全保障推進法に基づく特定重要物資、具体的には主に生成AIに関するシステムの安定供給確保をはかるためのであるクラウドプログラムの認定を相次いで発表しました。

Synthesizer Vのメーカーが作った、10秒の音声ファイルがあればリアルタイム歌声変換できるAI技術「Vocoflex」はRVCを超える?(CloseBox) 画像
テクノロジー

Synthesizer Vのメーカーが作った、10秒の音声ファイルがあればリアルタイム歌声変換できるAI技術「Vocoflex」はRVCを超える?(CloseBox)

「年末のライブなんですが、今回、とりちゃんにコーラスをやってもらいたいと思っていて、リアルタイムで歌うことってできないですか?」

Amazon CEOが重要視する「生成AIのプリミティブなセット」とは何か。見えてきたAWSの生成AI戦略 画像
テクノロジー

Amazon CEOが重要視する「生成AIのプリミティブなセット」とは何か。見えてきたAWSの生成AI戦略

AmazonのCEOが言うプリミティブなセットとは何か、そしてそれがどのように画期的な顧客体験を実現するのか、などについて公開書簡から紹介していきましょう。

架空バンド「The Midnight Odyssey」のリアルなPVを作る。生成AIをフル活用した世界観の創出と動画制作の手順 画像
テクノロジー

架空バンド「The Midnight Odyssey」のリアルなPVを作る。生成AIをフル活用した世界観の創出と動画制作の手順

生成AIを利用したミュージックビデオ制作に知見のあるテクノロジーライター、大谷和利さんに、実例を使ってその使い方を解説してもらいました。

作曲AIサービスのSuno、Udioなど強力なライバルたち登場のタイミングでプチ改良(CloseBox) 画像
テクノロジー

作曲AIサービスのSuno、Udioなど強力なライバルたち登場のタイミングでプチ改良(CloseBox)

SonautoやUdioといった作曲AI新興勢力の登場が影響したのかどうか、Sunoが改良を加えてきました。

第三回AIアートグランプリ開催決定。絵画部門を新設 画像
テクノロジー

第三回AIアートグランプリ開催決定。絵画部門を新設

AIアート作品コンテスト「AIアートグランプリ」の3回目開催が決まりました。第一回は2023年3月、第二回は同年11月に結果発表が行われましたが、第三回は、2024年8月から作品のエントリーを受け付け、最終審査は11月となります。

GPT-4超え精度でスマホ上実行できるオンデバイス生成AI「Octopus v2」、Google「生成AIは大きければいいってものではない」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

GPT-4超え精度でスマホ上実行できるオンデバイス生成AI「Octopus v2」、Google「生成AIは大きければいいってものではない」など重要論文5本を解説(生成AIウィークリー)

生成AIの重要論文5本を解説する連載。今回は、GPT-4越えで直接スマホ上で処理できるオンデバイス生成AI「Octopus v2」などを取り上げます。 

Microsoft CopilotがSuno V3に対応。チャットAIで超お手軽に作曲する最新操作マニュアル(CloseBox) 画像
テクノロジー

Microsoft CopilotがSuno V3に対応。チャットAIで超お手軽に作曲する最新操作マニュアル(CloseBox)

Microsoft Copilot版SunoのV3化を記念して、書籍向けに執筆していたCopilot版Sunoの操作マニュアルを公開します。

OpenAIのAI音声技術「Voice Engine」、アバターサービスのHeyGenが採用 画像
テクノロジー

OpenAIのAI音声技術「Voice Engine」、アバターサービスのHeyGenが採用

OpenAIは15秒ほどの短い音声を元に、本人そっくりで、感情を込めたリアルな音声を生成できるAIモデル「Voice Engine」を発表しました。元音声と生成音声のサンプルがいくつか公開されています。

生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など重要論文5本を解説(生成AIウィークリー) 画像
テクノロジー

生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など重要論文5本を解説(生成AIウィークリー)

生成AIに関する重要論文5本を解説する連載。今週は、生成AIの回答を自動でGoogle検索し事実か確認するAI「SAFE」、自律型AIをコントロールするためのOS「AIOS」など。

いよいよ出荷が始まる手のひらAIデバイス「Humane Ai Pin」のやっておくことリスト 画像
テクノロジー

いよいよ出荷が始まる手のひらAIデバイス「Humane Ai Pin」のやっておくことリスト

出荷間近となったAIデバイス「Ai Pin」。日本ではソフトバンクが取り扱うことが発表され、注目を浴びています。いち早く米国で購入した著者が、購入前の各種手続きについて解説します。

  • 262件中 1 - 42 件を表示
  • 次へ