AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第30回:生成AI画像の本命がいきなり登場!?新型モデルFLUX.1 [dev]を使ってみる(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第30回:生成AI画像の本命がいきなり登場!?新型モデルFLUX.1 [dev]を使ってみる(西川和久)

その日はいきなりやって来た!

“2万単語”を一発生成する言語AI「LongWriter」、論文執筆や査読など科学研究全般を自動化する「The AI Scientist」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

“2万単語”を一発生成する言語AI「LongWriter」、論文執筆や査読など科学研究全般を自動化する「The AI Scientist」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第60回)では、2万語を一度に出力するモデル「LongWriter」、Googleの画像生成AI「Imagen 3」、そして科学研究を支援する「The AI Scientist」と「OpenResearcher」などを取り上げます。

10秒のAI動画を17秒で生成。Runway Gen-3 Alpha Turboの7倍高速化とUnlimitedプランでAI動画のワークフロー激変(CloseBox) 画像
テクノロジー

10秒のAI動画を17秒で生成。Runway Gen-3 Alpha Turboの7倍高速化とUnlimitedプランでAI動画のワークフロー激変(CloseBox)

動画生成AIの老舗、Runwayが新しいモデル「Gen-3 Alpha Turbo」を公開しました。これがすごいのです。

XのチャットAI新バージョン「Grok 2 mini(beta)」の画像生成(実はFLUX.1)を使ってみた(CloseBox) 画像
テクノロジー

XのチャットAI新バージョン「Grok 2 mini(beta)」の画像生成(実はFLUX.1)を使ってみた(CloseBox)

イーロン・マスクが8月12日にほのめかしてた、Xと連動した生成AI「Grok」新バージョンGrok 2 mini(beta)の画像生成機能が、自分のアカウントでも使えるようになりました。

Pixel 9シリーズを語るポッドキャスト第64回を本日(8月14日)正午にライブ配信 画像
テクノロジー

Pixel 9シリーズを語るポッドキャスト第64回を本日(8月14日)正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」(テクノエッジ・サイド)を2週に1回のペースでお届けしています。今回は、8月14日に開催されたMade by Googleイベントで発表されたGoogleの新製品などについて語ります。

動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した(CloseBox) 画像
テクノロジー

動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した(CloseBox)

AIリップシンクにまた大きな波が訪れました。

Apple開発の画像生成AI「マトリョーシカ拡散モデル」、iPadでリアルタイムに動画を理解するGPT-4V超えAI「MiniCPM-V 2.6」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

Apple開発の画像生成AI「マトリョーシカ拡散モデル」、iPadでリアルタイムに動画を理解するGPT-4V超えAI「MiniCPM-V 2.6」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第59回)では、オープンソースの動画生成AI「CogVideoX」や、動画理解でGPT-4VやClaude 3.5 Sonnetなどを精度で上回るMLLM「MiniCPM-V 2.6」を取り上げます

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に(CloseBox) 画像
テクノロジー

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に(CloseBox)

しばらくベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版がついにリリースされたので、購入しました。

Google、批判受けGemini AIのオリンピックCMを放送中止。なんでも相談して怒られる 画像
テクノロジー

Google、批判受けGemini AIのオリンピックCMを放送中止。なんでも相談して怒られる

Google は、批判を受けていたGemini AIのコマーシャル『Google + Team USA − Dear Sydney』を放送から取り下げました。

元Stable Diffusion開発チームによる高性能画像生成AI「FLUX.1」、Perplexity精度のオープンソース検索AI「MindSearch」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

元Stable Diffusion開発チームによる高性能画像生成AI「FLUX.1」、Perplexity精度のオープンソース検索AI「MindSearch」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第58回)では、先日OpenAIが発表した「SearchGPT」など、Webのタイムリーな情報と大規模言語モデルを組みわせた検索AIのオープンソースモデル「MindSearch」や、Stability AIが発表した、単一の入力画像から3Dメッシュを0.5秒で生成する「Stable Fast 3D」を取り上げます。

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい?(CloseBox) 画像
テクノロジー

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい?(CloseBox)

1枚の人物画像から動画を生成するAIモデルが4種類、揃いました。Luma AI Dream Machine、Runway Gen-3 Alpha、KLING、Vidu。これらを同じ人物写真(画像)、同じプロンプトで比較してみます。

Google、生成AIがアプリUIを動的生成する「AI Generated UI」発表。ユーザー入力をLLMが把握、レイアウトもロジックも都度生成 画像
テクノロジー

Google、生成AIがアプリUIを動的生成する「AI Generated UI」発表。ユーザー入力をLLMが把握、レイアウトもロジックも都度生成

基本的に、アプリケーションのユーザーインターエイス(UI)は開発時に設計され実装されて、その実装通りに実行時に表示されるものです。

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか(CloseBox) 画像
テクノロジー

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか(CloseBox)

KLINGのサブスクリプションが開始されたばかりですが、翌日の7月31日に早くもライバルが登場しました。同じく中国の動画生成AIサービスで、「Vidu」というものです。といってもぽっと出ではなく、4月末辺りからSoraクラスの動画生成AIとして発表され、注目はされていました。このViduが一般利用可能になったのです。

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか?(CloseBox) 画像
テクノロジー

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか?(CloseBox)

7月30日、動画生成AIサービスの老舗であるRunwayが、最新モデルであるGen-3 AlphaでImage to Videoを使えるようにしました。