AI

Meta Reality Labs、人の画像から姿勢や立体形状を高精度に理解するビジョンモデル「Sapiens」発表。3億枚以上の画像で学習(生成AI論文ピックアップ) 画像
AI

Meta Reality Labs、人の画像から姿勢や立体形状を高精度に理解するビジョンモデル「Sapiens」発表。3億枚以上の画像で学習(生成AI論文ピックアップ)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第61回)では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。

自律AIが自律AIを改良し続ける自動設計システム「ADAS」発表。手動設計を大幅に上回る性能 画像
AI

自律AIが自律AIを改良し続ける自動設計システム「ADAS」発表。手動設計を大幅に上回る性能

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第61回)では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。

最高峰の画像生成AI「FLUX.1」で顔LoRA学習(2ドル)したら、AI動画生成も捗った話(CloseBox) 画像
AI

最高峰の画像生成AI「FLUX.1」で顔LoRA学習(2ドル)したら、AI動画生成も捗った話(CloseBox)

なんといっても現在のトレンドはFLUX.1。これを自分の制作ワークフローに取り入れることができたのでご報告します。

Apple、新iPhone発表は9月9日。日本時間10日午前2時からiPhone 16(仮)スペシャルイベント『It's Glowtime. 時が満ちる。』開催 画像
スマートフォン

Apple、新iPhone発表は9月9日。日本時間10日午前2時からiPhone 16(仮)スペシャルイベント『It's Glowtime. 時が満ちる。』開催

Appleが次のスペシャルイベントを正式に発表しました。開始は現地時間で9月9日午前10時、日本では翌10日(火)午前2時から。

ITmedia Mobile田中聡編集長をゲストにポッドキャスト第65回を本日(8月26日)正午にライブ配信 画像
スマートフォン

ITmedia Mobile田中聡編集長をゲストにポッドキャスト第65回を本日(8月26日)正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」(テクノエッジ・サイド)を2週に1回のペースでお届けしています。今回は、ITmedia Mobile田中聡編集長をゲストに迎え、最近のモバイルデバイスの話題について語ります。

「Pixel 9 Pro XL」と過ごした数日の感想。Gemini Liveと話して体験したGoogle AIはどんなものだったか(Google Tales) 画像
スマートフォン

「Pixel 9 Pro XL」と過ごした数日の感想。Gemini Liveと話して体験したGoogle AIはどんなものだったか(Google Tales)

今回の「Google Tales」は、主にPixel 9 Pro XLのAI機能を使ってみたお話です。

Google Pixel 9 Pro(小さいほう)実機ハンズオンレビュー『日本向けPixel』のカメラとAI機能をチェック(石野純也) 画像
スマートフォン

Google Pixel 9 Pro(小さいほう)実機ハンズオンレビュー『日本向けPixel』のカメラとAI機能をチェック(石野純也)

AIを売りにしたグーグル純正スマホ「Pixel 9」「Pixel 9 Pro XL」が、8月22日に発売されました。

謎の音楽生成AI「LoudMe」登場。Suno激似で作曲し放題、日本語もOK(CloseBox) 画像
AI

謎の音楽生成AI「LoudMe」登場。Suno激似で作曲し放題、日本語もOK(CloseBox)

SunoとUdioの2強だったボーカル付きAI作曲サービスに新たなライバル「LoudMe」が登場しました。8月15日に発表されたもののあまり話題になっていなかったサービスですが、その実力は相当なもの。実際に試してその実力を探ってみることにします。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第30回:生成AI画像の本命がいきなり登場!?新型モデルFLUX.1 [dev]を使ってみる(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第30回:生成AI画像の本命がいきなり登場!?新型モデルFLUX.1 [dev]を使ってみる(西川和久)

その日はいきなりやって来た!

“2万単語”を一発生成する言語AI「LongWriter」、論文執筆や査読など科学研究全般を自動化する「The AI Scientist」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

“2万単語”を一発生成する言語AI「LongWriter」、論文執筆や査読など科学研究全般を自動化する「The AI Scientist」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第60回)では、2万語を一度に出力するモデル「LongWriter」、Googleの画像生成AI「Imagen 3」、そして科学研究を支援する「The AI Scientist」と「OpenResearcher」などを取り上げます。

10秒のAI動画を17秒で生成。Runway Gen-3 Alpha Turboの7倍高速化とUnlimitedプランでAI動画のワークフロー激変(CloseBox) 画像
AI

10秒のAI動画を17秒で生成。Runway Gen-3 Alpha Turboの7倍高速化とUnlimitedプランでAI動画のワークフロー激変(CloseBox)

動画生成AIの老舗、Runwayが新しいモデル「Gen-3 Alpha Turbo」を公開しました。これがすごいのです。

話題の高性能AI「FLUX.1」実演も。「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2期第5回)を8月21日開催。参加者募集します 画像
AI

話題の高性能AI「FLUX.1」実演も。「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2期第5回)を8月21日開催。参加者募集します

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第2期第5回を8月21日に開催いたします。なお、今回お申し込みいただいた方は、前回分の動画アーカイブを視聴いただけます。

XのチャットAI新バージョン「Grok 2 mini(beta)」の画像生成(実はFLUX.1)を使ってみた(CloseBox) 画像
AI

XのチャットAI新バージョン「Grok 2 mini(beta)」の画像生成(実はFLUX.1)を使ってみた(CloseBox)

イーロン・マスクが8月12日にほのめかしてた、Xと連動した生成AI「Grok」新バージョンGrok 2 mini(beta)の画像生成機能が、自分のアカウントでも使えるようになりました。

Google Pixel 9 / 9 Pro / 9 Pro XL発表。Gemini AI推しでメモリ大増量、Proは大小2サイズ。無印9もカメラ強化 画像
スマートフォン

Google Pixel 9 / 9 Pro / 9 Pro XL発表。Gemini AI推しでメモリ大増量、Proは大小2サイズ。無印9もカメラ強化

Made by Googleイベントで、Googleが今年のPixelスマートフォンPixel 9シリーズを正式に発表しました。

Pixel 9シリーズを語るポッドキャスト第64回を本日(8月14日)正午にライブ配信 画像
AI

Pixel 9シリーズを語るポッドキャスト第64回を本日(8月14日)正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」(テクノエッジ・サイド)を2週に1回のペースでお届けしています。今回は、8月14日に開催されたMade by Googleイベントで発表されたGoogleの新製品などについて語ります。

動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した(CloseBox) 画像
AI

動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した(CloseBox)

AIリップシンクにまた大きな波が訪れました。

Apple開発の画像生成AI「マトリョーシカ拡散モデル」、iPadでリアルタイムに動画を理解するGPT-4V超えAI「MiniCPM-V 2.6」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

Apple開発の画像生成AI「マトリョーシカ拡散モデル」、iPadでリアルタイムに動画を理解するGPT-4V超えAI「MiniCPM-V 2.6」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第59回)では、オープンソースの動画生成AI「CogVideoX」や、動画理解でGPT-4VやClaude 3.5 Sonnetなどを精度で上回るMLLM「MiniCPM-V 2.6」を取り上げます

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に(CloseBox) 画像
AI

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に(CloseBox)

しばらくベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版がついにリリースされたので、購入しました。

テレビにもGemini AI、新製品『Google TV Streamer 』発表。据置き化で大幅強化、Chromecastはディスコン 画像
Other

テレビにもGemini AI、新製品『Google TV Streamer 』発表。据置き化で大幅強化、Chromecastはディスコン

Googleがテレビと接続するセットトップボックス端末『Google TV Streamer 4K』を米国向けに発表しました。

Google、批判受けGemini AIのオリンピックCMを放送中止。なんでも相談して怒られる 画像
AI

Google、批判受けGemini AIのオリンピックCMを放送中止。なんでも相談して怒られる

Google は、批判を受けていたGemini AIのコマーシャル『Google + Team USA − Dear Sydney』を放送から取り下げました。

元Stable Diffusion開発チームによる高性能画像生成AI「FLUX.1」、Perplexity精度のオープンソース検索AI「MindSearch」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

元Stable Diffusion開発チームによる高性能画像生成AI「FLUX.1」、Perplexity精度のオープンソース検索AI「MindSearch」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第58回)では、先日OpenAIが発表した「SearchGPT」など、Webのタイムリーな情報と大規模言語モデルを組みわせた検索AIのオープンソースモデル「MindSearch」や、Stability AIが発表した、単一の入力画像から3Dメッシュを0.5秒で生成する「Stable Fast 3D」を取り上げます。

折りたたみAIフォンGalaxy Z Fold6 / Flip6発売。サムスン副社長にGalaxy AIの戦略を聞く(石野純也) 画像
スマートフォン

折りたたみAIフォンGalaxy Z Fold6 / Flip6発売。サムスン副社長にGalaxy AIの戦略を聞く(石野純也)

 フォルダブルスマホの「Galaxy Z Fold6」「Galaxy Z Flip6」が、7月31日に発売されました。

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい?(CloseBox) 画像
AI

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい?(CloseBox)

1枚の人物画像から動画を生成するAIモデルが4種類、揃いました。Luma AI Dream Machine、Runway Gen-3 Alpha、KLING、Vidu。これらを同じ人物写真(画像)、同じプロンプトで比較してみます。

OpenAI、ChatGPTが感情も読むアドバンスト音声モードを招待制テスト開始『Her』スカヨハ似ボイスは含まず 画像
AI

OpenAI、ChatGPTが感情も読むアドバンスト音声モードを招待制テスト開始『Her』スカヨハ似ボイスは含まず

OpenAIが、ChatGPTの延期していた新機能 Advanced Voice Mode を一部Plusユーザー向けに試験提供しました。

Google、生成AIがアプリUIを動的生成する「AI Generated UI」発表。ユーザー入力をLLMが把握、レイアウトもロジックも都度生成 画像
AI

Google、生成AIがアプリUIを動的生成する「AI Generated UI」発表。ユーザー入力をLLMが把握、レイアウトもロジックも都度生成

基本的に、アプリケーションのユーザーインターエイス(UI)は開発時に設計され実装されて、その実装通りに実行時に表示されるものです。

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか(CloseBox) 画像
AI

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか(CloseBox)

KLINGのサブスクリプションが開始されたばかりですが、翌日の7月31日に早くもライバルが登場しました。同じく中国の動画生成AIサービスで、「Vidu」というものです。といってもぽっと出ではなく、4月末辺りからSoraクラスの動画生成AIとして発表され、注目はされていました。このViduが一般利用可能になったのです。

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか?(CloseBox) 画像
AI

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか?(CloseBox)

7月30日、動画生成AIサービスの老舗であるRunwayが、最新モデルであるGen-3 AlphaでImage to Videoを使えるようにしました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第29回:知ってるとちょっと便利かも?なカスタムNode・ワークフロー特集(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第29回:知ってるとちょっと便利かも?なカスタムNode・ワークフロー特集(西川和久)

1つ何役?controlnet-union-sdxl-1.0

世界一斉ブルースクリーン事件などを語るポッドキャスト第63回を本日(7月29日)正午にライブ配信 画像
AI

世界一斉ブルースクリーン事件などを語るポッドキャスト第63回を本日(7月29日)正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」(テクノエッジ・サイド)を2週に1回のペースでお届けしています。その第62回放送を、本日(7月29日)正午(12時)に、YouTubeで行います。

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第57回)では、生成AIが生成したコンテンツを生成AIが学習し続けると性能低下が見られ、モデル崩壊が起きるという研究報告を取り上げます。また、Sony AIが大型の画像生成AI(11.6億パラメータ)の訓練を8台のNVIDIA H100 GPUを使用してわずか2.6日で完了し、しかもそれが約29万円という高いコストパフォーマンスを達成した手法「MicroDiT」をご紹介します。

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した(CloseBox) 画像
AI

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した(CloseBox)

音質が爆上がりして長さも2分10秒と完成曲が作りやすくなったUdio。1970年代初期のバラード(ユーミンとか)を作ろうと思ってやってみたら、なぜか昭和歌謡っぽいものを連発してきました。

OpenAI、独自検索エンジン「SearchGPT」公開。招待制の期間限定試作、ChatGPTと統合へ 画像
AI

OpenAI、独自検索エンジン「SearchGPT」公開。招待制の期間限定試作、ChatGPTと統合へ

OpenAIが、うわさの独自検索エンジン「SearchGPT Prototype」の試験運用を開始しました。

『WWDC24報告会&テクノエッジ パーティー』イベントリポート。鹿島OPSODIS 1スピーカーの開発秘話も 画像
オーディオ

『WWDC24報告会&テクノエッジ パーティー』イベントリポート。鹿島OPSODIS 1スピーカーの開発秘話も

Appleは6月11日に、年次開発者会議「WWDC24(Worldwide Developers Conference 2024)」を開催しました。

AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に(CloseBox) 画像
AI

AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に(CloseBox)

AI作曲サービスのSunoに、ステム分離機能が追加されました。翌日、Udioがステム分離を含む大幅な機能強化。

アジア系に強い新世代動画生成AI「KLING」がやってきたので試した。実用性高く無料生成も可能、静止画KOLORSも使える(CloseBox) 画像
AI

アジア系に強い新世代動画生成AI「KLING」がやってきたので試した。実用性高く無料生成も可能、静止画KOLORSも使える(CloseBox)

Soraに匹敵する高品質の動画生成AIとして注目を浴びながら、中国の携帯電話番号が必須だったことから世界中の羨望を集めていた、KLINGが一般ユーザーも利用可能になりました。

無限ループ動画が簡単にできる。Luma AIのDream Machineが進化してまた楽しみが増えた(CloseBox) 画像
AI

無限ループ動画が簡単にできる。Luma AIのDream Machineが進化してまた楽しみが増えた(CloseBox)

ポストSoraというか、ビフォーSoraというか、新世代の動画生成AIも老舗であるRunway Gen-3登場以降、目新しいニュースがなかったのですが、Luma AIのDream Machineがちょっとした新機能を追加しました。

AIとの対話を長期記録してLLMの応答をパーソナライズする「Mem0」、オープンソースLLMを商用モデル精度で使用する方法など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

AIとの対話を長期記録してLLMの応答をパーソナライズする「Mem0」、オープンソースLLMを商用モデル精度で使用する方法など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第56回)では、AIとユーザーの対話内容を長期記録し、LLMの応答をそのユーザーにパーソナライズしていくメモリ機能「Mem0」や、音声の理解に優れている大規模言語モデル「Qwen2-Audio」などを取り上げます。

日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった(CloseBox) 画像
AI

日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった(CloseBox)

AI研究家の清水亮さんが面白いことをやっています。「Lispっぽい記法で書けるけど他の言語に慣れた人にも使える言語」の処理系だそうです。

世界的にWindows死のブルースクリーンが多発する中、Suno AIの歌詞・ビデオ修正機能を試した(CloseBox) 画像
AI

世界的にWindows死のブルースクリーンが多発する中、Suno AIの歌詞・ビデオ修正機能を試した(CloseBox)

Windows用エンタープライズセキュリティソフトのCrowdStrikeが原因でWindowsが世界的にブルースクリーンが多発している問題が起きているようです。

画像生成AI実技をオンラインで。「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2期第4回)を7月24日開催。参加者募集します 画像
AI

画像生成AI実技をオンラインで。「Stable Diffusion」の基本から最新技術まで学べる。グラビアカメラマンが教える、生成AIグラビア実践ワークショップ(第2期第4回)を7月24日開催。参加者募集します

人気連載「生成AIグラビアをグラビアカメラマンが作るとどうなる?」の著者である西川和久さんを講師に迎えた、生成AIグラビアワークショップの第2期第4回を7月24日に開催いたします。なお、今回お申し込みいただいた方は、前回分の動画アーカイブを視聴いただけます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第28回:SD3 Mediumその後と、KolorsなどポストSD的なtxt2imgモデルを試す(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第28回:SD3 Mediumその後と、KolorsなどポストSD的なtxt2imgモデルを試す(西川和久)

SD3 Mediumその後

Insta360夏セールで360度カメラX3や超小型カメラが特価、おすすめ解説。AIトラッキングWebカメラ Insta360 Linkも 画像
カメラ

Insta360夏セールで360度カメラX3や超小型カメラが特価、おすすめ解説。AIトラッキングWebカメラ Insta360 Linkも

360度カメラや小型アクションカメラで人気のInsta360が、公式ストアとAmazonで夏セールを実施中です。