AI

Google、生成AIがアプリUIを動的生成する「AI Generated UI」発表。ユーザー入力をLLMが把握、レイアウトもロジックも都度生成 画像
テクノロジー

Google、生成AIがアプリUIを動的生成する「AI Generated UI」発表。ユーザー入力をLLMが把握、レイアウトもロジックも都度生成

基本的に、アプリケーションのユーザーインターエイス(UI)は開発時に設計され実装されて、その実装通りに実行時に表示されるものです。

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか(CloseBox) 画像
テクノロジー

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか(CloseBox)

KLINGのサブスクリプションが開始されたばかりですが、翌日の7月31日に早くもライバルが登場しました。同じく中国の動画生成AIサービスで、「Vidu」というものです。といってもぽっと出ではなく、4月末辺りからSoraクラスの動画生成AIとして発表され、注目はされていました。このViduが一般利用可能になったのです。

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか?(CloseBox) 画像
テクノロジー

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか?(CloseBox)

7月30日、動画生成AIサービスの老舗であるRunwayが、最新モデルであるGen-3 AlphaでImage to Videoを使えるようにしました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第29回:知ってるとちょっと便利かも?なカスタムNode・ワークフロー特集(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第29回:知ってるとちょっと便利かも?なカスタムNode・ワークフロー特集(西川和久)

1つ何役?controlnet-union-sdxl-1.0

世界一斉ブルースクリーン事件などを語るポッドキャスト第63回を本日(7月29日)正午にライブ配信 画像
テクノロジー

世界一斉ブルースクリーン事件などを語るポッドキャスト第63回を本日(7月29日)正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」(テクノエッジ・サイド)を2週に1回のペースでお届けしています。その第62回放送を、本日(7月29日)正午(12時)に、YouTubeで行います。

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第57回)では、生成AIが生成したコンテンツを生成AIが学習し続けると性能低下が見られ、モデル崩壊が起きるという研究報告を取り上げます。また、Sony AIが大型の画像生成AI(11.6億パラメータ)の訓練を8台のNVIDIA H100 GPUを使用してわずか2.6日で完了し、しかもそれが約29万円という高いコストパフォーマンスを達成した手法「MicroDiT」をご紹介します。

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る(CloseBox) 画像
ガジェット

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る(CloseBox)

動画生成AIはわずか1カ月ちょっとで急激な進化を遂げました。この期間の進化を、人物Image to Videoに絞ってまとめてみます。

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した(CloseBox) 画像
テクノロジー

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した(CloseBox)

音質が爆上がりして長さも2分10秒と完成曲が作りやすくなったUdio。1970年代初期のバラード(ユーミンとか)を作ろうと思ってやってみたら、なぜか昭和歌謡っぽいものを連発してきました。

AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に(CloseBox) 画像
テクノロジー

AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に(CloseBox)

AI作曲サービスのSunoに、ステム分離機能が追加されました。翌日、Udioがステム分離を含む大幅な機能強化。

アジア系に強い新世代動画生成AI「KLING」がやってきたので試した。実用性高く無料生成も可能、静止画KOLORSも使える(CloseBox) 画像
テクノロジー

アジア系に強い新世代動画生成AI「KLING」がやってきたので試した。実用性高く無料生成も可能、静止画KOLORSも使える(CloseBox)

Soraに匹敵する高品質の動画生成AIとして注目を浴びながら、中国の携帯電話番号が必須だったことから世界中の羨望を集めていた、KLINGが一般ユーザーも利用可能になりました。

無限ループ動画が簡単にできる。Luma AIのDream Machineが進化してまた楽しみが増えた(CloseBox) 画像
テクノロジー

無限ループ動画が簡単にできる。Luma AIのDream Machineが進化してまた楽しみが増えた(CloseBox)

ポストSoraというか、ビフォーSoraというか、新世代の動画生成AIも老舗であるRunway Gen-3登場以降、目新しいニュースがなかったのですが、Luma AIのDream Machineがちょっとした新機能を追加しました。

AIとの対話を長期記録してLLMの応答をパーソナライズする「Mem0」、オープンソースLLMを商用モデル精度で使用する方法など生成AI技術5つを解説(生成AIウィークリー) 画像
テクノロジー

AIとの対話を長期記録してLLMの応答をパーソナライズする「Mem0」、オープンソースLLMを商用モデル精度で使用する方法など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第56回)では、AIとユーザーの対話内容を長期記録し、LLMの応答をそのユーザーにパーソナライズしていくメモリ機能「Mem0」や、音声の理解に優れている大規模言語モデル「Qwen2-Audio」などを取り上げます。

日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった(CloseBox) 画像
テクノロジー

日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった(CloseBox)

AI研究家の清水亮さんが面白いことをやっています。「Lispっぽい記法で書けるけど他の言語に慣れた人にも使える言語」の処理系だそうです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第28回:SD3 Mediumその後と、KolorsなどポストSD的なtxt2imgモデルを試す(西川和久) 画像
テクノロジー

生成AIグラビアをグラビアカメラマンが作るとどうなる?第28回:SD3 Mediumその後と、KolorsなどポストSD的なtxt2imgモデルを試す(西川和久)

SD3 Mediumその後