AI | テクノエッジ TechnoEdge

テクノロジー 2024 Sep 24

Googleの「私はロボットではありません」を100%突破するCAPTCHA解きAI登場。もう人間とボットを区別できない？（生成AIクローズアップ）

「私はロボットではありません」でお馴染みのGoogleが開発する「CAPTCHA」を突破するAIシステムを提案した論文「Breaking reCAPTCHAv2」を取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Sep 21

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢（CloseBox）

話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。

松尾公也

テクノロジー 2024 Sep 20

オープンワールドゲームを生成するAI「GameGen-O」、テキスト化を省き瞬時に応えるオープン音声AIモデル「LLaMA-Omni」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」（第64回）では、オープンソースな音声AI技術を2つ、AIと音声対話できる「LLaMA-Omni」と、テキストを読み上げる「Fish Speech V1.4」を取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Sep 20

AI作曲のSunoがネガティブプロンプト「Exclude Styles」投入「この楽器や歌声いらない」ができて超便利（CloseBox）

Sunoが投入してきた新機能、ネガティブプロンプト「Exclude Styles」について解説します。

松尾公也

テクノロジー 2024 Sep 19

生まれた時にはこの世にいない「写真1枚だけの父親」がAIで動く姿を親父に見せた（CloseBox）

今年90歳になった僕の父は、自分の父親の記憶がありません。生まれた時には亡くなっていたからです。唯一残された写真をAIで動画にして見せてみました。

松尾公也

テクノロジー 2024 Sep 17

生成AIのハルシネーションは原理的に排除不能。不完全性定理など数学・計算機理論で説明　モデル改良や回避システムでも不可避とする論文（生成AIクローズアップ）

1週間の気になる生成AI技術・研究をピックアップして解説する連載「生成AIウィークリー」から、特に興味深い技術や研究にスポットライトを当てる生成AIクローズアップ。

今回は、大規模言語モデル（LLM）は自身が出力する「幻覚」（ハルシネーション）からは避けられない現象を指摘した論文「LLMs Will Always Hallucinate, and We Need to Live With This」に注目します。

山下裕毅（Seamless）

テクノロジー 2024 Sep 13

AIがカバー曲を作れるように。Suno AI曲の音楽スタイルや歌詞を変えて新しいアレンジで（CloseBox）

作曲AIサービスのSunoが、新しい機能「Covers」を追加しました。楽曲のアレンジや歌詞を変えた「カバー曲」を作るためのものです。

松尾公也

テクノロジー 2024 Sep 11

一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて（CloseBox）

中国産動画生成AI「Vidu」に、Reference to Videoという新機能が加わりました。AI動画生成でObject Consistency、つまり対象物の一貫性を保つことが可能になったのです。

松尾公也

テクノロジー 2024 Sep 10

Apple Intelligenceをフル活用するならiPhone 16やApple Watch 10を買わないとダメ？（CloseBox）

今回のAppleの発表で気になるのは、「新製品は、Apple Intelligenceのために必要なものかどうか」です。

松尾公也

テクノロジー 2024 Sep 9

最高性能うたうオープンソースLLM「Reflection 70B」、動画生成AIでスーパーマリオのプレイ映像を生成する「MarioVGG」など生成AI技術6つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」（第63回）では、GPT-4oやClaude 3.5 SonnetなどのクローズドLLMと同等以上の性能を謳うオープンソースLLM「Reflection 70B」や、画像生成AI「FLUX」をベースにした音楽生成AI「FluxMusic」などを取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Sep 9

プロンプトで画像生成ストリートファイトするAIアーケードゲーム大会「VS AI街頭對戰」、台湾で世界大会決勝（CloseBox）

画像生成AIのプロンプト技を競う世界大会が10月、台湾で開催されます。

松尾公也

テクノロジー 2024 Sep 3

R18成人向け文章も生成できる高性能ローカルAI「Command R+」最新版登場、プレイ画面をリアタイで画像生成できるゲームエンジン「GameNGen」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第62回）では、主要LLMでは制限がかかるような内容でも精度高く出力できるローカルLLM「Command R+」の最新バージョンや、論文などのドキュメントとチャットできるAIインタフェース「kotaemon」を取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Sep 2

Suno酷似のAI作曲サービス「LoudMe」、課金サービス開始したが実態はSunoへの違法アクセスか（CloseBox）

AI音楽生成サービス「LoudMe」が、実はSunoから違法にアクセスしているという指摘が浮上。LoudMeはSunoの無料アカウントを利用し、無断で楽曲を生成しているとの情報が公開された。

松尾公也

テクノロジー 2024 Sep 1

NVIDIA他、長い動画を理解する視覚言語モデル『LongVILA』開発・画像とテキストを1つのモデルで統一する『Show-o』など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第61回）では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Aug 30

AIによる科学的発見を目指す「KAN 2.0」新星ニューラルネットワークアーキテクチャKANを科学に応用（生成AI論文ピックアップ）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第61回）では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Aug 29

Googleの新画像生成AI『ImageFX』が考える非実在日本アイドル史（1968～83）。超リアルだが全部偽物（CloseBox）

非常に高性能な画像生成AI「ImageFX（Imagen 3）」の登場です。

松尾公也

テクノロジー 2024 Aug 29

Meta Reality Labs、人の画像から姿勢や立体形状を高精度に理解するビジョンモデル「Sapiens」発表。3億枚以上の画像で学習（生成AI論文ピックアップ）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第61回）では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Aug 28

自律AIが自律AIを改良し続ける自動設計システム「ADAS」発表。手動設計を大幅に上回る性能

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第61回）では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Aug 27

最高峰の画像生成AI「FLUX.1」で顔LoRA学習（2ドル）したら、AI動画生成も捗った話（CloseBox）

なんといっても現在のトレンドはFLUX.1。これを自分の制作ワークフローに取り入れることができたのでご報告します。

松尾公也

ガジェット 2024 Aug 26

「Pixel 9 Pro XL」と過ごした数日の感想。Gemini Liveと話して体験したGoogle AIはどんなものだったか（Google Tales）

今回の「Google Tales」は、主にPixel 9 Pro XLのAI機能を使ってみたお話です。

佐藤由紀子

テクノロジー 2024 Aug 22

謎の音楽生成AI「LoudMe」登場。Suno激似で作曲し放題、日本語もOK（CloseBox）

SunoとUdioの2強だったボーカル付きAI作曲サービスに新たなライバル「LoudMe」が登場しました。8月15日に発表されたもののあまり話題になっていなかったサービスですが、その実力は相当なもの。実際に試してその実力を探ってみることにします。

松尾公也

テクノロジー 2024 Aug 19

生成AIグラビアをグラビアカメラマンが作るとどうなる？第30回：生成AI画像の本命がいきなり登場！？新型モデルFLUX.1 [dev]を使ってみる(西川和久)

その日はいきなりやって来た！

西川和久

テクノロジー 2024 Aug 19

“2万単語”を一発生成する言語AI「LongWriter」、論文執筆や査読など科学研究全般を自動化する「The AI Scientist」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第60回）では、2万語を一度に出力するモデル「LongWriter」、Googleの画像生成AI「Imagen 3」、そして科学研究を支援する「The AI Scientist」と「OpenResearcher」などを取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Aug 16

10秒のAI動画を17秒で生成。Runway Gen-3 Alpha Turboの7倍高速化とUnlimitedプランでAI動画のワークフロー激変（CloseBox）

動画生成AIの老舗、Runwayが新しいモデル「Gen-3 Alpha Turbo」を公開しました。これがすごいのです。

松尾公也

テクノロジー 2024 Aug 14

XのチャットAI新バージョン「Grok 2 mini（beta）」の画像生成（実はFLUX.1）を使ってみた（CloseBox）

イーロン・マスクが8月12日にほのめかしてた、Xと連動した生成AI「Grok」新バージョンGrok 2 mini（beta）の画像生成機能が、自分のアカウントでも使えるようになりました。

松尾公也

テクノロジー 2024 Aug 14

Pixel 9シリーズを語るポッドキャスト第64回を本日（8月14日）正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」（テクノエッジ・サイド）を2週に1回のペースでお届けしています。今回は、8月14日に開催されたMade by Googleイベントで発表されたGoogleの新製品などについて語ります。

テクノエッジ編集部

テクノロジー 2024 Aug 12

動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した（CloseBox）

AIリップシンクにまた大きな波が訪れました。

松尾公也

テクノロジー 2024 Aug 12

Apple開発の画像生成AI「マトリョーシカ拡散モデル」、iPadでリアルタイムに動画を理解するGPT-4V超えAI「MiniCPM-V 2.6」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第59回）では、オープンソースの動画生成AI「CogVideoX」や、動画理解でGPT-4VやClaude 3.5 Sonnetなどを精度で上回るMLLM「MiniCPM-V 2.6」を取り上げます

山下裕毅（Seamless）

テクノロジー 2024 Aug 8

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に（CloseBox）

しばらくベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版がついにリリースされたので、購入しました。

松尾公也

テクノロジー 2024 Aug 5

Google、批判受けGemini AIのオリンピックCMを放送中止。なんでも相談して怒られる

Google は、批判を受けていたGemini AIのコマーシャル『Google + Team USA − Dear Sydney』を放送から取り下げました。

Ittousai

テクノロジー 2024 Aug 5

元Stable Diffusion開発チームによる高性能画像生成AI「FLUX.1」、Perplexity精度のオープンソース検索AI「MindSearch」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第58回）では、先日OpenAIが発表した「SearchGPT」など、Webのタイムリーな情報と大規模言語モデルを組みわせた検索AIのオープンソースモデル「MindSearch」や、Stability AIが発表した、単一の入力画像から3Dメッシュを0.5秒で生成する「Stable Fast 3D」を取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Aug 1

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい？（CloseBox）

1枚の人物画像から動画を生成するAIモデルが4種類、揃いました。Luma AI Dream Machine、Runway Gen-3 Alpha、KLING、Vidu。これらを同じ人物写真（画像）、同じプロンプトで比較してみます。

松尾公也

テクノロジー 2024 Jul 31

Google、生成AIがアプリUIを動的生成する「AI Generated UI」発表。ユーザー入力をLLMが把握、レイアウトもロジックも都度生成

基本的に、アプリケーションのユーザーインターエイス（UI）は開発時に設計され実装されて、その実装通りに実行時に表示されるものです。

新野淳一

テクノロジー 2024 Jul 31

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか（CloseBox）

KLINGのサブスクリプションが開始されたばかりですが、翌日の7月31日に早くもライバルが登場しました。同じく中国の動画生成AIサービスで、「Vidu」というものです。といってもぽっと出ではなく、4月末辺りからSoraクラスの動画生成AIとして発表され、注目はされていました。このViduが一般利用可能になったのです。

松尾公也

テクノロジー 2024 Jul 30

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか？（CloseBox）

7月30日、動画生成AIサービスの老舗であるRunwayが、最新モデルであるGen-3 AlphaでImage to Videoを使えるようにしました。

松尾公也

テクノロジー 2024 Jul 30

生成AIグラビアをグラビアカメラマンが作るとどうなる？第29回：知ってるとちょっと便利かも？なカスタムNode・ワークフロー特集(西川和久)

1つ何役？controlnet-union-sdxl-1.0

西川和久

テクノロジー 2024 Jul 29

世界一斉ブルースクリーン事件などを語るポッドキャスト第63回を本日（7月29日）正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」（テクノエッジ・サイド）を2週に1回のペースでお届けしています。その第62回放送を、本日（7月29日）正午（12時）に、YouTubeで行います。

テクノエッジ編集部

テクノロジー 2024 Jul 29

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第57回）では、生成AIが生成したコンテンツを生成AIが学習し続けると性能低下が見られ、モデル崩壊が起きるという研究報告を取り上げます。また、Sony AIが大型の画像生成AI（11.6億パラメータ）の訓練を8台のNVIDIA H100 GPUを使用してわずか2.6日で完了し、しかもそれが約29万円という高いコストパフォーマンスを達成した手法「MicroDiT」をご紹介します。

山下裕毅（Seamless）

ガジェット 2024 Jul 29

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る（CloseBox）

動画生成AIはわずか1カ月ちょっとで急激な進化を遂げました。この期間の進化を、人物Image to Videoに絞ってまとめてみます。

松尾公也

テクノロジー 2024 Jul 26

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した（CloseBox）

音質が爆上がりして長さも2分10秒と完成曲が作りやすくなったUdio。1970年代初期のバラード（ユーミンとか）を作ろうと思ってやってみたら、なぜか昭和歌謡っぽいものを連発してきました。

松尾公也

テクノロジー 2024 Jul 25

AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に（CloseBox）

AI作曲サービスのSunoに、ステム分離機能が追加されました。翌日、Udioがステム分離を含む大幅な機能強化。

松尾公也

テクノロジー 2024 Jul 24

アジア系に強い新世代動画生成AI「KLING」がやってきたので試した。実用性高く無料生成も可能、静止画KOLORSも使える（CloseBox）

Soraに匹敵する高品質の動画生成AIとして注目を浴びながら、中国の携帯電話番号が必須だったことから世界中の羨望を集めていた、KLINGが一般ユーザーも利用可能になりました。

松尾公也

AI

Googleの「私はロボットではありません」を100%突破するCAPTCHA解きAI登場。もう人間とボットを区別できない？（生成AIクローズアップ）

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢（CloseBox）

オープンワールドゲームを生成するAI「GameGen-O」、テキスト化を省き瞬時に応えるオープン音声AIモデル「LLaMA-Omni」など生成AI技術5つを解説（生成AIウィークリー）

AI作曲のSunoがネガティブプロンプト「Exclude Styles」投入「この楽器や歌声いらない」ができて超便利（CloseBox）

生まれた時にはこの世にいない「写真1枚だけの父親」がAIで動く姿を親父に見せた（CloseBox）

生成AIのハルシネーションは原理的に排除不能。不完全性定理など数学・計算機理論で説明 モデル改良や回避システムでも不可避とする論文（生成AIクローズアップ）

AIがカバー曲を作れるように。Suno AI曲の音楽スタイルや歌詞を変えて新しいアレンジで（CloseBox）

一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて（CloseBox）

Apple Intelligenceをフル活用するならiPhone 16やApple Watch 10を買わないとダメ？（CloseBox）

最高性能うたうオープンソースLLM「Reflection 70B」、動画生成AIでスーパーマリオのプレイ映像を生成する「MarioVGG」など生成AI技術6つを解説（生成AIウィークリー）

プロンプトで画像生成ストリートファイトするAIアーケードゲーム大会「VS AI街頭對戰」、台湾で世界大会決勝（CloseBox）

R18成人向け文章も生成できる高性能ローカルAI「Command R+」最新版登場、プレイ画面をリアタイで画像生成できるゲームエンジン「GameNGen」など生成AI技術5つを解説（生成AIウィークリー）

Suno酷似のAI作曲サービス「LoudMe」、課金サービス開始したが実態はSunoへの違法アクセスか（CloseBox）

NVIDIA他、長い動画を理解する視覚言語モデル『LongVILA』開発・画像とテキストを1つのモデルで統一する『Show-o』など生成AI技術5つを解説（生成AIウィークリー）

AIによる科学的発見を目指す「KAN 2.0」新星ニューラルネットワークアーキテクチャKANを科学に応用（生成AI論文ピックアップ）

Googleの新画像生成AI『ImageFX』が考える非実在日本アイドル史（1968～83）。超リアルだが全部偽物（CloseBox）

Meta Reality Labs、人の画像から姿勢や立体形状を高精度に理解するビジョンモデル「Sapiens」発表。3億枚以上の画像で学習（生成AI論文ピックアップ）

自律AIが自律AIを改良し続ける自動設計システム「ADAS」発表。手動設計を大幅に上回る性能

最高峰の画像生成AI「FLUX.1」で顔LoRA学習（2ドル）したら、AI動画生成も捗った話（CloseBox）

「Pixel 9 Pro XL」と過ごした数日の感想。Gemini Liveと話して体験したGoogle AIはどんなものだったか（Google Tales）

謎の音楽生成AI「LoudMe」登場。Suno激似で作曲し放題、日本語もOK（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第30回：生成AI画像の本命がいきなり登場！？新型モデルFLUX.1 [dev]を使ってみる(西川和久)

“2万単語”を一発生成する言語AI「LongWriter」、論文執筆や査読など科学研究全般を自動化する「The AI Scientist」など生成AI技術5つを解説（生成AIウィークリー）

10秒のAI動画を17秒で生成。Runway Gen-3 Alpha Turboの7倍高速化とUnlimitedプランでAI動画のワークフロー激変（CloseBox）

XのチャットAI新バージョン「Grok 2 mini（beta）」の画像生成（実はFLUX.1）を使ってみた（CloseBox）

Pixel 9シリーズを語るポッドキャスト第64回を本日（8月14日）正午にライブ配信

動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した（CloseBox）

Apple開発の画像生成AI「マトリョーシカ拡散モデル」、iPadでリアルタイムに動画を理解するGPT-4V超えAI「MiniCPM-V 2.6」など生成AI技術5つを解説（生成AIウィークリー）

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に（CloseBox）

Google、批判受けGemini AIのオリンピックCMを放送中止。なんでも相談して怒られる

元Stable Diffusion開発チームによる高性能画像生成AI「FLUX.1」、Perplexity精度のオープンソース検索AI「MindSearch」など生成AI技術5つを解説（生成AIウィークリー）

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい？（CloseBox）

Google、生成AIがアプリUIを動的生成する「AI Generated UI」発表。ユーザー入力をLLMが把握、レイアウトもロジックも都度生成

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか（CloseBox）

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか？（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第29回：知ってるとちょっと便利かも？なカスタムNode・ワークフロー特集(西川和久)

世界一斉ブルースクリーン事件などを語るポッドキャスト第63回を本日（7月29日）正午にライブ配信

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説（生成AIウィークリー）

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る（CloseBox）

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した（CloseBox）

AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に（CloseBox）

アジア系に強い新世代動画生成AI「KLING」がやってきたので試した。実用性高く無料生成も可能、静止画KOLORSも使える（CloseBox）

生成AIのハルシネーションは原理的に排除不能。不完全性定理など数学・計算機理論で説明　モデル改良や回避システムでも不可避とする論文（生成AIクローズアップ）