AI

テスラのマスク氏、自動運転ロボタクシー『サイバーキャブ』発表。20人乗れる『ロボバン』もサプライズ公開 画像
Mobility

テスラのマスク氏、自動運転ロボタクシー『サイバーキャブ』発表。20人乗れる『ロボバン』もサプライズ公開

テスラは日本時間10月11日に開催されたイベント「We, Robot」で2人乗りの自動運転ロボットカー「サイバーキャブ(Cybercab)」と、最大20人が乗れるという「ロボバン(Robovan)」を発表しました。

Appleの奥行き推定AI「Depth Pro」・Metaの動画生成AI「MovieGen」・日本語専用AIベンチ「JMMMU」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

Appleの奥行き推定AI「Depth Pro」・Metaの動画生成AI「MovieGen」・日本語専用AIベンチ「JMMMU」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第66回)では、日本語専用LLMベンチマーク「JMMMU」や、Appleの画像深度推定モデル「Depth Pro」を取り上げます。また、Metaが開発した動画生成AI「MovieGen」や、テキストや画像1枚から3Dコンテンツを生成する「Flex3D」をご紹介します。

Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox) 画像
AI

Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox)

これはすごいと話題になっていたYouTube動画。これに対抗しようとやってみました。

動画生成AIにまたもや新星。「Hailuo」は写真を6秒の動画にできて(今のところは)無料。かつ人物の一貫性に優れている(CloseBox) 画像
AI

動画生成AIにまたもや新星。「Hailuo」は写真を6秒の動画にできて(今のところは)無料。かつ人物の一貫性に優れている(CloseBox)

Image to Video、つまり静止画を短い動画にできる動画生成AIの新サービスが登場しました。中国の「Hailuo」(ハイルオ)がそれで、中国製動画生成AIとしては、KLING、Viduに次ぐ3番手となります。

第三回AIアートグランプリ、一次審査通過10作品、絵画部門11作品決まる。最終審査会は11月9日 画像
AI

第三回AIアートグランプリ、一次審査通過10作品、絵画部門11作品決まる。最終審査会は11月9日

AIアート作品コンテスト「第三回AIアートグランプリ」の予選通過作品が決定しました。

トバログ鳥羽恒彰さんをゲストに迎え、ポッドキャスト第68回を本日(10月7日)正午にライブ配信 画像
スマートフォン

トバログ鳥羽恒彰さんをゲストに迎え、ポッドキャスト第68回を本日(10月7日)正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」(テクノエッジ・サイド)を2週に1回のペースでお届けしています。

スマートグラスで個人情報を「透視」。見ている相手のプライバシーデータをリアルタイムで表示する技術「I-XRAY」(生成AIクローズアップ) 画像
AI

スマートグラスで個人情報を「透視」。見ている相手のプライバシーデータをリアルタイムで表示する技術「I-XRAY」(生成AIクローズアップ)

今回は、スマートグラスに映る他人の顔から名前や住所などの個人情報を特定する技術を説明したドキュメント「I-XRAY: The AI Glasses That Reveal Anyone’s Personal Details—Home Address, Name, Phone Number, and More—Just from Looking at Them」に注目します。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第33回:FLUX.1登場から約2ヶ月(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第33回:FLUX.1登場から約2ヶ月(西川和久)

FLUX.1登場から約2ヶ月経った現状

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に(CloseBox) 画像
AI

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に(CloseBox)

AIリップシンクサービスのHedraが新バージョン「Character-2」を公開したので使ってみました。

PDFを対話ポッドキャスト化するローカルAI「PDF2Audio」、キャラ1枚絵を滑らかに動かせる「MIMO」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

PDFを対話ポッドキャスト化するローカルAI「PDF2Audio」、キャラ1枚絵を滑らかに動かせる「MIMO」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第66回)では、2つの新しいマルチモーダルモデル「Emu3」と「Molmo」を取り上げます。Emu3は拡散アーキテクチャを使用しないモデルで、Molmoは人間が画像を見て音声でラベル付けした独自データセットを使用したモデルです。

AI普及で人間の役割は「発想力」へ。東京24時間AIハッカソン 2024イベントリポート 画像
AI

AI普及で人間の役割は「発想力」へ。東京24時間AIハッカソン 2024イベントリポートPR

PCパーツショップのドスパラの運営元であるサードウェーブが主催する「24時間AIハッカソン Powered by GALLERIA」は9月14日から15日、「東京24時間AIハッカソン 2024」を開催しました。

AI編集画像・動画の「ニセ記憶」で人の記憶を上書きできるか? 200人を対象にMITが実験(生成AIクローズアップ) 画像
AI

AI編集画像・動画の「ニセ記憶」で人の記憶を上書きできるか? 200人を対象にMITが実験(生成AIクローズアップ)

今回は、AIで編集された画像や動画によって人間の記憶をどれだけニセの記憶に上書きできるかを調査した論文「Synthetic Human Memories: AI-Edited Images and Videos Can Implant False Memories and Distort Recollection」に注目します。

グラビアカメラマンがAI生成したグラビア写真をAIで動画化してみた。架空ゲームショウの謎コスプレもあるよ(西川和久&松尾公也) 画像
AI

グラビアカメラマンがAI生成したグラビア写真をAIで動画化してみた。架空ゲームショウの謎コスプレもあるよ(西川和久&松尾公也)

今回は、過去作った記事などのヘッダー画像+αから松尾氏に動画を作っていただくという、コラボ企画。元画像はSD 1.5、SDXL、SD3 Medium、そしてFLUX.1 [dev] が入り乱れての動画となる。

人間のようなやり取りで話すローカル会話AI「Moshi」、10秒の話し声を既存楽曲のボーカルに変換できる音楽生成AI「Seed-Music」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

人間のようなやり取りで話すローカル会話AI「Moshi」、10秒の話し声を既存楽曲のボーカルに変換できる音楽生成AI「Seed-Music」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」(第65回)では、対話スピードや会話中の割り込みの自然さなど、人間と話しているかのような会話ができるモデル「Moshi」や、ByteDanceが開発した音楽生成・編集モデル「Seed-Music」を取り上げます。

遅れに遅れたChatGPT高度な音声モードが公開開始されたので、AIパーソナリティーのポッドキャストを作ってみた(CloseBox) 画像
AI

遅れに遅れたChatGPT高度な音声モードが公開開始されたので、AIパーソナリティーのポッドキャストを作ってみた(CloseBox)

OpenAIがようやくAdvanced Voice Modeのロールアウトを始めました。

Googleの「私はロボットではありません」を100%突破するCAPTCHA解きAI登場。もう人間とボットを区別できない?(生成AIクローズアップ) 画像
AI

Googleの「私はロボットではありません」を100%突破するCAPTCHA解きAI登場。もう人間とボットを区別できない?(生成AIクローズアップ)

「私はロボットではありません」でお馴染みのGoogleが開発する「CAPTCHA」を突破するAIシステムを提案した論文「Breaking reCAPTCHAv2」を取り上げます。

元Appleのジョニー・アイブ、OpenAIサム・アルトマンとのAIデバイス開発を認める。年内に10億ドル規模の調達も 画像
AI

元Appleのジョニー・アイブ、OpenAIサム・アルトマンとのAIデバイス開発を認める。年内に10億ドル規模の調達も

元Appleで数多くの製品デザインを手掛けたジョニー・アイブが、OpenAIのサム・アルトマンと「AIデバイス」製品を開発していることを認めました。

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox) 画像
AI

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox)

話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。

オープンワールドゲームを生成するAI「GameGen-O」、テキスト化を省き瞬時に応えるオープン音声AIモデル「LLaMA-Omni」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

オープンワールドゲームを生成するAI「GameGen-O」、テキスト化を省き瞬時に応えるオープン音声AIモデル「LLaMA-Omni」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」(第64回)では、オープンソースな音声AI技術を2つ、AIと音声対話できる「LLaMA-Omni」と、テキストを読み上げる「Fish Speech V1.4」を取り上げます。

AI作曲のSunoがネガティブプロンプト「Exclude Styles」投入「この楽器や歌声いらない」ができて超便利(CloseBox) 画像
AI

AI作曲のSunoがネガティブプロンプト「Exclude Styles」投入「この楽器や歌声いらない」ができて超便利(CloseBox)

Sunoが投入してきた新機能、ネガティブプロンプト「Exclude Styles」について解説します。

生まれた時にはこの世にいない「写真1枚だけの父親」がAIで動く姿を親父に見せた(CloseBox) 画像
AI

生まれた時にはこの世にいない「写真1枚だけの父親」がAIで動く姿を親父に見せた(CloseBox)

今年90歳になった僕の父は、自分の父親の記憶がありません。生まれた時には亡くなっていたからです。唯一残された写真をAIで動画にして見せてみました。

生成AIのハルシネーションは原理的に排除不能。不完全性定理など数学・計算機理論で説明 モデル改良や回避システムでも不可避とする論文(生成AIクローズアップ) 画像
AI

生成AIのハルシネーションは原理的に排除不能。不完全性定理など数学・計算機理論で説明 モデル改良や回避システムでも不可避とする論文(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をピックアップして解説する連載「生成AIウィークリー」から、特に興味深い技術や研究にスポットライトを当てる生成AIクローズアップ。

今回は、大規模言語モデル(LLM)は自身が出力する「幻覚」(ハルシネーション)からは避けられない現象を指摘した論文「LLMs Will Always Hallucinate, and We Need to Live With This」に注目します。

AIがカバー曲を作れるように。Suno AI曲の音楽スタイルや歌詞を変えて新しいアレンジで(CloseBox) 画像
AI

AIがカバー曲を作れるように。Suno AI曲の音楽スタイルや歌詞を変えて新しいアレンジで(CloseBox)

作曲AIサービスのSunoが、新しい機能「Covers」を追加しました。楽曲のアレンジや歌詞を変えた「カバー曲」を作るためのものです。

一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて(CloseBox) 画像
AI

一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて(CloseBox)

中国産動画生成AI「Vidu」に、Reference to Videoという新機能が加わりました。AI動画生成でObject Consistency、つまり対象物の一貫性を保つことが可能になったのです。

Apple Intelligenceをフル活用するならiPhone 16やApple Watch 10を買わないとダメ?(CloseBox) 画像
AI

Apple Intelligenceをフル活用するならiPhone 16やApple Watch 10を買わないとダメ?(CloseBox)

今回のAppleの発表で気になるのは、「新製品は、Apple Intelligenceのために必要なものかどうか」です。

iPhone 16など「アップル秋の新製品」を本社で触ってきた Apple Watch Series 10 / Ultra 2 / AirPods 4も(西田宗千佳) 画像
スマートフォン

iPhone 16など「アップル秋の新製品」を本社で触ってきた Apple Watch Series 10 / Ultra 2 / AirPods 4も(西田宗千佳)

iPhone 16など「アップル秋の新製品」をアップル本社で触ってきた

iPhone 16 / Pro新色、実機はこんな色。Apple Watch Series 10、Ultra 2黒、AirPods 4も(Apple新製品ギャラリー) 画像
スマートフォン

iPhone 16 / Pro新色、実機はこんな色。Apple Watch Series 10、Ultra 2黒、AirPods 4も(Apple新製品ギャラリー)

アップルが9日のスペシャルイベントで発表した新製品、iPhone 16シリーズと新Apple Watch、新AirPodsの実機ハンズオンギャラリーをお届けします。

Apple iPhone 16 Pro / Pro Max発表、15万9800円から。歴代最大画面に「カメラコントロール」新設、A18 ProでAI性能大幅強化 画像
スマートフォン

Apple iPhone 16 Pro / Pro Max発表、15万9800円から。歴代最大画面に「カメラコントロール」新設、A18 ProでAI性能大幅強化

9月9日のスペシャルイベントで、Appleが iPhone 16 Pro / Pro Maxを発表しました。

最高性能うたうオープンソースLLM「Reflection 70B」、動画生成AIでスーパーマリオのプレイ映像を生成する「MarioVGG」など生成AI技術6つを解説(生成AIウィークリー) 画像
AI

最高性能うたうオープンソースLLM「Reflection 70B」、動画生成AIでスーパーマリオのプレイ映像を生成する「MarioVGG」など生成AI技術6つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」(第63回)では、GPT-4oやClaude 3.5 SonnetなどのクローズドLLMと同等以上の性能を謳うオープンソースLLM「Reflection 70B」や、画像生成AI「FLUX」をベースにした音楽生成AI「FluxMusic」などを取り上げます。

アップル、iPhone 16発表イベントは10日午前2時から。新製品予測は新型 AirPods や Apple Watch 10など 画像
スマートフォン

アップル、iPhone 16発表イベントは10日午前2時から。新製品予測は新型 AirPods や Apple Watch 10など

Appleは9月9日に新製品発表のスペシャルイベントを開催します。日本時間では9月10日午前2時から。

iPhone 16(仮)発表直前。ポッドキャスト第66回を本日(9月9日)正午にライブ配信 画像
スマートフォン

iPhone 16(仮)発表直前。ポッドキャスト第66回を本日(9月9日)正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」(テクノエッジ・サイド)を2週に1回のペースでお届けしています。

プロンプトで画像生成ストリートファイトするAIアーケードゲーム大会「VS AI街頭對戰」、台湾で世界大会決勝(CloseBox) 画像
AI

プロンプトで画像生成ストリートファイトするAIアーケードゲーム大会「VS AI街頭對戰」、台湾で世界大会決勝(CloseBox)

画像生成AIのプロンプト技を競う世界大会が10月、台湾で開催されます。

生成AIが大企業プログラマの仕事に与える影響 マイクロソフトなど企業4800人以上を調査した結果(生成AIクローズアップ) 画像
AI

生成AIが大企業プログラマの仕事に与える影響 マイクロソフトなど企業4800人以上を調査した結果(生成AIクローズアップ)

1週間の気になる生成AI技術・研究をピックアップして解説する連載「生成AIウィークリー」において、特に興味深い技術や研究にスポットライトを当てる生成AIクローズアップ。

11月8日・9日開催「AIフェスティバル 2024 Powered by GALLERIA」基調講演は落合陽一 画像
AI

11月8日・9日開催「AIフェスティバル 2024 Powered by GALLERIA」基調講演は落合陽一

11月8日、9日に秋葉原で開催されるAIイベント「AIフェスティバル 2024 Powered by GALLERIA」の講演内容が発表されました。

R18成人向け文章も生成できる高性能ローカルAI「Command R+」最新版登場、プレイ画面をリアタイで画像生成できるゲームエンジン「GameNGen」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

R18成人向け文章も生成できる高性能ローカルAI「Command R+」最新版登場、プレイ画面をリアタイで画像生成できるゲームエンジン「GameNGen」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第62回)では、主要LLMでは制限がかかるような内容でも精度高く出力できるローカルLLM「Command R+」の最新バージョンや、論文などのドキュメントとチャットできるAIインタフェース「kotaemon」を取り上げます。

Suno酷似のAI作曲サービス「LoudMe」、課金サービス開始したが実態はSunoへの違法アクセスか(CloseBox) 画像
AI

Suno酷似のAI作曲サービス「LoudMe」、課金サービス開始したが実態はSunoへの違法アクセスか(CloseBox)

AI音楽生成サービス「LoudMe」が、実はSunoから違法にアクセスしているという指摘が浮上。LoudMeはSunoの無料アカウントを利用し、無断で楽曲を生成しているとの情報が公開された。

NVIDIA他、長い動画を理解する視覚言語モデル『LongVILA』開発・画像とテキストを1つのモデルで統一する『Show-o』など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

NVIDIA他、長い動画を理解する視覚言語モデル『LongVILA』開発・画像とテキストを1つのモデルで統一する『Show-o』など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第61回)では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。

今そこにある最強動画生成AI「Runway Gen-3 Alpha」が40秒の動画生成可能に。リップシンクもできる(CloseBox) 画像
AI

今そこにある最強動画生成AI「Runway Gen-3 Alpha」が40秒の動画生成可能に。リップシンクもできる(CloseBox)

Runway Gen-3 Alphaで40秒までの動画生成ができるようになったので、試してみました。

AIによる科学的発見を目指す「KAN 2.0」新星ニューラルネットワークアーキテクチャKANを科学に応用(生成AI論文ピックアップ) 画像
AI

AIによる科学的発見を目指す「KAN 2.0」新星ニューラルネットワークアーキテクチャKANを科学に応用(生成AI論文ピックアップ)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第61回)では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。

Googleの新画像生成AI『ImageFX』が考える非実在日本アイドル史(1968~83)。超リアルだが全部偽物(CloseBox) 画像
AI

Googleの新画像生成AI『ImageFX』が考える非実在日本アイドル史(1968~83)。超リアルだが全部偽物(CloseBox)

非常に高性能な画像生成AI「ImageFX(Imagen 3)」の登場です。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第31回:新型ForgeでFLUX.1 [dev] fp8を生成する(西川和久) 画像
Science

生成AIグラビアをグラビアカメラマンが作るとどうなる?第31回:新型ForgeでFLUX.1 [dev] fp8を生成する(西川和久)

新型Forgeその後

Meta Reality Labs、人の画像から姿勢や立体形状を高精度に理解するビジョンモデル「Sapiens」発表。3億枚以上の画像で学習(生成AI論文ピックアップ) 画像
AI

Meta Reality Labs、人の画像から姿勢や立体形状を高精度に理解するビジョンモデル「Sapiens」発表。3億枚以上の画像で学習(生成AI論文ピックアップ)

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第61回)では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。