Grok、6秒動画をサウンド付きで生成できるように。20秒未満超高速生成、秒で静止画生成の実力を試す(CloseBox)
イーロン・マスクのAI企業であるxAIが開発し、Xにも組み込まれているGrokに、動画生成機能「Imagine」が搭載されました。現在ウェイティングリスト方式で、一部のユーザーに解放されています。
写真の中を自由に歩き回れるAI「Yume」、AIが自律的に新しいAIを開発する「ASI-ARCH」など生成AI技術5つを解説(生成AIウィークリー)
回の「生成AIウィークリー」(第106回)は、写真1枚からその中を自由に歩き回れる動画世界を生成できるAIモデル「Yume」、AIが自律的に新しいAIアーキテクチャを設計・実装・検証するシステム「ASI-ARCH」を取り上げます。
音楽はAIとの音声対話で作る時代に入った。Riffusion改めProducer.aiのAIプロデューサーと日本語で会話するだけで曲を作ってくれるのだ(CloseBox)
AI作曲サービスとしてはSunoが総合力で突出して、それに音質一点突破でUdioが続くという構図が長く(といっても1年くらいですが)続いてきましたが、異変が起きました。
OpenAI、ChatGPTに『学習モード』を追加。学生の「考える力」を育むため
OpenAIは、ChatGPTに新機能「学習モード(Study Mode)」を追加したと発表しました。
欠けて読めない古代ローマ碑文、Googleの生成AIが高精度で復元(生成AIクローズアップ)
今回は、古代ローマの碑文の欠けた文字を復元し、その文章の内容や書かれた時代、場所を推定するAIシステムを提案した論文「Contextualizing ancient texts with generative neural networks」を取り上げます。Google DeepMindやノッティンガム大学などに所属する研究者らがNature誌で発表しました。
脳波を読み取って手を使わず画像編集できるAI「LoongX」、写真1枚から物理法則含む3Dモデルを生成できるAI「PhysX」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第105回)は、脳を読み取って画像を編集できるAI技術「LoongX」や、大規模言語モデルを3分の1に小型化し推論速度2倍を実現する技術「MoR」を取り上げます。
トランプ大統領が「AI行動計画」発表。なかには実現が困難なものも?woke排除も盛り込む
7月23日、米国のドナルド・トランプ大統領は政府の「AI行動計画(Action Plan)」を発表しました。
Galaxy Z Fold7でGalaxy AIはどれくらい進化したのか(石野純也)
サムスン電子の「Galaxy Z Fold7」が、8月1日に発売されます。折りたたんでもわずか8.9mm、かつ215gという驚異の薄さや軽さが注目を集めている同機種ですが、サムスン電子が社運をかけて取り組んでいるGalaxy AIも、前世代の「Galaxy Z Fold6」から進化しています。
11歳児が書いた作文をAIが分析したら、22年後の最終学歴を高い精度で予測できた(生成AIクローズアップ)
今回は、子どもが11歳のときに書いた短い作文から、その子の将来の最終学歴や認知能力をAIが予測できるかを調査した論文「Large language models predict cognition and education close to or better than genomics or expert assessment」を取り上げます。
Netflix、オリジナル実写作品で初めてVFXに生成AIを使用したと認める。共同CEOは「制作サイドも視聴者からも好評価」と自画自賛
Netflixは2025年第2四半期の決算発表で、4月30日から配信を開始したSFドラマシリーズ『The Eternaut(エテルナウタ)』のなかで、自社作品として初めて生成AIをVFX(視覚効果)に使用したことを明らかにしました。
万博を足速に駆け抜けGalaxy Studio Osakaへ行った話(スマホ沼)
サムスンが大阪万博で本国の偉い方によるSamsung「Galaxy AI」パネルディスカッションをするというので、ハカセと聞きに行きました。
ミュージシャンなら使わないともったいないAI新機能登場。SunoのAI作曲新モデルv4.5+でボーカルやインストからのアレンジ試行が超簡単に(CloseBox)
AI作曲サービスのSunoが魅力的な機能を追加した新モデルv4.5+を公開しました。有料プランのユーザーが利用できます。
CopilotがWindowsの画面を監視、サポート提供する「Vision Share」機能がInsider向けに提供開始
マイクロソフトは、Microsoft Storeを通じてMicrosoft Copilotのアップデート提供を開始するとし、その最新の更新プログラムで、Copilot Visionに「Desktop Share(デスクトップ共有)」機能を追加すると発表しました。
AIは惑星の動きからニュートン力学を発見できるのか? 表面だけで本質を考えていないAIを炙り出す(生成AIクローズアップ)
今回は、現在のAIモデルが次に来るものを予測することによって、その背後にある深い仕組みを理解できているかを調査した論文「What Has a Foundation Model Found? Using Inductive Bias to Probe for World Models」を取り上げます。ハーバード大学とMITの研究チームによる発表です。
Windsurf、競合AI開発環境Devinの開発元Cognitionに買収される。OpenAIとの破談、Googleによる幹部引き抜きの末に
OpenAIによるWindsurf買収が破談となり、創業者や主要開発者がGoogleに引き抜かれましたが、残ったWindsurfの行方が決まりました。
GrokのiOSアプリでゴスロリ美少女キャラとの音声対話が可能に。二重人格レッサーパンダも(CloseBox)
xAIが開発する対話型AI「Grok」のiOSアプリに、3Dアバター機能「コンパニオンモード」が新たに追加されました。
OpenAIのWindsurf買収をGoogleが幹部引き抜きで阻止し、AIコードエディタへ進出か。Windsurfサービスは開発継続表明
主要なAIコードエディタの1つである「Windsurf」を開発する同名のWindsurfは、同社CEOであるVarun Mohan氏、共同創業者のDouglas Chen氏、および同社の研究開発部門の社員数名が、Googleに移籍したことを発表しました。
AIアバターとの対話で作った新曲とその課題。「知的探求フロンティア タモリ・山中伸弥の!?」出演の補足(CloseBox)
7月12日にNHK総合テレビで放映された「知的探求フロンティア タモリ・山中伸弥の!?」第1回「AIは人間を超えるか」の中で、筆者のAIに関する取り組みがドキュメント「AIのある人生」として、取り上げられました。
NHKの新番組「知的探求フロンティア タモリ・山中伸弥の!?(びっくりはてな)」第1回は「AIは人間を超えるか」。AIタモリなど盛りだくさんのAIトピックが登場(CloseBox)
NHK総合で放送される新番組「知的探求フロンティア タモリ・山中伸弥の!?(びっくりはてな)」は、2カ月に1回の「知的探求エンターテインメント番組」だそうで、第1回は7月12日19時30分からスタートします。
プレイしながら文章でワールドを瞬時に生成していくAIゲームエンジン「Mirage」、Appleの新コーディング生成AI「DiffuCoder」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第103回)は、プレイしながらプロンプトでゲームの世界をリアルタイム生成していくAIゲームエンジン「Mirage」や、Appleの新コーディング生成AI「DiffuCoder」を取り上げます。
実在AIモデルという選択肢。商業利用で非実在AIより有利な理由(CloseBox)
世の中の流れは生成AIに向かうのは確実ですが、現時点ではリスクが大きい、でも従来手法ではコストがかかりすぎる……そんなユーザーに向け、「実在AIによる人物ビジネス画像提供」システム提供を始めたところがあります。
xAIのGrok、ヒトラー礼賛や反ユダヤ発言が頻回に発生しふたたび物議醸す。問題発言は後に削除
7月8日、イーロン・マスク氏が設立したAI企業で、最近Xと合併したxAIのAIチャットボット「Grok」が、ナチス・ドイツの独裁者アドルフ・ヒトラーを称賛し、反ユダヤ的表現を含む投稿を幾度も行っていることが報告されて物議を醸しています。
首都圏に1000体の「人格AI」を生活させ行動シミュレーションする「CitySim」、トヨタが開発。最大100万体まで(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、大規模言語モデル(LLM)を活用した都市シミュレーターを紹介した論文「CitySim: Modeling Urban Behaviors and City Dynamics with Large-Scale LLM-Driven Agent Simulation」を取り上げます。
新世代の2D→3DモデルAI変換サービス「Hitem3D」が有料版でテクスチャ搭載、日本語表示にも(CloseBox)
高精細の2D→3Dモデル変換で衝撃を与えたSparc3Dの商用版であるHitem3Dが有料サブスクリプションに対応しました。有料ユーザーは待望のテクスチャ対応が使えるようになりました。
老舗コンピュータ書籍出版社の秀和システムが事業終了、8月末に新刊を予定していた著者はどうしたらいいんでしょうか?(CloseBox)
コンピュータ関連書籍の出版社として知られる、秀和システムの出版事業が終わることが決まりました。8月末に同社から新刊を予定していた筆者はどうすれば良いのでしょうか?
Runway、ビデオゲームをAI生成するプラットフォーム「Game Worlds」開始へ
動画生成AIツールで知られるRunwayが、米国のケーブルテレビ会社AMCとの協力により、早ければ今週にもゲーム業界向けの生成AIプラットフォーム「Game Worlds」を一般公開すべく準備を進めています。
「AIエージェント」と「エージェント型AI」の違いをはっきりさせようか(生成AIクローズアップ)
今回は、人工知能技術の急速な発展により登場した、「AIエージェント」(AI Agents)と「エージェント型AI」(Agentic AI)という2つの概念の違いを説明した論文「AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges」を取り上げます。
AI作曲サービスのSuno、クラウドDAWのWavToolを買収。MIDI生成やVST対応も可能に?(CloseBox)
AI作曲サービスのSunoが、AIクラウドDAWのWavToolを買収しました。
Metaが元OpenAIの著名研究者を雇用。独自のAI推論モデル開発体制を強化
Metaは、AI推論モデルの開発を強化加速するために、元OpenAIの研究者、トラピット・バンサル氏を迎え入れたと伝えられています。
静止画から高精細な3Dモデル生成できる注目技術「Sparc3D」に異変。オープンソースではなく商用化に舵切ったHitem3Dでどう変わるのか?(CloseBox)
筆者はこのところ、静止画から3Dモデルを生成するSparc3Dという技術を使って、3Dプリントする試みをしていますが、そのSparc3Dにちょっとした異変が起きています。
100万トークンを一度に処理できるオープンウェイト推論AI「MiniMax-M1」、写真1枚から3Dモデルを生成するテンセント開発AIモデル「Hunyuan3D 2.1」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第101回)は、従来のトークン化を不要にしたアプローチを採用した言語AI「AU-Net」や、テキストや画像、動画の理解と生成を1つに統合したAIモデル「Show-o2」を取り上げます。
Geminiだけじゃ何故ダメか。シャープ、OPPO、モトローラ、FCNTが“独自AI”をスマホに載せアピールする理由(石野純也)
シャープ、FCNT、モトローラ、OPPOと、ここ1カ月の間に、日本や中国のメーカーが相次いでスマホの夏モデルを発表しました。
100万円の高級折りたたみスマホもAIをウリに。いつか体験したいVERTU QUANTUM FLIP登場(スマホ沼)
VERTUの超高級折りたたみスマホ「QUANTUM FLIP」は高級素材と量子暗号、AI機能を搭載し、性能だけでなくプレミアム感を重視している。
AIを使うと脳が衰えていく? AIツール長期使用の脳への影響を測定(生成AIクローズアップ)
今回は、エッセイ執筆時にChatGPTなどのAIツールを使用することによる認知的影響を米MITなどが調査した研究「Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task」を取り上げます。
Appleによる新方式の画像生成AI「STARFlow」、Veo 3超えのByteDance最新動画AI「Seedance 1.0」を発表など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第100回)では、ByteDanceから発表された3つの技術と、Appleの新たな画像生成AIをご紹介します。
著作権訴訟渦中のミッドジャーニーがAI動画生成スタート。最後発なのに使い勝手がいい理由(CloseBox)
AI画像生成最古参の一つであるMidjourneyがようやく動画生成サービス「Video Model Version 1」を開始しました。Midjourneyで生成、またはアップロードした画像を動かす、Image to Videoでの提供です。
「AIモード」到来でGoogle検索はどう変わる?(Google Tales)
今回の「Google Tales」では、Google検索が生成AIでどう変わっていくのかを考えます。「AI Overview」(日本では「AIによる概要」)から「AI Mode」へ、そしてAIが変えるショッピング体験、未来の「AIエージェント」がどうなっていくのか、などを考えます。
「生成AIは巨大なコピー機」という主張は正しいのか? AIが“著作権コンテンツ”をどれくらい再現できるのか検証(生成AIクローズアップ)
大規模言語モデル(LLM)が著作権のある書籍をどの程度記憶し、再現できるかを定量的に検証した研究「Extracting memorized pieces of (copyrighted) books from open-weight language models」を取り上げます。
触れて感じ取れる生成AI。1枚の人物写真から高精細3Dモデルを作り出すSparc3Dで、妻の半身像を3Dプリントしてみた(CloseBox)
筆者は2022年から、妻の写真からAI画像を生成したり、動画を作る活動をやっていますが、今回、写真から立体像を製作するプロジェクトが進展しました。生成AIを使い、写真1枚からリアルな人間の3Dプリントができるところまで、技術が進化したのです。
8TBの“著作権フリー”含むAI用大規模データセット「Common Pile v0.1」、長さ上限なしで動画生成できる音声駆動AI「SkyReels-Audio」など生成AI技術6つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第99回)では、人間のようにPC画面を見て操作するMicrosoft開発のAIエージェント「GUI-Actor」や、理論上無限の長さのリップシンク映像を生成できる動画AI「SkyReels-Audとio」を取り上げます。
「盗作の底なし沼」ディズニー、画像生成AIのミッドジャーニーを著作権侵害で訴える。学習段階の侵害や幇助も主張
ディズニーとユニバーサルが、画像生成AIサービスのMidjourneyを著作権侵害で訴えました。
【WWDC25】Apple Intelligenceにライブ翻訳やビジュアルインテリジェンスなど新機能続々。アプリからAIモデルが利用可能に
アップルは、日本時間6月10日午前2時から、世界開発者会議(WWDC25)の基調講演を配信しました。今回はハードウェアの話題はなかったものの、アップルの製品に搭載される各OSに対する、大幅なアップデートが発表されています。
