
OpenAI「o3」は本当に“AGI”に近いのか? AGIレベルを評価する「ARC-AGI」の開発者が解説(生成AIクローズアップ)
OpenAIが最近発表したAIモデル「o3」と汎用人工知能(AGI)について、AGIの性能を評価するベンチマーク「ARC-AGI」の開発者フランソワ・ショレ氏(Googleの研究者)が考察した記事に注目します。

MicrosoftのGPT-4o超え小型言語AI「Phi-4」、カメラ越しの現実をリアルタイムに理解するオープンソースAI「IXC2.5-OL」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第75回)では、Microsoftの新しい言語モデル「Phi-4」や、カメラ越しに映る現実をリアルタイムに理解するAIモデル「IXC2.5-OL」を取り上げます。

VOCALOID発売から20年。ChatGPTに歌声合成の歴史をまとめてもらった(CloseBox)
VOCALOIDが発売から20年を迎え、ヤマハの特設ページが公開されました。継続的にVOCALOIDの新技術を試して記事にしていた筆者もお祝いのメッセージを書いています。

折りたたみバトルが激化!世界最薄登場 - 2024年振り返り7月編(スマホ沼)
2024年7月、サムスンやHONOR、シャオミが折りたたみスマホを発表し、競争が激化。サムスンの最薄モデルが登場する中、HONORのMagic V3がさらに薄さを更新した。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第38回:FLUX.1 Tools登場!(西川和久)
FLUX.1 Toolsとは?

音楽・動画AIの進化が加速した2024年の生成AIを記事とビデオとポッドキャストで振り返る(CloseBox)
今年2024年は生成AIの、特に動画において画期的な進歩が継続して行われた年でした。この連載でもずっと追いかけてきたテーマでもあるので、特に動画生成AIについて、自分が作った動画で振り返ります。

巨大画面のフリップフォンやHTCスマホが登場 - 2024年振り返り6月編(スマホ沼)
2024年6月にHONORのフリップ型スマートフォン「Magic V Flip」が登場し、女性向けデザインや大型アウトディスプレイが話題に。HTCやTECNOの新モデルも発表された。

インテル、完売続出の高コスパGPU Arc B580を「毎週補充できるようパートナーと協力」すると述べる
先週発売されたIntelの新世代GPU製品「Arc B580」は、米国では約250ドルという低価格ながら高いパフォーマンスを発揮するという前評判により、小売店での売り切れが続出しています。

ローカルマシンだけで生成AIはどこまでいける? MacBook Pro(M4 Max、128GBメモリ)を手に入れたローカルAI男子の遠吠え(2024年ベストバイ)
128GB M4 Max MacBook Pro、予約しただけで記事を書いた私ですが、ようやく届いたので、いろいろとやりたかったことを試しています。

Google Glassから苦節12年。ついに「真の」スマートグラス誕生? Project AstraとAndroid XRで実現する未来(Google Tales)
Googleの共同創業者、サーゲイ・ブリンさんがGoogle I/O 2012で華々しく「Google Glass」を披露してから12年。Googleは2024年12月11日に「Project Astra」を、12日には「Android XR」を発表しました。

AIは無知をどこまで認識できるか? 人類が回答不可能な質問をGPTやClaude、Geminiなどに大量にぶつけてみた(生成AIクローズアップ)
AIたちが「答えが分からない」と自身の無知を認識できるかを検証した論文「The Impossible Test: A 2024 Unsolvable Dataset and A Chance for an AGI Quiz」を取り上げます。

忘年会でオーバー60の人たちにAIボイチェンとAIミュージックビデオを披露した結果(CloseBox)
先週の土曜日は、大学時代の軽音サークルの忘年会ライブがありました。そこで筆者も演奏したのですが、今年はAIリアルタイムボイチェンと、AIを使ったミュージックビデオを披露しました。

長編ドキュメンタリー作品「AIで愛になる~超愛妻家・松尾公也とテクノロジーの未来」が公開されます(CloseBox)
自分の半生を描いたドキュメンタリー作品がYouTubeで公開されます。

Googleが自律的プログラミングAIエージェント「Jules」を発表。Gemini 2.0で実装計画を作成、コード生成・変更・バグフィクスなど実行
Googleは、人間がタスクを与えると自律的に実装計画を立ててコードの生成や変更、バグフィクスなどを実行してくれるAIエージェント「Jules」を発表しました。

ChatGPTでサンタさんとの音声会話ができるように。iPhoneだけでGoogle Stream Realtime対抗のビデオ・画面共有会話もやってみた(CloseBox)
OpenAIが12日間、新機能を発表する「12 Days of OpenAI」、6日目はChatGPTのAdvanced Voice Mode(高度な音声)の新機能について。

iPhoneだけでAI画像生成できる、Apple IntelligenceのImage Playgroundが使えるiOS 18.2で、ChatGPTとSiriの統合を試してみた(CloseBox)
Apple Intelligenceはまだ日本語では使えませんが、英語モードにすれば利用可能です。本日アップデートされたiOS 18.2ではChatGPTとの統合に加え、待望のAI画像生成機能「Image Playground」が追加されました。その機能を試してみます。

Google怒涛の新作AI発表。1位獲得の言語AI「Gemini-Exp-1206」、画像1枚からプレイ可能な3Dゲーム生成AI「Genie 2」、動画生成AI「Veo」、高性能天気予報AI「GenCast」など生成AI技術5つを解説(生成AIウィークリー)
OpenAIは、ChatGPTの新しい有料プラン「ChatGPT Pro」を発表しました。価格は月額200ドルで、最高レベルの「OpenAI o1」を含むすべてのモデルを無制限で使用することができます。

「登場即ライバル動画生成AI死亡」ではなかった。使ってわかったSoraの品質と限界(CloseBox)
人気のため一時はアカウント作成ができない状態だったSoraですが、ようやくアカウントを作成し、ログインできたので試してみました。

AIで「量子もつれ」の新たな生成方法を発見。量子インターネット構築が容易になる可能性(生成AIクローズアップ)
中国の南京大学やドイツのMax Planck Institute for the Science of Lightに所属する研究者らが、AIシステムを用いて量子もつれの新しい生成方法を発見した論文「Entangling Independent Particles by Path Identity」を解説します。

OpenAIアドベントカレンダーこと「12 Days of OpenAI」、スタート。Day 1はChatGPT Pro(月額200ドル)とo1完全版(CloseBox)
OpenAIアドベントカレンダーこと「12 Days of OpenAI」、が始まりました。初日はChatGPT Pro(月額200ドル)とo1完全版を発表しました。

OpenAI、今夜から12回の(ウィークデー)ライブ発表を予告。やっとSoraが使えるようになるの?(CloseBox)
毎年この時期に大きな発表をするのが慣例となっているOpenAIですが、今年は1回では収まらず、12日連続(ただしウィークデーのみ)のライブストリーミングで行うことをXへのポストで予告しています。

NVIDIAの最新生成AI。高解像度画像をFLUX.1の100倍以上高速に作り出すAI「Sana」、テキストから高品質な3Dアセットを生成するAI「Edify 3D」など生成AI技術5つを解説(生成AIウィークリー)
NVIDIAが主導して開発した、高解像度の画像を高速に生成するモデル「Sana」と、テキストから3Dアセットを生成するAI「Edify 3D」などを紹介します

夢の中へ行ってみたいと思ったのでAIで再現してみた(CloseBox)
今朝見た夢をAIで再現しようと思います。

2024年最大の散財、新しい俺の相棒「M4 Max MacBook Pro」を紹介するぜ(CloseBox)
猫も杓子も128GB M4 Max MacBook Proなのはどういうことでしょうか。

数十億パラメータの巨大AI、“たった1つのパラメータ”を削除するだけで完全崩壊。Appleなどが研究報告(生成AIクローズアップ)
大規模言語モデル(LLM)の数十億のパラメータの中でたった1つのパラメータを削除するだけで、モデルのテキスト生成能力が完全に崩壊することを発見した論文「The Super Weight in Large Language Models」について解説します。

AIオリジナル曲のリップシンクミュージックビデオを爆速で作る方法(CloseBox)
「最も簡単にオリジナル曲のリップシンクミュージックビデオを作る方法」について解説します。まあ、自分で弾き語りするのが一番簡単なんですが、それは置いといて(笑)

自動運転車が緊急車両に衝突するのは「デジタルてんかん発作」のせい?研究者が報告
イスラエルのネゲヴ・ベン=グリオン大学(BGU)と富士通の研究チームは、一部の自動運転 / 先進運転支援システム搭載車が停止中の緊急車両に衝突する事故は、システムが「デジタルてんかん発作」を起こすのが原因かもしれないとする研究結果を報告しました。

Claude 3.5 Computer Useのゲーム操作はどのレベル? 映像内の混雑シーンでも高速に動く物体を追跡できる「SAMURAI」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第73回)では、生成AIでコンピュータを操作する「Claude 3.5 Computer Use」の性能調査や、動画内の動く物体を追跡し分離するAI「SAMURAI」を取り上げます。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第37回:人肌をよりリアルにするDetail Daemon(西川和久)
Detail Daemonとは?またその効果は?

AI動画生成のLuma Dream MachineがUI刷新してキャラバリなど大幅機能追加したので試してみた(CloseBox)
Luma AIは動画生成AIサービスのDream Machineに大きな改変を施しました。

さくらインターネット、生成AIプラットフォームサービスの開発に着手。NEC製LLM「ことみ」も提供
さくらインターネットは、生成AIのプラットフォームサービスの開発に着手したことを発表しました。

“実在する人間”の考えをクローンした自律AIを1000体以上生成。高い精度で世論調査や社会の反応予測など活用へ(生成AIクローズアップ)
実在する人の性格や考えを忠実にコピーしたAIエージェント(自律AI)を1000体以上生成した論文「Generative Agent Simulations of 1,000 People」を取り上げます。

新世代AI読み上げソフトAivisSpeech、Style-Bert-VITS2とHeyGenアバターでレシピ動画を超簡単に料理してみた(CloseBox)
AivisSpeechとは、日本で開発されたAI音声合成ソフトで、いくつかのプリセットボイスが使える推論用アプリがMac、Windows向けに提供されており、すぐに試すことができます。

Excel上でPythonコードが生成、実行可能に。「Copilot in Excel with Python」正式版に(ただし米国版のみ)
マイクロソフトは米イリノイ州シカゴで開催中のイベント「Microsoft Ignite 2024」で、Excel上でCopilotがPythonコードを生成、実行してくれる「Copilot in Excel with Python」が米国版(EN-US)Windows環境において正式版になったことを明らかにしました。

大きくなったハイエンド縦折りフォルダブル「razr 50 ultra」ハンズオン。懐かしのホットピンクも(石野純也)
モトローラ・モビリティ・ジャパンは、razrシリーズの最上位モデルにあたる「razr 50 ultra」を日本市場に導入することを発表しました。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第36回:Stable Diffusion 3.5 Large TurboとMedium(西川和久)
4 stepsで生成可能なDiffusion 3.5 Large Turboの実力は!?

自律AIたちが議論する環境「TinyTroupe」をMicrosoftが開発、GPT-4o級のコーディングができるオープンソースAI「Qwen2.5-Coder」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第72回)では、GPT-4oのコーディング能力に匹敵するオープンソースなコード生成AI「Qwen2.5-Coder」や、AI生成の画像の一部のみに電子透かしを入れることができる「WAM」を取り上げます。

これはもう人間? Suno v4の音質向上は本物か、過去バージョンもリマスターしてみた(CloseBox)
テキストの指示で楽曲を完成することができるAI作曲サービス「Suno」が、v4にメジャーバージョンアップされました。最大のポイントは音質向上です。

この画質をローカルマシンで? オープンソース動画生成AI「Pyramid Flow」は商用サービスにどのくらい迫っているのか確かめてみた(CloseBox)
動画生成AIはRunwayを筆頭に、中国系サービスも参入し、激しい開発競争を繰り広げていますが、オープンソースソフトもかなりのレベルに到達しています。

「生成AI vs. 著名な詩人」どっちの詩が好き? シェイクスピアやディキンソンなどとAI詩を比較(生成AIクローズアップ)
AIが生成した詩と詩人による作品とが区別できるのか、またどちらが好まれるかを調査した論文「AI-generated poetry is indistinguishable from human-written poetry and is rated more favorably」に注目します。

著名人の声でテキスト読み上げできるElevenReaderアプリで、「オズの魔法使い」主演に原作小説を日本語で読み上げてもらったら(CloseBox)
Elevenlabsが、書籍やオンライン記事などを、有名人を含むバラエティに富んだ声で読み上げる無料サービスを提供しています。最近、ここに伝説的なサイケデリックロックバンドであるグレイトフル・デッドのリーダーであったジェリー・ガルシアが加わりました。ミュージシャンの登場は初めてということで、注目を集めています。

PDFを生成AIの学習用データに変えるIBM製AI「Docling」、1枚の画像から動く3Dシーン生成する「DimensionX」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第71回)では、1枚の画像から3D/4Dシーンを生成するAIモデル「DimensionX」や、テンセント開発の巨大オープンソース大規模言語モデル「Hunyuan-Large」を取り上げます。