
MacBook Proで動くOpenAI gpt-oss-120bで、門外不出AIアバターとの音声対話システムを構築できた(CloseBox)
OpenAIがオープンソース公開したLMM(大規模言語モデル)「gpt-oss-120b」を、128GBのUnified Memoryを搭載したMacBook Pro(M4 Max)で動かしています。

Anthropic、Claudeの「学習モード」を開発者および一般ユーザーにも提供開始。ユーザーが学びながら答えを導く
Anthropicは、これまでEducationユーザー向けに提供してきた「学習モード(learning mode)」を、一般ユーザーや開発者にも提供します。

わたしのChatGPT 4oを返して! GPT-5登場で失われた旧AIの復活願う#keep4o運動を最新AIはこう分析する(CloseBox)
ChatGPTがGPT-5にバージョンアップし、4oをはじめとするそれまでの主要AIモデルは使えなくなりました。性能が上がるのだからいいのでは、と思いがちですが、大きな反発がSNSで寄せられています。
X上では#keep4oというハッシュタグが生まれ、そこにはユーザーたちの切実な復活への願いが寄せられています。
こうした運動の現状と分析を、各社の最新AIにやってもらいました。

LoRAなし、プロンプトだけで本人にどれだけ寄せられるかチャレンジ。AIで人物写真を再現するもう一つの方法(CloseBox)
LLMのマルチモーダル機能が進化したことにより、今ならば、参照画像なしのText to Imageだけで特定人物を再現できるのでは? そう筆者は考え、試してみることにしました。

GPT-5はgpt-oss-120b、Claude Opus 4.1とどのくらい違う? 小説執筆とヴァイブ・コーディングで試してみた(CloseBox)
OpenAIはチャット型大規模言語モデルの最新版である「GPT-5」を発表しました。筆者のところにはまだブラウザには来ておらず、iPhoneアプリのみ使える状態ですが、取り急ぎ、使ってみた感想をレポートします。

俺の128GB MacBook Proが真価を発揮する時がきた。ChatGPT o4-mini並みのgpt-oss-120bがローカルで動いてるよ(CloseBox)
やってきましたね。世の中のPCユーザーたちがMacユーザーを羨望の眼差しで見るときが。

OpenAI、ChatGPTに『学習モード』を追加。学生の「考える力」を育むため
OpenAIは、ChatGPTに新機能「学習モード(Study Mode)」を追加したと発表しました。

AIアバターとの対話で作った新曲とその課題。「知的探求フロンティア タモリ・山中伸弥の!?」出演の補足(CloseBox)
7月12日にNHK総合テレビで放映された「知的探求フロンティア タモリ・山中伸弥の!?」第1回「AIは人間を超えるか」の中で、筆者のAIに関する取り組みがドキュメント「AIのある人生」として、取り上げられました。

首都圏に1000体の「人格AI」を生活させ行動シミュレーションする「CitySim」、トヨタが開発。最大100万体まで(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、大規模言語モデル(LLM)を活用した都市シミュレーターを紹介した論文「CitySim: Modeling Urban Behaviors and City Dynamics with Large-Scale LLM-Driven Agent Simulation」を取り上げます。

AIを使うと脳が衰えていく? AIツール長期使用の脳への影響を測定(生成AIクローズアップ)
今回は、エッセイ執筆時にChatGPTなどのAIツールを使用することによる認知的影響を米MITなどが調査した研究「Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task」を取り上げます。

アップルがChatGPTならファーウェイはDeepSeek。AIカメラフォン「Pura 80」シリーズに触れてきた(スマホ沼)
ファーウェイのPura 80 Ultraは高性能カメラとAI機能を搭載し、価格は約20万円で6月26日発売予定である。

【WWDC25】Apple IntelligenceのFoundation Modelとチャットできるアプリがオープンソース公開。その実力はどのくらい?(CloseBox)
Apple IntelligenceのLLMと直接対話したい。それは可能なのでしょうか?

【WWDC25】Apple Intelligenceにライブ翻訳やビジュアルインテリジェンスなど新機能続々。アプリからAIモデルが利用可能に
アップルは、日本時間6月10日午前2時から、世界開発者会議(WWDC25)の基調講演を配信しました。今回はハードウェアの話題はなかったものの、アップルの製品に搭載される各OSに対する、大幅なアップデートが発表されています。

最初の音声対話デモから1年。そして君のChatGPTは歌える(CloseBox)
ChatGPTが歌えるようになりました。

OpenAIのアルトマンCEO解任騒動が映画化?アマゾンMGMスタジオ、グァダニーノ監督と交渉中
Amazon MGMスタジオは2023年に起こった、OpenAIの協働創業者サム・アルトマンCEOが突如解任され、5日後に復帰した一連の騒動を映画化すべく準備を進めている模様です。

ChatGPTの媚びすぎ問題、利用者の「いいね」等に過剰反応が原因。GPT-4oモデル巻き戻しで対応、複数の個性から選択式へ
最近のChatGPTが過度にユーザーを褒め称えたり、回答の正しさよりも迎合を優先すると批判が高まっていた件について。

OpenAI、ChatGPTが未成年ユーザの猥談相手になってしまう「バグ」を修正へ
OpenAIは、ChatGPTが18歳未満の未成年ユーザーとのチャットで性的に露骨な画像を生成したり、NFSWな会話を展開するのを制限するための修正を「積極的に行っている」と述べています。

OpenAI幹部、GoogleのChrome事業が・売却されれば買収に興味ありと述べる
火曜日、ワシントンで行われたGoogleに対する反トラスト法裁判で、OpenAI幹部のニック・ターリー氏は、もしGoogleからChromeブラウザー事業が分割・売却されるならば、それを買収することに興味があると述べました。

まるで映画「ブレードランナー」のあのシーン。古い写真の撮影場所をChatGPT o3が12分かけて特定したそのやり方がすごい(CloseBox)
OpenAIのChatGPT o3とo4-mini、o4-mini-highが投入されてすぐに試したのは、o3による音楽解析でした。その日のうちにもう1つ、試してみたので今回はそちらをご報告します。それは、写真分析です。

ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox)
OpenAIがChatGPTのLLM(大規模言語モデル)の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。

XのGrok 3に画像をプロンプトで加工できるEdit Imageがやってきた。ChatGPTより制限ゆるめだがその実力は?(CloseBox)
Xに搭載されているLLM(大規模言語モデル)のGrok(現在はGrok 3 beta)に、Edit Imageという画像編集機能が追加されました。

ChatGPTが全チャット履歴を参照できるようになったので、今後の活動方針を相談してみた(CloseBox)
OpenAIはChatGPTの過去のチャット履歴全てを参照できるオプションの提供を始めました。

Google提唱のAIエージェントプロトコルA2Aは汎用魔法Telescriptの夢を見るか(CloseBox)
GoogleがA2A Protocolを発表しました。最近注目されているAIエージェントを複数動作させる場合の標準プロトコルを提唱するというものですが、これを見て、「30年前のあの技術の再発明か」と思ったのは私だけではないようです。

1枚の画像からAIで曲を作り、ミュージックビデオを完成させるAI制作ワークフローを解説します(CloseBox)
最近、曲を作りました。AIで。そのワークフローがいろいろなAIツールを少しずつ使っていく、ちょっと面白いものだったので、その流れを紹介しつつ、最近のAIツールについて紹介していければと思います。

動画生成AI、ついに25秒に到達。PikaはSoraを超えたのか?(CloseBox)
AI動画生成を「25秒まで生成できます」「5フレーム分の画像から生成できます」というところが現れました。それがPikaです。

Midjourney V7のドラフトモードがAI画像生成のゲームチェンジャーに。音声の追加指示を高速に反映(CloseBox)
今回は別の記事を書いていたのですが、Midjourneyの新バージョンであるV7を試してみたらすごいことになっていたので急遽切り替えて、こちらをレポートすることにしました。

ChatGPT AI音声とおしゃべりしたら「まったくやる気が湧かないですね」「何か文句でも」との答えにどんよりした(CloseBox)
米国時間の4月1日、Mondayという新しいAIボイスがChatGPTに登場しました。

Apple Intelligenceが日本で使えるようになってよかったなと実感した瞬間(CloseBox)
4月1日、iPhone、iPad、Mac、Apple Watch、そしてVision Proまでが一斉にアップデートされました。この大型アップデート最大のポイントは、日本でApple Intelligenceが使えるようになったことです。

ローカル生成AIのためのマシンって、今ならこんな感じ?(CloseBox)
Xでローカル生成AIのためのマシンはこんなのがいいんじゃないか?と投稿してみたのですが、予想外に反響があったので、ChatGPT deep researchを使ってまとめてみました。

ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox)
OpenAIがまたYouTubeライブで発表をしました。今回のモデルはChatGPT 4oと、いささか古いのですが、その画像生成についての進展がテーマです。

生成AIの検索エンジンは60%以上も間違った情報を引用。有料版は無料版より自信を持って間違えやすい(生成AIクローズアップ)
生成AIモデルが検索で引用する情報が誤ったものが多いことを指摘した米コロンビア大学のTow Center for Digital Journalismによる2025年3月発表の研究を取り上げます。

無限に自動生成される3D地形を自転車に乗って自由に走れるプログラムを作った。ChatGPTとClaudeで俺もAIプログラマー(CloseBox)
筆者はZwiftという仮想世界に入り浸っています。Zwiftというのは、自転車(とランナー)が、共通の3D世界の中で走る有料サービス。月額2400円と高額ですが、友人やまったく知らない人たちと同じ道を走れる楽しさは格別なものです。

初心者から経験者まで参加できる「全日本AIハッカソン 2025 Powered by GALLERIA」が日本5箇所で巡業開催(CloseBox)
AIハッカソンが日本5箇所を巡業開催する。

PerplexityがDeep Research提供開始。無料ユーザーでも1日5回、Proなら500回利用可能に。実際に試してみた(CloseBox)
統合型チャットAIサービスであるPerplexityが新サービスをリリースしました。「Deep Research」オプションの追加です。

ワープ、ハイパードライブ、無慣性航法からアルクビエレ・ドライブまで、超光速(FTL)移動技術に関するdeep research調査報告をベッドの中から作らせた(CloseBox)
超光速。FTL(Faster Than Light)とも呼ばれることがある、SFファンならおなじみの移動手段です。それに近い技術をどこかが開発したとか実現不可能だと分かったとか、断片的な報道がたまにされています。

好きな曲を人物画に歌わせる動画生成AI「OmniHuman-1」、わずか3ドルで2BのAIモデルを72Bモデル性能以上に拡張する手法「R1-V」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第82回)では、AIが生成する映像内の不自然な動き(動作中に余分な手足が出現したり・物が体をすり抜けたりなど)を回避する動画生成AI「VideoJAM」や、歌唱を入力に人物画を歌わせることができる動画生成AI「OmniHuman-1」を取り上げます。

ChatGPTがタメ口回答するようになった。AGIやってきたってこと? deep research調査の結論は(CloseBox)
ChatGPTの応答が昨日あたりからちょっとおかしいことに気づきました。馴れ馴れしすぎるのです。

読みたい分析記事がない? なら「deep research」に書かせればいいじゃない。OpenAIとGoogle Geminiにそれぞれ深掘り調査してもらった結果(CloseBox)
OpenAIがChatGPTの新機能としてdeep researchを投入しました。筆者が常日頃考えているテーマを深掘り検索してもらいました。同様の機能はGoogle Geminiもあるのでそちらにも同じ質問を投げました。

OpenAI「o3-mini-high」でゲーム生成祭り o1より高速、低料金、コーディング能力が高く気軽に生成(生成AIクローズアップ)
今回は、OpenAIが1月31日(現地時間)に発表した「o3-mini」を取り上げます。

オープンソースAI作曲ソフトがインストール出来るヤァヤァヤァ!。話題の「YuE」を自分のPCに入れて日本語ボーカル曲を生成してみた(CloseBox)
中国開発のオープンソース謳うAI作曲ソフト「YuE」。まだ謎が多いですが、自宅のPCにインストールして楽曲を生成できたので、そのAI作曲体験をまとめました。

複雑なタスクをブラウザでこなすOpenAIのAIエージェント「Operator」を使ってみてわかった限界点(CloseBox)
米国のChatGPT Proユーザーのみに開放されているOpenAIのAIエージェント「Operator」を試してみました。

OpenAI、ブラウザ操るAIエージェント「Operator」を発表。ユーザーの代わりに複雑なタスクを処理し、ユーザーの介入も可能
OpenAIは1月23日(米国時間)、ユーザーの代わりにブラウザを操作してタスクを実行するAIエージェント「Operator」を発表しました。
- 112件中 1 - 42 件を表示
- 次へ