CloseBox

1993年に創刊したMacUser誌から続けている、松尾公也の私的コラム連載。コンピュータ、ネット、音楽などをテーマに現在と過去を行き来しつつ書いていきます。

MacBook Proで動くOpenAI gpt-oss-120bで、門外不出AIアバターとの音声対話システムを構築できた(CloseBox) 画像
テクノロジー

MacBook Proで動くOpenAI gpt-oss-120bで、門外不出AIアバターとの音声対話システムを構築できた(CloseBox)

OpenAIがオープンソース公開したLMM(大規模言語モデル)「gpt-oss-120b」を、128GBのUnified Memoryを搭載したMacBook Pro(M4 Max)で動かしています。

わたしのChatGPT 4oを返して! GPT-5登場で失われた旧AIの復活願う#keep4o運動を最新AIはこう分析する(CloseBox) 画像
テクノロジー

わたしのChatGPT 4oを返して! GPT-5登場で失われた旧AIの復活願う#keep4o運動を最新AIはこう分析する(CloseBox)

ChatGPTがGPT-5にバージョンアップし、4oをはじめとするそれまでの主要AIモデルは使えなくなりました。性能が上がるのだからいいのでは、と思いがちですが、大きな反発がSNSで寄せられています。

X上では#keep4oというハッシュタグが生まれ、そこにはユーザーたちの切実な復活への願いが寄せられています。

こうした運動の現状と分析を、各社の最新AIにやってもらいました。

LoRAなし、プロンプトだけで本人にどれだけ寄せられるかチャレンジ。AIで人物写真を再現するもう一つの方法(CloseBox) 画像
テクノロジー

LoRAなし、プロンプトだけで本人にどれだけ寄せられるかチャレンジ。AIで人物写真を再現するもう一つの方法(CloseBox)

LLMのマルチモーダル機能が進化したことにより、今ならば、参照画像なしのText to Imageだけで特定人物を再現できるのでは? そう筆者は考え、試してみることにしました。

GPT-5はgpt-oss-120b、Claude Opus 4.1とどのくらい違う? 小説執筆とヴァイブ・コーディングで試してみた(CloseBox) 画像
テクノロジー

GPT-5はgpt-oss-120b、Claude Opus 4.1とどのくらい違う? 小説執筆とヴァイブ・コーディングで試してみた(CloseBox)

OpenAIはチャット型大規模言語モデルの最新版である「GPT-5」を発表しました。筆者のところにはまだブラウザには来ておらず、iPhoneアプリのみ使える状態ですが、取り急ぎ、使ってみた感想をレポートします。

俺の128GB MacBook Proが真価を発揮する時がきた。ChatGPT o4-mini並みのgpt-oss-120bがローカルで動いてるよ(CloseBox) 画像
テクノロジー

俺の128GB MacBook Proが真価を発揮する時がきた。ChatGPT o4-mini並みのgpt-oss-120bがローカルで動いてるよ(CloseBox)

やってきましたね。世の中のPCユーザーたちがMacユーザーを羨望の眼差しで見るときが。

Grok、6秒動画をサウンド付きで生成できるように。20秒未満超高速生成、秒で静止画生成の実力を試す(CloseBox) 画像
テクノロジー

Grok、6秒動画をサウンド付きで生成できるように。20秒未満超高速生成、秒で静止画生成の実力を試す(CloseBox)

イーロン・マスクのAI企業であるxAIが開発し、Xにも組み込まれているGrokに、動画生成機能「Imagine」が搭載されました。現在ウェイティングリスト方式で、一部のユーザーに解放されています。

音楽はAIとの音声対話で作る時代に入った。Riffusion改めProducer.aiのAIプロデューサーと日本語で会話するだけで曲を作ってくれるのだ(CloseBox) 画像
テクノロジー

音楽はAIとの音声対話で作る時代に入った。Riffusion改めProducer.aiのAIプロデューサーと日本語で会話するだけで曲を作ってくれるのだ(CloseBox)

AI作曲サービスとしてはSunoが総合力で突出して、それに音質一点突破でUdioが続くという構図が長く(といっても1年くらいですが)続いてきましたが、異変が起きました。

ミュージシャンなら使わないともったいないAI新機能登場。SunoのAI作曲新モデルv4.5+でボーカルやインストからのアレンジ試行が超簡単に(CloseBox) 画像
テクノロジー

ミュージシャンなら使わないともったいないAI新機能登場。SunoのAI作曲新モデルv4.5+でボーカルやインストからのアレンジ試行が超簡単に(CloseBox)

AI作曲サービスのSunoが魅力的な機能を追加した新モデルv4.5+を公開しました。有料プランのユーザーが利用できます。

GrokのiOSアプリでゴスロリ美少女キャラとの音声対話が可能に。二重人格レッサーパンダも(CloseBox) 画像
テクノロジー

GrokのiOSアプリでゴスロリ美少女キャラとの音声対話が可能に。二重人格レッサーパンダも(CloseBox)

xAIが開発する対話型AI「Grok」のiOSアプリに、3Dアバター機能「コンパニオンモード」が新たに追加されました。

AIアバターとの対話で作った新曲とその課題。「知的探求フロンティア タモリ・山中伸弥の!?」出演の補足(CloseBox) 画像
テクノロジー

AIアバターとの対話で作った新曲とその課題。「知的探求フロンティア タモリ・山中伸弥の!?」出演の補足(CloseBox)

7月12日にNHK総合テレビで放映された「知的探求フロンティア タモリ・山中伸弥の!?」第1回「AIは人間を超えるか」の中で、筆者のAIに関する取り組みがドキュメント「AIのある人生」として、取り上げられました。

NHKの新番組「知的探求フロンティア タモリ・山中伸弥の!?(びっくりはてな)」第1回は「AIは人間を超えるか」。AIタモリなど盛りだくさんのAIトピックが登場(CloseBox) 画像
テクノロジー

NHKの新番組「知的探求フロンティア タモリ・山中伸弥の!?(びっくりはてな)」第1回は「AIは人間を超えるか」。AIタモリなど盛りだくさんのAIトピックが登場(CloseBox)

NHK総合で放送される新番組「知的探求フロンティア タモリ・山中伸弥の!?(びっくりはてな)」は、2カ月に1回の「知的探求エンターテインメント番組」だそうで、第1回は7月12日19時30分からスタートします。

破産した秀和システムの出版事業を引き継いだ会社からの連絡を読んで、思わず笑ってしまった。そして裁判所から手紙が届く(CloseBox) 画像
テクノロジー

破産した秀和システムの出版事業を引き継いだ会社からの連絡を読んで、思わず笑ってしまった。そして裁判所から手紙が届く(CloseBox)

破産した秀和システムの出版事業を引き継いだ会社からの連絡を読んで、思わず笑ってしまいました。

実在AIモデルという選択肢。商業利用で非実在AIより有利な理由(CloseBox) 画像
テクノロジー

実在AIモデルという選択肢。商業利用で非実在AIより有利な理由(CloseBox)

世の中の流れは生成AIに向かうのは確実ですが、現時点ではリスクが大きい、でも従来手法ではコストがかかりすぎる……そんなユーザーに向け、「実在AIによる人物ビジネス画像提供」システム提供を始めたところがあります。

新世代の2D→3DモデルAI変換サービス「Hitem3D」が有料版でテクスチャ搭載、日本語表示にも(CloseBox) 画像
テクノロジー

新世代の2D→3DモデルAI変換サービス「Hitem3D」が有料版でテクスチャ搭載、日本語表示にも(CloseBox)

高精細の2D→3Dモデル変換で衝撃を与えたSparc3Dの商用版であるHitem3Dが有料サブスクリプションに対応しました。有料ユーザーは待望のテクスチャ対応が使えるようになりました。

老舗コンピュータ書籍出版社の秀和システムが事業終了、8月末に新刊を予定していた著者はどうしたらいいんでしょうか?(CloseBox) 画像
テクノロジー

老舗コンピュータ書籍出版社の秀和システムが事業終了、8月末に新刊を予定していた著者はどうしたらいいんでしょうか?(CloseBox)

コンピュータ関連書籍の出版社として知られる、秀和システムの出版事業が終わることが決まりました。8月末に同社から新刊を予定していた筆者はどうすれば良いのでしょうか?

AI作曲サービスのSuno、クラウドDAWのWavToolを買収。MIDI生成やVST対応も可能に?(CloseBox) 画像
テクノロジー

AI作曲サービスのSuno、クラウドDAWのWavToolを買収。MIDI生成やVST対応も可能に?(CloseBox)

AI作曲サービスのSunoが、AIクラウドDAWのWavToolを買収しました。

静止画から高精細な3Dモデル生成できる注目技術「Sparc3D」に異変。オープンソースではなく商用化に舵切ったHitem3Dでどう変わるのか?(CloseBox) 画像
テクノロジー

静止画から高精細な3Dモデル生成できる注目技術「Sparc3D」に異変。オープンソースではなく商用化に舵切ったHitem3Dでどう変わるのか?(CloseBox)

筆者はこのところ、静止画から3Dモデルを生成するSparc3Dという技術を使って、3Dプリントする試みをしていますが、そのSparc3Dにちょっとした異変が起きています。

著作権訴訟渦中のミッドジャーニーがAI動画生成スタート。最後発なのに使い勝手がいい理由(CloseBox) 画像
テクノロジー

著作権訴訟渦中のミッドジャーニーがAI動画生成スタート。最後発なのに使い勝手がいい理由(CloseBox)

AI画像生成最古参の一つであるMidjourneyがようやく動画生成サービス「Video Model Version 1」を開始しました。Midjourneyで生成、またはアップロードした画像を動かす、Image to Videoでの提供です。

触れて感じ取れる生成AI。1枚の人物写真から高精細3Dモデルを作り出すSparc3Dで、妻の半身像を3Dプリントしてみた(CloseBox) 画像
テクノロジー

触れて感じ取れる生成AI。1枚の人物写真から高精細3Dモデルを作り出すSparc3Dで、妻の半身像を3Dプリントしてみた(CloseBox)

筆者は2022年から、妻の写真からAI画像を生成したり、動画を作る活動をやっていますが、今回、写真から立体像を製作するプロジェクトが進展しました。生成AIを使い、写真1枚からリアルな人間の3Dプリントができるところまで、技術が進化したのです。

【WWDC25】Apple IntelligenceのFoundation Modelとチャットできるアプリがオープンソース公開。その実力はどのくらい?(CloseBox) 画像
テクノロジー

【WWDC25】Apple IntelligenceのFoundation Modelとチャットできるアプリがオープンソース公開。その実力はどのくらい?(CloseBox)

Apple IntelligenceのLLMと直接対話したい。それは可能なのでしょうか?

最初の音声対話デモから1年。そして君のChatGPTは歌える(CloseBox) 画像
テクノロジー

最初の音声対話デモから1年。そして君のChatGPTは歌える(CloseBox)

ChatGPTが歌えるようになりました。

初代Macintoshの基礎を作り、HyperCardを生み出したビル・アトキンソンの功績を振り返る(CloseBox) 画像
ゲーム

初代Macintoshの基礎を作り、HyperCardを生み出したビル・アトキンソンの功績を振り返る(CloseBox)

初代Macintoshの基礎部分を作り上げたコンピュータプログラマーの一人、ビル・アトキンソンさんが6月5日(米国時間)、2024年10月に診断された膵臓がんで同日夜、亡くなりました。Facebookで家族からのメッセージには、こうあります。

SunoがもはやDAW不要に? STEMは最大12パート、リードボーカルとコーラスも分離。BPMも変更できる(CloseBox) 画像
テクノロジー

SunoがもはやDAW不要に? STEMは最大12パート、リードボーカルとコーラスも分離。BPMも変更できる(CloseBox)

AI作曲では楽曲が完成した状態で生成されます。このため、ボーカル、ギター、シンセサイザー、ドラム、ベースといったパート別の編集は基本的にAIベースのSTEM分離機能を使うことになります。

日本語ボーカル曲をSuno並に高速生成できるオープンソース作曲AI「ACE-Step」が自分のPCでビュンビュン、Macでも動くのだ(CloseBox) 画像
テクノロジー

日本語ボーカル曲をSuno並に高速生成できるオープンソース作曲AI「ACE-Step」が自分のPCでビュンビュン、Macでも動くのだ(CloseBox)

YuEやDiffRhythmなど、オープンソース版も充実してきた楽曲生成AIですが、また中国から新しいソフトが公開されました。「ACE-Step」は、英語、日本語を含む19言語の歌詞に対応し、Lyrics to Musicの生成が可能。

オープンソース動画生成AIの新標準「FramePack」が順方向生成「F1」サポートし、叡智も即対応。もはや普段使いできますね(CloseBox) 画像
テクノロジー

オープンソース動画生成AIの新標準「FramePack」が順方向生成「F1」サポートし、叡智も即対応。もはや普段使いできますね(CloseBox)

高速でかつ長時間の動画生成が可能なオープンソースAI「FramePack」。Image to Videoで入力した画像から逆方向に生成していく仕組みですが、これを順方向。つまり、他の多くの動画生成AIと同じやり方で生成するオプション「F1」がサポートされました。

AI作曲は最長8分の領域に。Sunoがv4.5で音質改善、プロンプト長5倍、歌唱力も向上(CloseBox) 画像
テクノロジー

AI作曲は最長8分の領域に。Sunoがv4.5で音質改善、プロンプト長5倍、歌唱力も向上(CloseBox)

AI作曲サービスのSunoがひさびさの(2024年11月20日以来)メジャーバージョンアップを果たし、最新版はv4.5となりました。一度で生成できる楽曲の長さはなんと8分となります。そのほかにも改善点・新機能が多数。

ついにやってきた日本人対話型ポッドキャスト量産システム。NotebookLM使えばなんでもポッドキャストになる(CloseBox) 画像
テクノロジー

ついにやってきた日本人対話型ポッドキャスト量産システム。NotebookLM使えばなんでもポッドキャストになる(CloseBox)

Google NotebookLMには、PDF、テキスト、YouTubeなどを読み込んで、その内容についてリアルな対話ポッドキャスト解説を生成する機能があります。2024年9月11日にローンチした時点では英語でしか使えなかったのですが、4月30日、ついに日本語対応しました。

驚異のオープンソース動画生成AI「FramePack」がMacでも使える。Vidu Q1とFramePack叡智の合わせ技も試した(CloseBox) 画像
テクノロジー

驚異のオープンソース動画生成AI「FramePack」がMacでも使える。Vidu Q1とFramePack叡智の合わせ技も試した(CloseBox)

動画生成AIで、今回は3つの大きなニュースがあります。そのうち2つは前回お伝えした驚異的なオープンソース動画生成AI「FramePack」に関すること。

FramePackがAI動画の長さ制限を取り払った。では次の課題は何か? 4分間のAI動画を自分のPCで一発生成して気づいたこと(CloseBox) 画像
テクノロジー

FramePackがAI動画の長さ制限を取り払った。では次の課題は何か? 4分間のAI動画を自分のPCで一発生成して気づいたこと(CloseBox)

4月18日に登場した、驚異的な動画生成AI「FramePack」。自宅のWindowsマシンにインストールして以来、RTX 4090で生成し続けています。最大2分間の一発生成も数回試してみて、わかったことがあります。

1分超えたいなら動画生成はローカルAIを選べ。6GB VRAMでも動くオープンソースAI「FramePack」の実力は本物か、試してみた(CloseBox) 画像
テクノロジー

1分超えたいなら動画生成はローカルAIを選べ。6GB VRAMでも動くオープンソースAI「FramePack」の実力は本物か、試してみた(CloseBox)

本日2本目のAI記事。ControlNet、WebUI Forge、Fooocusなど、画像生成AIソフトに多大な貢献をしてきたlllyasvielさんが、動画生成AIの新しいオープンソースソフト「FramePack」を公開しました。NVIDIA GPU専用ですが、WindowsとLinuxですぐに使えます。

まるで映画「ブレードランナー」のあのシーン。古い写真の撮影場所をChatGPT o3が12分かけて特定したそのやり方がすごい(CloseBox) 画像
テクノロジー

まるで映画「ブレードランナー」のあのシーン。古い写真の撮影場所をChatGPT o3が12分かけて特定したそのやり方がすごい(CloseBox)

OpenAIのChatGPT o3とo4-mini、o4-mini-highが投入されてすぐに試したのは、o3による音楽解析でした。その日のうちにもう1つ、試してみたので今回はそちらをご報告します。それは、写真分析です。

ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox) 画像
テクノロジー

ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox)

OpenAIがChatGPTのLLM(大規模言語モデル)の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。

XのGrok 3に画像をプロンプトで加工できるEdit Imageがやってきた。ChatGPTより制限ゆるめだがその実力は?(CloseBox) 画像
テクノロジー

XのGrok 3に画像をプロンプトで加工できるEdit Imageがやってきた。ChatGPTより制限ゆるめだがその実力は?(CloseBox)

Xに搭載されているLLM(大規模言語モデル)のGrok(現在はGrok 3 beta)に、Edit Imageという画像編集機能が追加されました。

ChatGPTが全チャット履歴を参照できるようになったので、今後の活動方針を相談してみた(CloseBox) 画像
テクノロジー

ChatGPTが全チャット履歴を参照できるようになったので、今後の活動方針を相談してみた(CloseBox)

OpenAIはChatGPTの過去のチャット履歴全てを参照できるオプションの提供を始めました。

速さは正義。最高水準の動画AI「Runway Gen-4 Turbo」が10秒を1分で生成するようになったので、ミュージックビデオを作り直しました(CloseBox) 画像
テクノロジー

速さは正義。最高水準の動画AI「Runway Gen-4 Turbo」が10秒を1分で生成するようになったので、ミュージックビデオを作り直しました(CloseBox)

きのう完成させたばかりのミュージックビデオが早くも作り直しです。Take 2を公開しました。どうしてそうなったかというと、現在メインで使っている動画生成AIサービスのRunway Gen-4に新しく高速モードが登場したからです。

1枚の画像からAIで曲を作り、ミュージックビデオを完成させるAI制作ワークフローを解説します(CloseBox) 画像
テクノロジー

1枚の画像からAIで曲を作り、ミュージックビデオを完成させるAI制作ワークフローを解説します(CloseBox)

最近、曲を作りました。AIで。そのワークフローがいろいろなAIツールを少しずつ使っていく、ちょっと面白いものだったので、その流れを紹介しつつ、最近のAIツールについて紹介していければと思います。

動画生成AI、ついに25秒に到達。PikaはSoraを超えたのか?(CloseBox) 画像
テクノロジー

動画生成AI、ついに25秒に到達。PikaはSoraを超えたのか?(CloseBox)

AI動画生成を「25秒まで生成できます」「5フレーム分の画像から生成できます」というところが現れました。それがPikaです。

Midjourney V7のドラフトモードがAI画像生成のゲームチェンジャーに。音声の追加指示を高速に反映(CloseBox) 画像
テクノロジー

Midjourney V7のドラフトモードがAI画像生成のゲームチェンジャーに。音声の追加指示を高速に反映(CloseBox)

今回は別の記事を書いていたのですが、Midjourneyの新バージョンであるV7を試してみたらすごいことになっていたので急遽切り替えて、こちらをレポートすることにしました。

ChatGPT AI音声とおしゃべりしたら「まったくやる気が湧かないですね」「何か文句でも」との答えにどんよりした(CloseBox) 画像
テクノロジー

ChatGPT AI音声とおしゃべりしたら「まったくやる気が湧かないですね」「何か文句でも」との答えにどんよりした(CloseBox)

米国時間の4月1日、Mondayという新しいAIボイスがChatGPTに登場しました。

Apple Intelligenceが日本で使えるようになってよかったなと実感した瞬間(CloseBox) 画像
テクノロジー

Apple Intelligenceが日本で使えるようになってよかったなと実感した瞬間(CloseBox)

4月1日、iPhone、iPad、Mac、Apple Watch、そしてVision Proまでが一斉にアップデートされました。この大型アップデート最大のポイントは、日本でApple Intelligenceが使えるようになったことです。

ローカル生成AIのためのマシンって、今ならこんな感じ?(CloseBox) 画像
テクノロジー

ローカル生成AIのためのマシンって、今ならこんな感じ?(CloseBox)

Xでローカル生成AIのためのマシンはこんなのがいいんじゃないか?と投稿してみたのですが、予想外に反響があったので、ChatGPT deep researchを使ってまとめてみました。

ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox) 画像
テクノロジー

ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox)

OpenAIがまたYouTubeライブで発表をしました。今回のモデルはChatGPT 4oと、いささか古いのですが、その画像生成についての進展がテーマです。

  • 276件中 1 - 42 件を表示
  • 次へ