ローカル生成AIのためのマシンって、今ならこんな感じ?(CloseBox)

テクノロジー AI
松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

Xでローカル生成AIのためのマシンはこんなのがいいんじゃないか?と投稿してみたのですが、予想外に反響があったので、ChatGPT deep researchを使ってまとめてみました。

Xへの投稿へのリプライで挙がっていたマシンもいくつか追記してみました。選ぶ際の参考になれば幸いです。

(▲ローカル生成AI用マシン比較)














































































































モデル 価格帯 用途・特徴 GPU CPU RAM ストレージ OS 拡張性 消費電力/サイズ 購入先リンク
NVIDIA DGX Spark 約60万円 推論特化、128GB統合メモリ、FP4対応、静音・省電力、小型筐体 Blackwell GB10 (統合128GB) NVIDIA Grace 20コア 128GB LPDDR5X 1TB / 4TB NVMe SSD DGX OS (Linux) USB4, 10GbE, 200GbE 170W / 手のひらサイズ NVIDIA公式
MacBook Pro M4 Max 128GB 約80万円 モバイル推論/開発、128GBメモリ、Metal対応、静音・省電力 M4 Max 内蔵 (40コア) 16コア (高性能12 + 高効率4) 128GB 統合メモリ 1TB~8TB SSD macOS 14+ Thunderbolt 5, 外部拡張可 ~120W / ノート型 Apple公式
HP OMEN 45L RTX 5090 約100万円 画像生成・中型LLM学習、GPU性能最強、拡張性高 RTX 5090 (32GB GDDR7) Core Ultra 9 285K (24コア) 64GB DDR5(最大192GB) 2TB SSD + 2TB HDD Windows 11 Pro PCIe, GPU増設可能 ~700W / フルタワー HP公式
Mac Studio M3 Ultra 512GB 約150万円 最大規模LLM推論、静音・省スペース、超大容量メモリ M3 Ultra 内蔵 (最大80コア) 32コア (高性能24 + 高効率8) 512GB 統合メモリ 1TB~16TB SSD macOS 14+ Thunderbolt 5, GPU換装不可 ~300W / 小型デスク Apple公式
自作PC (192GBメモリ) 約20万円 低予算大容量RAM、LLM推論中心、GPUは別途選択 構成次第 (例: RTX 4070) Ryzen 9 7950X / Core i9-13900K 192GB DDR5 1TB SSD ~ Windows/Linux 自由度最大(GPU・メモリ) 200~400W / ATXミドル ツクモ / ドスパラ 等
ASUS Ascent G10 約50万円(想定) DGX Spark互換、同等性能、予約制 Blackwell GB10 NVIDIA Grace 20コア 128GB LPDDR5X 1TB NVMe SSD Linux (DGX互換) USB4, 200GbE 170W / 小型筐体 ASUS公式(予定)
Mac mini M4 Pro 64GB 約30~40万円 ミドルクラス、静音、64GBで中型モデル対応可 M4 Pro 内蔵 (20コア前後) 12コア (高性能8 + 高効率4) 64GB 統合メモリ 1TB~8TB SSD macOS 14+ Thunderbolt 5 ~60W / 超小型 Apple公式

  • なお、筆者が所有しているのは、
    Thirdwave XA7C-R48:80GB RAM、Core i7 13700F CPU搭載。RTX 4090(24GB VRAM)に換装

  • MacBook Pro:M4 Max 128GB Unified Memory

この2つがメインで、このほかにiMac M1(16GB)、Mac mini M4(16GB)、MacBook Air M2(24GB)など。

そして、NVIDIA DGX Sparkを某所経由で予約済みです。

また、512GB M3 Ultra Mac Studio、5090搭載PCは複数の知人が購入しています。128GB M4 Max MacBook Proはもっと多くの知人が使っています。512GB Mac Studioを買い足している人も何人か。

もともと筆者が挙げていた4つのオプションに、リプライで提案された3つを加え、7つの選択肢を挙げています。

以下は、deep researchによるスペック、特徴のまとめと、参考リンクとメモを筆者がつけたものです。


NVIDIA DGX Spark(約60万円)

概要
NVIDIAが開発した超小型AI推論用マシン。Grace Blackwellアーキテクチャを搭載し、128GBの統合メモリとBlackwell世代GPU(FP4対応)を備える。最大1000TOPSのAI性能を持ち、70B~200Bクラスの大規模モデルを単体で動かすことができる。手のひらサイズの筐体ながら、電力効率と冷却性も優秀。2台を直結してクラスタ構築も可能。

ユースケース
大規模LLMのローカル推論、軽微なファインチューニング、小規模分散環境でのAI開発、オフィスや研究室に最適。

特徴

  • GPU:Blackwell GB10、統合メモリ128GB

  • CPU:NVIDIA Grace 20コア(Armアーキテクチャ)

  • ストレージ:1TB / 4TB NVMe SSD

  • OS:DGX OS(Ubuntuベース、CUDA・NCCL・PyTorch等対応)

  • 拡張性:USB4, 10GbE, 200GbE対応ポートあり

  • 消費電力:約170W、静音設計、小型筐体(1.2kg)

購入先
NVIDIA公式(予約制)、または国内販売パートナー(ASUS、HP等)からの今後のリリースに注目。


メモ:小型で低消費電力なので5090ほどの処理性能は期待できませんが、それでもCUDAで128GBのメモリを使えるというのは非常に大きいです。その気になればもう1台を追加して256GBメモリとして動作させることも可能。独自のLinuxだというところに一抹の不安がありますが、AI仮想環境ソフトのPinokioで動かせそうな気も。

MacBook Pro M4 Max 128GB(約80万円)

概要
Appleの最新ハイエンドノート。M4 Maxチップは40コアGPUと最大128GBの統合メモリを搭載し、モバイルでも本格的な生成AI推論が可能。Metalバックエンド対応のPyTorchやCoreMLなどでApple独自最適化が進んでいる。消費電力が非常に低く、ファンも静かで高性能ノートとして理想的。

ユースケース
モバイルでのAI実験、LLM推論、画像生成(Diffusion系)、開発者・研究者の持ち運び環境。

特徴

  • GPU:M4 Max内蔵(40コア)

  • CPU:16コア(高性能12+高効率4)

  • メモリ:128GB 統合メモリ(LPDDR5)

  • ストレージ:1TB~最大8TB SSD

  • OS:macOS 14+(Metal, MLX対応)

  • 拡張性:Thunderbolt 5対応(eGPU不可)

  • 消費電力:約120W、静音、高効率

購入先
Apple公式サイトのCTO構成(128GBメモリは受注生産)。


メモ:筆者のメインマシン。FLUX.1 [Schnell]やMMAudio、LM Studioなどを複数同時に動かしています。ただ、AI用途ではPinokioがメインですが、NVIDIA Onlyのソフトも多いため、CUDAが使えるメモリ多めのマシンの必要性は感じまず。

HP OMEN 45L RTX 5090(約100万円)

概要
HPのゲーミング系ハイエンドタワー。NVIDIA RTX 5090(32GB GDDR7)を搭載し、現在最強クラスのGPU演算性能を誇る。画像生成AIやビデオ生成など大量のVRAMを要求するタスクに最適。メモリやストレージの拡張性も非常に高く、長期運用に向いている。

ユースケース
Stable Diffusion / ComfyUI、LoRAやDreamBoothなどの学習、映像系AIツール、3D生成。

特徴

  • GPU:RTX 5090(32GB GDDR7)

  • CPU:Core Ultra 9 285K(24コア)

  • メモリ:64GB DDR5(最大192GB拡張可)

  • ストレージ:2TB SSD + 2TB HDD

  • OS:Windows 11 Pro(Linux換装も可)

  • 拡張性:PCIe, M.2, SATA全対応

  • 消費電力:700Wクラス、高冷却(大型水冷)、やや騒音あり

購入先
HP日本公式オンラインストア

メモ:単体ではなかなか買えないRTX 5090ですが、ここなら買えたという情報が。93万8300円

Mac Studio M3 Ultra 512GB(約150万円)

概要
Appleが提供する最高峰の統合型デスクトップ。M3 Ultraチップは最大80コアGPUと512GBのユニファイドメモリを搭載し、GPU・CPU・Neural Engineが高速に協調。巨大なモデル(例:Mixtral, GPT-J-6B 以上)もローカルで同時実行可能。

ユースケース
最大規模のローカルLLM実行、マルチモデル同時起動、生成AIを使った映像・音楽・アート制作の本格運用。

特徴

  • GPU:M3 Ultra内蔵(最大80コア)

  • CPU:32コア(高性能24+高効率8)

  • メモリ:512GB 統合メモリ

  • ストレージ:1TB~16TB SSD

  • OS:macOS 14+

  • 拡張性:Thunderbolt 5、多ポートあり(内部拡張不可)

  • 消費電力:約300W、高効率静音設計、小型筐体

購入先
Apple公式ストア(CTO構成で512GBメモリを選択)

メモ:こちらを買いたいのはもちろんなのですが、新しく登場したオリコのApple製品専用カードでも限度額が100万円なので、ちょっと難しい。

今は購入した人のレポートを指をくわえてみています。

自作PC(192GBメモリ構成、約20万円~)

概要
最新のBIOSとDDR5 48GBモジュールを使えば、一般的なマザーボードでも192GBのRAMを構成可能。GPUは後から追加可能。安価に大容量RAMマシンを構築したい人におすすめ。Stable Diffusion等には別途GPU(例:RTX 4070)を追加すれば対応可。

ユースケース
ローカルLLMの推論、マルチインスタンス実行、量子化モデル(GPTQ等)の実験用、AIの省電力常時運用

特徴

  • GPU:構成により選択(初期は非搭載も可能)

  • CPU:Ryzen 9 7950X / Core i9-13900K など

  • メモリ:192GB DDR5(48GB×4)

  • ストレージ:1TB SSD以上

  • OS:Windows 11 Pro / Linux

  • 拡張性:最大、PCIe, M.2, メモリ増設すべて対応

  • 消費電力:構成次第(200~400W)、冷却次第で静音化も可能

購入先
ツクモ、ドスパラ、パソコン工房など。BTO構成でも対応可能(サイコム等)。

メモ:中古でいいのなら、「Dell Precision T7920(XeonスケーラブルCPU×2基搭載)では、52コア104スレッドのCPU構成に192GBメモリを搭載した中古品が約18.5万円で販売されている例があります」とChatGPTによる情報。実際に売られていました。性能は期待できないけど、選択肢の一つにはなりそう。

ASUS Ascent G10(約50万円 想定)

概要
DGX Sparkのリファレンス仕様をASUSが一般販売用に設計した小型マシン。Blackwell GPU + Grace CPUの構成で、Sparkとほぼ同じAI性能をより安価に提供。128GB統合メモリを備え、超大規模モデルの推論が可能。

ユースケース
研究開発、分散クラスタ用ノード、個人でのローカル大規模モデル運用

特徴

  • GPU:Blackwell GB10(Grace Blackwell SoC内蔵)

  • CPU:NVIDIA Grace 20コア

  • メモリ:128GB LPDDR5X

  • ストレージ:1TB SSD

  • OS:Linuxベース、NVIDIA AIスタック対応

  • 拡張性:USB4、200GbE NIC、2台直結でクラスタ可

  • 消費電力:170W、小型筐体

購入先
ASUS公式または販売代理店(国内展開予定あり)

メモ:日本で売ってくれるかどうか、それはいつか、価格はどうか、ですよね。NVIDIAからの予約は現在米国のみですし、1台だけとなっています。

Mac mini M4 Pro 64GB(約30~40万円)

概要
Mac miniとしては最高スペックのM4 Pro構成で、64GBの統合メモリを搭載。M1 Pro世代に比べて大幅な性能向上があり、中規模LLMや軽量な画像生成に向いている。非常に小型・静音で扱いやすい。

ユースケース
省スペースのAIデスクトップ、ローカルLLM(例:LLaMA 3 8Bなど)、学習・開発用途

特徴

  • GPU:M4 Pro内蔵(20コア前後)

  • CPU:12コア(高性能8+高効率4)

  • メモリ:64GB 統合メモリ

  • ストレージ:1TB~8TB SSD

  • OS:macOS 14+

  • 拡張性:Thunderbolt 5搭載、内部増設不可

  • 消費電力:60W前後、極めて静音

購入先
Apple公式ストアのCTO構成

メモ:量子化されたLLMを動かしたり、PinokioのAIソフトを動かすための環境としては良いのではないでしょうか。Unified Memoryは32、64、128、512GBまでスケーラブル(増設はできないけど)なので、用途に応じて選択の幅があるのはナイスです。

《松尾公也》

松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。