Lenovo ThinkStation PGX SFF AI 工作站 (4TB SSD)
非常適合 LLM 推論 / LoRA 微調 / AI Prototype / CUDA 開發。
1) 核心亮點:GB10(Grace Blackwell Superchip)
Nvidia GB10 Grace Blackwell(20 核心 ARM CPU,SoC),具備 1 PFLOP AI 效能
Nvidia GB10 Grace Blackwell(20 核心 ARM CPU,SoC),具備 1 PFLOP AI 效能
這邊的關鍵有 2 個:
✅ (1) 它是 SoC(系統晶片)
意思是:CPU + GPU + 記憶體架構是同一套整合平台,有點像 Apple M 系列那種思路,但面向 AI 的算力更兇。
✅ (2) AI 算力主打 FP4 / Tensor(1 PFLOP)
1 PFLOP 通常指的是 FP4(低精度)+ Tensor Core 這種 AI 專用算力,不是你在一般 CPU benchmark 看到的那種浮點效能。
2) 作業系統:NVIDIA DGX OS
預載 DGX OS(Ubuntu Linux based)
直接附 NVIDIA AI 軟體堆疊(CUDA、PyTorch、Jupyter 等)
3) 記憶體:128GB LPDDR5x「統一系統記憶體」(UMA)
✅ 統一記憶體 = CPU/GPU 共用同一池 128GB
不像一般 PC:
CPU RAM 64GB
GPU VRAM 24GB
LLM 會被 VRAM 卡死。
而 PGX 是:
整池 128GB 都可以被 AI 用(以 UMA 模式)
且 bandwidth 規格很強(可到 273GB/s)
➡️ 這對 LLM 意義超大:
你可以塞下更大的模型(或更大的 context),不用一開始就上伺服器/雲端。
4) GPU:NVIDIA Blackwell(整合式)
它不是插一張獨顯
而是 GB10 Superchip 內建 Blackwell GPU
✅ 優點:AI tensor 推論非常強
⚠️ 限制:它不是為了 3D 工作站渲染/遊戲而生(但能顯示)
5) 儲存:最高 4TB NVMe M.2
這部分的意義在於:
AI 模型、dataset、container image 很吃 SSD
NVMe 對 pipeline(資料前處理、embedding、cache)有差
6) 網路:ConnectX-7 Smart NIC + 10GbE RJ45
ConnectX-7 在 NVIDIA 生態就是:
給高速模型/多機協作、RDMA、集合通訊用的
✅ 兩台 PGX 可串聯
甚至 Lenovo 的產品說明有提到:
兩台 PGX 可以組合跑更大的模型(例如參數量翻倍上去)。
7) 連接埠:4x USB-C 20Gbps + HDMI 2.1a
它幾乎所有 I/O 都走 USB-C:
4x USB-C(USB 20Gbps)
HDMI 2.1(4K@60Hz)
8) 顯示器:最多 4 部獨立顯示器
9) 體積/功耗:150mm 小立方 + 240W
150 x 150 x 50.5 mm
約 1.2kg
240W
這台 PGX 適合誰?
✅ 非常適合
本機 LLM 開發(RAG、Agent、function calling)
推論服務 PoC(先本機跑起來再搬到機房/雲端)
LoRA / PEFT 微調
CUDA / TensorRT / Triton 開發
想用「DGX OS 風格」做 AI 開發流程的人
⚠️ 不太適合
把它當一般 Windows 工作站(它是 DGX OS 生態為主)
期待像 RTX 5090 那種遊戲/3D 渲染定位
