Dù kiến trúc Blackwell của NVIDIA gặp không ít trắc trở trên cả thẻ tăng tốc và card chơi game, điều này không ngăn cản hãng đưa ra kế hoạch đầy tham vọng cho tương lai. NVIDIA không chỉ công bố chi tiết kế hoạch sản phẩm cho kiến trúc Rubin thế hệ tiếp theo, mà còn lần đầu tiên tiết lộ kiến trúc “Feynman” – thế hệ sau Rubin.
Ba sản phẩm mới được công bố.
NVIDIA đã công bố ba sản phẩm mới, bắt đầu với Blackwell Ultra NV72, dự kiến ra mắt vào nửa cuối năm nay. Mỗi nút (node) được trang bị hai GPU Blackwell nâng cấp, một CPU Grace, và tối đa 288GB bộ nhớ băng thông cao HBM3e. Hiệu suất Dense FP4 đạt 15 PFlops (1,5 triệu tỷ phép tính mỗi giây).
Toàn bộ máy chủ có 72 nút, tức là 144 GPU, 72 CPU, 20TB bộ nhớ HBM3e, và 40TB bộ nhớ DDR5 – tăng 50% so với thế hệ trước. Băng thông kết nối CX8 đạt 14,4TB/s, tăng 100%. Hiệu suất suy luận Dense FP4 của toàn máy đạt 1,1 EFlops (110 triệu tỷ phép tính mỗi giây), hiệu suất huấn luyện FP8 là 0,36 EFlops (36 triệu tỷ phép tính mỗi giây), kèm theo các lệnh mới hỗ trợ cơ chế “attention”.
Tiếp theo, vào nửa cuối năm 2026, kiến trúc hoàn toàn mới Rubin sẽ ra mắt với sản phẩm máy chủ đầu tiên là Vera Rubin NV144. Mỗi nút có hai GPU Rubin và một CPU Vera mới. GPU Rubin được trang bị 288GB bộ nhớ HBM4 thế hệ tiếp theo, với hiệu suất FP4 tăng vọt lên 50 PFlops (5 triệu tỷ phép tính mỗi giây).
CPU Vera sở hữu 88 nhân Arm tự phát triển, hỗ trợ đa luồng lần đầu tiên với 176 luồng, kết nối với nhau qua bus NVLink-C2C băng thông 1,8TB/s. Toàn bộ máy chủ có 144 nút, tức 288 GPU, 144 CPU, 41,5TB bộ nhớ HBM4 (băng thông 13TB/s), và 75TB bộ nhớ hệ thống. Băng thông NVLink6 đạt 260TB/s, bus CX9 đạt 28,8TB/s. Hiệu suất suy luận FP4 là 3,6 EFlops (360 triệu tỷ phép tính mỗi giây), hiệu suất huấn luyện FP8 đạt 1,2 EFlops (120 triệu tỷ phép tính mỗi giây).
Đến nửa cuối năm 2027, phiên bản nâng cấp Rubin Ultra NV576 sẽ xuất hiện. Mỗi nút bao gồm bốn GPU Rubin, một CPU Vera, và nâng cấp lên 1TB bộ nhớ HBM4e, với hiệu suất FP4 đạt 100 PFlops (10 triệu tỷ phép tính mỗi giây). Toàn máy có tới 576 nút, tức 2304 GPU Rubin, 576 CPU Vera, 576TB bộ nhớ HBM4e (băng thông 4,6PB/s), và 365TB bộ nhớ hệ thống. Bus kết nối NVLink nâng cấp lên thế hệ thứ bảy (NVLink7) với băng thông ấn tượng 1,5PB/s, trong khi bus CX9 đạt 115,2TB/s. Hiệu suất suy luận FP4 lên tới 15 EFlops (1500 triệu tỷ phép tính mỗi giây), hiệu suất huấn luyện FP8 đạt 5 EFlops (500 triệu tỷ phép tính mỗi giây).
Kiến trúc Feynman
Cuối cùng, kiến trúc Feynman sẽ ra mắt lần đầu vào năm 2028, kết hợp với bộ nhớ HBM thế hệ tiếp theo (có thể là HBM5), nhưng hiện tại NVIDIA chưa tiết lộ thêm chi tiết cụ thể.
Feynman được đặt theo tên Richard Feynman, một nhà vật lý người Mỹ gốc Do Thái, một trong những nhà vật lý vĩ đại nhất thế kỷ 20, người từng đoạt giải Nobel Vật lý. Ông có những đóng góp tiên phong trong các lĩnh vực như điện động lực học lượng tử, tính toán lượng tử, công nghệ nano, đồng thời là tác giả của *Bài giảng Vật lý Feynman* và phương pháp học “Feynman”. Ông cũng là người tìm ra nguyên nhân gốc rễ của vụ nổ tàu con thoi Challenger năm 1986.
Ba sản phẩm mới được công bố.
NVIDIA đã công bố ba sản phẩm mới, bắt đầu với Blackwell Ultra NV72, dự kiến ra mắt vào nửa cuối năm nay. Mỗi nút (node) được trang bị hai GPU Blackwell nâng cấp, một CPU Grace, và tối đa 288GB bộ nhớ băng thông cao HBM3e. Hiệu suất Dense FP4 đạt 15 PFlops (1,5 triệu tỷ phép tính mỗi giây).

Tiếp theo, vào nửa cuối năm 2026, kiến trúc hoàn toàn mới Rubin sẽ ra mắt với sản phẩm máy chủ đầu tiên là Vera Rubin NV144. Mỗi nút có hai GPU Rubin và một CPU Vera mới. GPU Rubin được trang bị 288GB bộ nhớ HBM4 thế hệ tiếp theo, với hiệu suất FP4 tăng vọt lên 50 PFlops (5 triệu tỷ phép tính mỗi giây).



Kiến trúc Feynman
Cuối cùng, kiến trúc Feynman sẽ ra mắt lần đầu vào năm 2028, kết hợp với bộ nhớ HBM thế hệ tiếp theo (có thể là HBM5), nhưng hiện tại NVIDIA chưa tiết lộ thêm chi tiết cụ thể.

Feynman được đặt theo tên Richard Feynman, một nhà vật lý người Mỹ gốc Do Thái, một trong những nhà vật lý vĩ đại nhất thế kỷ 20, người từng đoạt giải Nobel Vật lý. Ông có những đóng góp tiên phong trong các lĩnh vực như điện động lực học lượng tử, tính toán lượng tử, công nghệ nano, đồng thời là tác giả của *Bài giảng Vật lý Feynman* và phương pháp học “Feynman”. Ông cũng là người tìm ra nguyên nhân gốc rễ của vụ nổ tàu con thoi Challenger năm 1986.
BÀI MỚI ĐANG THẢO LUẬN