Pháp sư Trung Quốc ra mắt mã nguồn mở IP bộ điều khiển bộ nhớ DDR4 “Bạch Dương”: hiệu năng tiệm cận IP thương mại

VNZ-Relax
Nhóm phát triển xử lý XiangShan Trung Quốc mới đây đã chính thức ra mắt mã nguồn mở IP bộ điều khiển bộ nhớ hiệu năng cao, có tên mã “Ngọc Tuyền”, trong đó IP điều khiển DDR4 mang tên “Bạch Dương”. Đây được xem là cột mốc mang tính bước ngoặt đối với dự án vi xử lý XiangShan cũng như nghiên cứu hệ thống bộ nhớ đi kèm.

IP-China.webp


Theo nhóm phát triển, khi năng lực tính toán của CPU liên tục tăng nhanh, nút thắt hiệu năng của hệ thống bộ nhớ ngày càng trở nên rõ rệt. Tần số CPU tăng không đồng nghĩa với việc hiệu năng toàn hệ thống tăng tương ứng, bởi tốc độ phát triển của bộ nhớ chậm hơn nhiều so với bộ xử lý. Hiệu ứng “thùng gỗ” này khiến độ trễ truy cập bộ nhớ trở thành yếu tố then chốt kìm hãm hiệu năng hệ thống, đặc biệt nghiêm trọng trong kỷ nguyên dữ liệu lớn và trí tuệ nhân tạo.

Để giảm bớt vấn đề “bức tường bộ nhớ”, giới nghiên cứu đã đề xuất nhiều giải pháp khác nhau, trong đó bộ điều khiển bộ nhớ hiệu năng cao là công nghệ then chốt, giúp nâng cao hiệu quả truy cập bộ nhớ, giảm độ trễ và cải thiện mức độ sử dụng băng thông, từ đó giảm tác động tiêu cực lên hiệu năng tổng thể.

Song song với đó, nhân xử lý mã nguồn mở XiangShan đã phát triển nhanh chóng lên thế hệ thứ ba – Kunming Lake, với đường truy cập bộ nhớ liên tục được nâng cấp, kiến trúc và hiệu năng của các cấp bộ nhớ đệm L1–L2–L3 cũng không ngừng được tối ưu. Tuy nhiên, bộ điều khiển bộ nhớ – cầu nối giữa CPU và RAM – trong hệ sinh thái mã nguồn mở vẫn còn khá “ngây thơ” (dumb), thiếu các tối ưu hiệu năng chuyên sâu.

Hiệu năng của bộ điều khiển bộ nhớ ảnh hưởng trực tiếp đến trần hiệu năng mà nhân xử lý có thể đạt được, nhưng hiện nay vẫn thiếu các giải pháp sáng tạo cho phép tối ưu đồng thời kiến trúc CPU và bộ điều khiển bộ nhớ. Các dự án mã nguồn mở hiện có, cả trong và ngoài nước, đều chưa đáp ứng được yêu cầu của một IP điều khiển bộ nhớ hiệu năng cao.

Trên thị trường hiện nay, IP bộ điều khiển bộ nhớ bị độc quyền bởi một số ít nhà cung cấp, với chi phí bản quyền cực kỳ đắt đỏ. Ví dụ, phí bản quyền DDR5 cho một dự án đơn lẻ có thể lên tới 800.000–1,5 triệu USD, chưa kể các IP này chứa hàng trăm tham số cấu hình, khiến việc phát triển và tinh chỉnh trở nên rất phức tạp.

Một số nhà cung cấp IP bộ nhớ lớn hiện nay gồm:
• Synopsys: DDR4 / DDR5 / LPDDR5 / HBM
• Cadence: LPDDR6 / 5X / HBM4
• Alphawave: HBM3 / UCIe / CXL
• Rambus: DDR3 / DDR4 / GDDR6 / HBM3
• ARM / Intel / Qualcomm: thường tích hợp bộ điều khiển bộ nhớ trong chipset, phải mua cả chip

Các dự án bộ điều khiển bộ nhớ mã nguồn mở hiện có chủ yếu phục vụ các kịch bản nhẹ hoặc chuyên biệt, còn hạn chế về hiệu năng, độ hoàn thiện chức năng và khả năng hỗ trợ tape-out.

Hiện tại, phương án tape-out của XiangShan vẫn phải sử dụng IP DDR4/DDR5 thương mại, nhưng tồn tại nhiều vấn đề:
• Chi phí rất cao, đặc biệt với IP DDR5 trên tiến trình tiên tiến
• Khó tối ưu, do không thể điều chỉnh theo đặc điểm truy cập bộ nhớ riêng của nhân XiangShan
• Số lượng tham số cấu hình quá lớn, thiếu phương pháp khoa học để tối ưu không gian thiết kế

Memory-control-1.webp

Trước những thách thức này, IP “Bạch Dương” được định hướng ngay từ đầu nhằm lấp đầy khoảng trống giữa IP điều khiển bộ nhớ mã nguồn mở thông thường và IP hiệu năng cao có thể tự tiến hóa trong hệ sinh thái mở.

Thiết kế của “Bạch Dương” chia nhỏ và tái cấu trúc các vấn đề kỹ thuật, từ bảy thách thức chính rút gọn thành bốn bài toán nghiên cứu cốt lõi:
hỗ trợ tham số hóa và cấu hình linh hoạt, kiến trúc mô-đun có thể phân rã và tái sử dụng, hỗ trợ các tính năng nâng cao như làm tươi động, lập lịch động, cache, tiền truy xuất (prefetch), đồng thời tương thích các giao thức DFIx và AXI4.

IP “Bạch Dương” sử dụng kiến trúc mô-đun, có khả năng cấu hình cao, ngoài các chức năng cơ bản còn tích hợp nhiều tính năng nâng cao:
• Cấu hình bằng phần mềm: thông qua giao diện APB, cho phép truy cập và cấu hình linh hoạt các thanh ghi
• Tách biệt thời gian và lập lịch: tách logic thời gian DDR khỏi bộ lập lịch giao dịch, giúp tái sử dụng và dễ bảo trì
• Các mô-đun nâng cao: làm tươi động, lập lịch thông minh, cache và prefetch, giúp cải thiện rõ rệt hiệu năng

Hiện tại, IP “Bạch Dương” đã đạt được những kết quả quan trọng theo từng giai đoạn. Về mặt chức năng, nhóm đã tích hợp thành công “Bạch Dương” với nhân Kunming Lake thế hệ thứ ba trên nền tảng mô phỏng phần cứng Palladium, khởi động được hệ điều hành Linux và các ứng dụng thử nghiệm, chứng minh tính ổn định và chính xác.

Về hiệu năng, hệ thống kết hợp nhân Kunming Lake và bộ điều khiển bộ nhớ Bạch Dương đã đạt hơn 14 điểm/GHz trong bài kiểm tra SPEC CPU2006, cho thấy hiệu năng đã tiệm cận các IP bộ nhớ thương mại.

Mã nguồn