Reviews  Unbox nhanh card đồ họa RTX 3080 - Kiến trúc Ampere

VNZ-Reviews
(Vn-Z.vn) Cuộc cách mạng đầu tiên trong lĩnh vực cạc đồ họa 3D là GeForce 256 do NVIDIA tung ra vào năm 1999. Card đồ họa 3D này tích hợp công nghệ T&L (chuyển đổi ánh sáng và bóng tối phần cứng), đảm nhiệm việc xử lý ánh sáng và bóng tối từ CPU, giải phóng CPU đồng thời cải thiện đáng kể hiệu suất khi chơi trò chơi , hình ảnh chất lượng và thật hơn.




Sau công nghệ T&L, một bước nhảy vọt khác của công nghệ đồ họa 3D là DX10 được ra mắt năm 2006 dựa trên kiến trúc kết xuất thống nhất. Công nghệ DX10 hợp nhất Vertex Shader (bộ đổ bóng đỉnh) và Pixel Shader (bộ đổ bóng pixel) trước đó thành một bộ xử lý phát trực tuyến. Kể từ đó, GPU được thiết kế không còn mở ra các đường ống độc lập nữa, mà tất cả các quá trình xử lý dòng Đơn vị tính toán của bộ xử lý có thể xử lý bất kỳ loại hoạt động Shader nào một cách tùy ý, do đó hiệu quả tính toán của GPU đã được tăng gấp đôi.

10 năm tiếp theo, không có công nghệ đột phá nào trong lĩnh vực GPU, trong khi DX12 có hiệu suất cải thiện không tốt như tưởng tượng. Đến tháng 8/2018, sự xuất hiện của công nghệ dò tia thời gian thực đã giúp bức tranh của game 3D lên một tầm cao mới, lần đầu tiên người chơi được nhìn thấy thế giới ánh sáng và bóng tối như phim khoa học viễn tưởng trong game. Khi GPU Turing ra mắt, giá trị thị trường của NVIDIA đã tăng vọt, thậm chí vượt qua cả Intel. Ông già Huang giàu có đã không để chúng ta phải đợi lâu, chỉ trong hai năm, NVIDIA một lần nữa đổi mới kiến trúc GPU.

Dòng card đồ họa GeForce RTX 30 dựa trên kiến trúc Ampere thế hệ mới được phát hành vào ngày 4 tháng 9 năm 2020 hợp nhất các đơn vị INT32 và FP32. Trong đó đơn vị INT32 vốn chỉ có thể thực hiện các phép toán số nguyên giờ đây có thể thực hiện cả phép toán số nguyên và dấu phẩy động chính xác đơn.

Sự đổi mới công nghệ này giúp tăng gấp đôi số lượng bộ xử lý dòng theo nghĩa truyền thống và đồng thời tăng gấp đôi khả năng tính toán dấu phẩy động của GPU. Vì vậy, số lượng bộ xử lý luồng của RTX 3080 tăng từ 2.954 của RTX 2080 lên 8.704.



GA102 hoàn chỉnh có 7 nhóm GPC, mỗi nhóm GPC có 12 nhóm đơn vị SM cộng với 16 nhóm đơn vị ROP, tổng cộng 84 nhóm đơn vị SM và 112 đơn vị ROP.
Dòng card đồ họa RTX 30 khác nhau về tổng số đơn vị SM được kích hoạt tùy thuộc vào thông số kỹ thuật. RTX 3090 có 7 nhóm TPC, 24 nhóm đơn vị SM và 112 đơn vị ROP, RTX 3080 có 6 nhóm TPC, 68 nhóm đơn vị SM và 96 ROP, RTX 3070 Có 6 nhóm TPC, 46 nhóm và 96 ROP.



Đây là kiến trúc đơn vị SM của lõi GA102. Mỗi đơn vị SM có 64 lõi số nguyên INT32, 64 lõi dấu chấm động chính xác đơn FP32, 2 đơn vị FP64 (không được đánh dấu), 4 CORE TENSOR thế hệ thứ ba và 1 RT CORE thế hệ thứ hai.

Đơn vị INT32 ở đây có thể thực hiện các phép toán số nguyên chính xác đơn hoặc dấu phẩy động tùy theo yêu cầu, có nghĩa là về mặt lý thuyết một đơn vị SM có thể có tối đa 128 đơn vị FP32. Kết hợp bộ nhớ đệm cấp đầu tiên và bộ nhớ đệm dùng chung. Tổng dung lượng bộ nhớ cache trong mỗi đơn vị SM là 128KB, có thể được phân bổ linh hoạt cho bộ nhớ đệm cấp một và bộ nhớ chia sẻ khi cần. Đây là sự kết hợp của 64KB + 64KB hoặc 32KB + 96KB.



Thông số GPU-Z RTX3080

RTX 3080 có 68 đơn vị SM, về mặt lý thuyết có thể đạt tới quy mô 8704 bộ xử lý dòng. Có thể nhiều người nghi ngờ rằng NVIDIA đang nói dối chúng ta, liệu các bộ xử lý luồng này có thể hoạt động cùng lúc hay không vẫn còn là một dấu hỏi.

Bạn có thể tham khảo phân tích kiến trúc Ampere trên card đồ họa RTX 30 Series qua bài viết này

https://vn-z.vn/threads/nvidia-rtx-30-series-kien-truc-gpu-ampe-8nm-nang-hieu-suat-gap-doi-nhu-the-nao.26916/


Sử dụng AIDA64 GPGPU để xác minh xem bộ xử lý luồng 8704 của RTX 3080 có bị phóng đại hay không.



Nếu tính toán hiệu suất dấu phẩy động lý thuyết của RTX 3080 dựa trên tần số 1710MHz và 8704 đơn vị FP32, nó sẽ là 29767GFLOPS. Hiệu suất dấu chấm động chính xác đơn đo được của RTX 3080 là 29117GFLOPS, thấp hơn một chút so với giá trị lý thuyết. Điều này là do giới hạn TDP 320W. Khi RTX 3080 thực hiện kiểm tra dấu chấm động chính xác đơn GPGPU, tần số toàn tải của lõi GPU chỉ là 1672MHz và không đạt đến tần số im lặng là 1710MHz.


Tuy nhiên, có thể thấy rằng RTX 3080 có 8704 bộ xử lý luồng (đơn vị FP32),.

Hiệu suất dấu chấm động chính xác đơn đo được của RTX 2080 Ti là 16626GFLOPS, gần bằng 60% của RTX 3080. Thực tế, trong quá trình thử nghiệm GPGPU, tần số hoạt động của RTX 2080 Ti đạt 1910MHz, do đó, mặc dù số lượng bộ xử lý luồng chỉ bằng một nửa nhưng hiệu suất dấu chấm động có thể đạt tới 60%.



Khi RTX 2080 được thử nghiệm trên GPGPU, tần số hoạt động cao tới 1938MHz và hiệu suất tính toán dấu chấm động chính xác đơn đạt 11416GFLOPS, bằng khoảng 40% so với RTX 3080. Chúng ta phải biết rằng bộ xử lý dòng RTX 2080 2944 chỉ tương đương với 1/3 bộ xử lý dòng RTX 3080 8704.

Đó là lý do tại sao RTX 3080 TDP lại cao như vậy! Ngay cả với TDP là 320W, rất khó để đáp ứng yêu cầu tiêu thụ điện năng cho các bộ xử lý dòng 8704 chạy ở tần số cao hơn. Hiện tại RTX 30 Seri được xem là công nghệ card đồ họa tốt nhất được chế tạo .



Kiểu dáng của hộp đã thay đổi từ màu xanh lục và đen của thời Turing sang màu đen tuyền.


Mở hộp, ngoài card còn có phụ kiện cáp chuyển đổi kép 8Pin sang 12Pin.


Quạt tản nhiệt ở mặt trước của card


Quạt tản nhiệt ở mặt sau giúp tản nhiệt CPU của card


Cổng cấp nguồn 12Pin ở giữa.


Chi tiết chân 12pin



Nhìn ở góc này bạn có thể thấy kích thước card khá lớn có thể chiếm dụng khay ổ cứng hoặc SDD, tuy nhiên không có gió thổi ở khu vực chiếm dụng vì quạt tản nhiệt không đặt ở vị trí này. Tức là bạn không sợ bị thổi gió nóng từ card vào ổ cứng.


Cận cảnh hơn quạt tản nhiệt ở mặt sau


Cổng Type-C đã được loại bỏ, RTX 3080 chỉ có bacổng DP 1.4 và một cổng HDMI 2.1.


Tháo tản nhiệt trên RTX 3080


Đế tản nhiệt được bao quanh bởi lớp dẫn nhiệt lớn , bộ nhớ GDDR6X cũng được bao phủ bởi một lớp nền dẫn nhiệt.



Bo mạch PCB rất đặc biệt. Với thiết kế mạch cấp nguồn 18 pha, ngoài ra còn có 2 vị trí hàn trống , có thể là dành cho RTX 3090 sẽ có nguồn 20 pha.


Ở mặt sau của bảng mạch PCB, tụ cấp nguồn được đặt ở phía bên này. Mỗi pha cung cấp nguồn được trang bị 3 tụ điện tantali giá thành cao.


Lõi GA102-200-KD-A1, 8704 bộ xử lý dòng, diện tích lõi 628,4mm2, với 28,3 tỷ bóng bán dẫn.



Cận cảnh mạch cấp nguồn.


Bộ nhớ Micron’s GDDR6X có tổng cộng 10 chip, mỗi chip có dung lượng 1GB và tổng dung lượng là 10GB. Tần số là 19GHz, độ rộng bit là 320Bit, băng thông bộ nhớ là 760GB / s.


Cổng cấp nguồn 12 chân


Cận cảnh cổng đầu ra.




Cận cảnh Tụ tantali ở mặt sau của PCB.


RTX 3080 đã tăng gấp đôi từ 4352 lên 8.704 nói một cách đơn giản, bộ xử lý dòng đã tăng gấp đôi so với dự kiến ban đầu của Nvidia và giá cũng giảm một nửa! 8704 bộ xử lý dòng RTX 3080 thực sự có thể hoạt động cùng lúc, nhưng hiệu suất chỉ tăng 30% so với số bộ xử lý dòng RTX 2080 Ti? Hỗ trợ DLSS tối ưu hóa chất lượng hình ảnh, gần như tương đương với răng cưa TAA . RTX 3080 là một trong những card đồ họa tốt nhất hiện nay.
 
Trả lời