Gặp gỡ GP102
Ghi chú của người biên tập: Chúng tôi đã cập nhật bài viết để bao gồm các phép đo công suất, nhiệt và tiếng ồn trên các trang 7 và 8, đồng thời chúng tôi đã thực hiện các chỉnh sửa đối với kết luận của mình để phản ánh các phép đo đó (xem trang 10).
Bạn có sở trường giao dịch đồng Bảng Anh với đồng Yên Nhật. Bạn có một công thức nước sốt nóng chết người và nó được phân phối trên toàn thế giới. Bạn vừa làm đối tác ở công ty của bố vợ bạn. Dù thế nào đi nữa thì bạn cũng thuộc nhóm ưu tú không thực sự lo lắng về tiền bạc. Bạn có ngôi nhà trên bãi biển, Bentley và Bulgari. Và giờ đây, Nvidia đã có một card đồ họa cho PC chơi game của bạn: Titan X. Nó được xây dựng trên bộ xử lý đồ họa GP102 mới có 3584 lõi CUDA, được hỗ trợ bởi 12GB bộ nhớ GDDR5X trên bus 384-bit và được cung cấp miễn phí ở mức 1200 đô la.
Trước khi một điểm chuẩn duy nhất được công bố, Nvidia đã nhận được lời khen ngợi khi tung ra GPU dựa trên Pascal thứ ba trong nhiều tháng và những lời chỉ trích vì tăng giá của chiếc flagship của mình — một cách tiếp cận đã đốt cháy Intel khi giới thiệu Core i7-6950X ở mức $ 1700 trở lên chưa từng có. . Tuy nhiên, đây là vấn đề: những người mua những thứ tốt nhất trong số những thứ tốt nhất không bị ảnh hưởng bởi thuế hàng xa xỉ đang tăng lên. Và những người thực sự kiếm tiền bằng PC của họ vui vẻ trả phí bảo hiểm cho phần cứng có thể tăng thu nhập của họ.
Tất cả những điều đó làm cho thời gian của chúng ta với Titan X bớt khó khăn hơn một chút, chúng tôi nghĩ vậy. Không có cân nhắc giá trị sáng-sau khi mua. Bạn phải trả nhiều hơn 70% so với chi phí của GeForce GTX 1080 để có thêm 40% số lõi CUDA và tăng 50% băng thông bộ nhớ. Chúng tôi đã biết trước khi thậm chí nhận được một thẻ rằng hiệu suất sẽ không tăng theo chi phí. Tuy nhiên, chúng tôi không thể chờ đợi để chạy các điểm chuẩn. Liệu Titan X có cải thiện tốc độ khung hình ở mức 4K đủ để đáp ứng các tiền vệ ghế bành nhanh chóng gọi 1080 không đủ để chơi game chất lượng tối đa không? Chỉ có một cách để tìm ra.
GP102: Giống như GP104, ngoại trừ lớn hơn
Với GeForce GTX 1080, Nvidia đã giới thiệu cho chúng ta bộ vi xử lý GP104 (Pascal cao cấp). Về mặt tinh thần, GPU đó đã thành công GM204 (Maxwell cao cấp), được nhìn thấy lần cuối cùng ở trung tâm của GeForce GTX 980. Nhưng vì kiến trúc Pascal được sắp xếp trùng với sản xuất FinFET 16nm và bộ nhớ GDDR5X nhanh hơn, kết quả là GTX 1080 không gặp khó khăn gì khi đặt giảm 30% + tốc độ khung hình trung bình cao hơn GTX 980 Ti và Titan X, cả hai đều được cung cấp bởi GM200 (Maxwell siêu cao cấp). Điều này khiến chúng ta dễ dàng quên đi bước tiếp theo, đặc biệt là khi chúng ta biết rằng GP100 15,3 tỷ bóng bán dẫn (Pascal siêu cao cấp) hướng đến máy tính và có lẽ không dành cho máy tính để bàn.
Giờ đây, lần đầu tiên chúng ta có một loại GPU ‘tweener, được bao quanh bởi bộ xử lý cao cấp nhất của Nvidia và GP104. Cái này được gọi là GP102 và về mặt kiến trúc, nó tương tự như GP104, chỉ lớn hơn. Bốn Cụm xử lý đồ họa trở thành sáu. Đổi lại, 20 Bộ xử lý đa luồng trở thành 30. Và với 128 lõi FP32 CUDA trên mỗi SM, GP102 sử dụng tới 3840 khối xây dựng có thể lập trình được. Tuy nhiên, GP102 cực kỳ phức tạp (nó bao gồm 12 tỷ bóng bán dẫn). Để cải thiện hiệu suất, Nvidia vô hiệu hóa hai trong số các SM của bộ xử lý cho Titan X của nó, nâng số nhân CUDA của bo mạch xuống 3584. Và bởi vì mỗi SM cũng có tám đơn vị kết cấu, việc tắt hai trong số chúng sẽ để lại 224 đơn vị kết cấu được bật.
Thông số kỹ thuật của Titan X trích dẫn xung nhịp cơ bản 1417 MHz, với tần số GPU Boost điển hình trong phạm vi 1531 MHz. Điều đó mang lại cho thẻ tỷ lệ FP32 là 10.1+ TFLOPS, cao hơn gần 23% so với GeForce GTX 1080.
Không nghi ngờ gì nữa, GP104 sẽ được hưởng lợi từ giao diện bộ nhớ rộng hơn, đặc biệt là ở 4K. Nhưng tiềm năng tạo bóng / kết cấu lớn hơn của GP102 chắc chắn đòi hỏi sự cân bằng lại các loại. Do đó, mặt sau của bộ xử lý phát triển để bao gồm 12 bộ điều khiển bộ nhớ 32 bit, mỗi bộ điều khiển liên kết với tám ROP và 256KB L2 (như với GP104), mang lại tổng cộng 96 ROP và 3MB bộ nhớ đệm dùng chung. Điều này dẫn đến một đường dẫn tổng hợp 384-bit, mà Nvidia sử dụng 12GB của GDDR5X 10 Gb / s tương tự được tìm thấy trên GTX 1080.
Băng thông bộ nhớ lý thuyết của thẻ là 480 GB / s (so với 320 GB / s của 1080 – tăng 50%), mặc dù thông lượng hiệu quả sẽ cao hơn sau khi xem xét các cải tiến nén màu delta của kiến trúc Pascal.
Tại sao lại tiếp tục sử dụng công nghệ có nguồn gốc từ GDDR5 khi AMD đã cho chúng ta thấy nhiều lợi ích của HBM hơn một năm trước? Chúng ta chỉ có thể tưởng tượng rằng trong giai đoạn thiết kế của GP102, Nvidia không chắc chắn nguồn cung cấp HBM2 sẽ thay đổi như thế nào và thay vào đó, nó an toàn với hệ thống con dựa trên GDDR5X. GP100 vẫn là GPU duy nhất trong dòng sản phẩm của nó với HBM2.
GPUTitan X (GP102) GeForce GTX 1080 (GP104) Titan X (GM100) SMs CUDA Cores Base Clock GPU Boost Clock GFLOPs (Base Clock) Đơn vị kết cấu Tốc độ lấp đầy Texel Bộ nhớ Tốc độ dữ liệu Bộ nhớ Băng thông ROPs L2 Cache TDP Bóng bán dẫn Kích thước khuôn nút Quy trình
28
20
24
3584
2560
3072
1417 MHz
1607 MHz
1000 MHz
1531 MHz
1733 MHz
1075 MHz
10.157
8228
6144
224
160
192
342,9 GT / s
277,3 GT / s
192 GT / s
10 Gb / giây
10 Gb / giây
7 Gb / giây
480 GB / giây
320 GB / giây
336,5 GB / giây
96
64
96
3MB
2 MB
3MB
250W
180W
250W
12 tỷ
7,2 tỷ
8 tỷ
471 mm²
314 mm²
601 mm²
16nm
16nm
28nm
Thật thú vị khi Nvidia, dường như vào phút cuối, đã chọn cách xa Titan X khỏi gia đình GeForce của nó. Trang đích Titan X trên geforce.com gọi đây là card đồ họa tối ưu. Không phải là card đồ họa chơi game tối ưu. Đúng hơn, “The Ultimate. Giai đoạn = Stage.” Tất nhiên, do chúng tôi đang xử lý một GP104 kích thước lớn, Titan X sẽ chơi tốt.
Nhưng quyết định của công ty về việc tiết lộ Titan X tại một cuộc gặp gỡ AI do Stanford tổ chức cho thấy họ đang tập trung vào học sâu trong thời gian này. Cuối cùng, mặc dù tốc độ FP16 và FP64 chậm một cách đáng kinh ngạc trên GP104 (và theo phần mở rộng, trên GP102), cả hai bộ xử lý đều hỗ trợ INT8 ở tỷ lệ 4: 1, mang lại 40,6 TOPS ở tần số cơ bản của Titan X.