Nói xin chào với một GPU dựa trên Pascal mới
Hai tháng sau khi ra mắt, kiến trúc Pascal của Nvidia đang dần lấp đầy danh mục card đồ họa dành cho máy tính để bàn của công ty từ trên xuống dưới. Đầu tiên là GeForce GTX 1080, cung cấp hiệu suất cao hơn 30% + so với GeForce GTX 980 Ti với giá thấp hơn. Các nhà cung cấp trực tuyến vẫn không thể giữ chúng trong kho (Newegg không có bất kỳ sản phẩm nào trong văn bản này). Sau đó, chúng tôi được giới thiệu về GeForce GTX 1070, cũng vượt trội hơn 980 Ti với giá rẻ hơn hàng trăm đô la.
Bây giờ chúng tôi nhận được một bo mạch dựa trên Pascal thứ ba trong GeForce GTX 1060. Được công bố vào đầu tháng này, chúng tôi đã biết rằng các đối tác của Nvidia sẽ có các phiên bản bắt đầu từ $ 250. Việc triển khai Phiên bản Người sáng lập sẽ được bán với giá 300 đô la trên nvidia.com và trong các cửa hàng Best Buy, vì vậy đừng ngạc nhiên khi bạn không tìm thấy chúng ở những nơi khác trực tuyến.
GeForce GTX 1060 dựa trên một GPU hoàn toàn mới được gọi là GP106 có nhiều tính năng tương tự như GP104, nhưng trong một gói chính thống hơn. Tuy nhiên, đừng để thuật ngữ đó làm bạn nản lòng. 1060 có thể chỉ là một card 120W, nhưng Nvidia cho biết nó tốt cho tốc độ khung hình GeForce GTX 980. Hai năm trước, mức hiệu suất đó được bán với giá 550 đô la. Chắc chắn là chúng ta đã đi được một chặng đường dài.
Gặp gỡ GP106
Nvidia xây dựng GeForce GTX 1080 hàng đầu của mình bằng cách sử dụng bộ xử lý GP104 hoàn chỉnh với bốn Cụm xử lý đồ họa được bật. Điều này tạo ra một thẻ có 2560 lõi CUDA và 160 đơn vị kết cấu. GTX 1070 tập trung vào cùng một GPU với ba GPC được bật, thêm tối đa 1920 lõi và 120 đơn vị kết cấu.
GeForce GTX 1060 giảm tỷ lệ tương tự bằng cách sử dụng các khối kiến trúc giống nhau. Từ phạm vi ra mắt GeForce GTX 1080 của chúng tôi:
“Mỗi GPC bao gồm năm Cụm xử lý Chủ đề / Kết cấu và công cụ raster. Được chia nhỏ hơn nữa, TPC kết hợp một Bộ xử lý đa luồng và một công cụ PolyMorph. SM kết hợp 128 lõi CUDA chính xác đơn, dung lượng tệp đăng ký 256KB, 96KB bộ nhớ chia sẻ, 48KB bộ nhớ đệm L1 / texture và tám đơn vị texture. Trong khi đó, động cơ PolyMorph thế hệ thứ tư bao gồm một khối logic mới nằm ở cuối đường ống hình học và phía trước đơn vị raster để xử lý tính năng Đa chiếu đồng thời của Nvidia. ”
GPU
GeForce GTX 1060 (GP106)
GeForce GTX 980 (GM204)
Tin nhắn
10
16
Lõi CUDA
1280
2048
Đồng hồ cơ bản
1506 MHz
1126 MHz
Đồng hồ tăng cường GPU
1708 MHz
1216 MHz
GFLOPs (Đồng hồ cơ bản)
3855
4612
Đơn vị kết cấu
80
128
Tỷ lệ lấp đầy Texel
120,5 GT / s
144,1 GT / s
Tốc độ dữ liệu bộ nhớ
8 Gb / giây
7 Gb / giây
Băng thông bộ nhớ
192 GB / giây
224 GB / giây
ROP
48
64
Bộ nhớ đệm L2
1,5 MB
2 MB
TDP
120W
165W
Linh kiện bán dẫn
4,4 tỷ
5,2 tỷ
Kích thước chết
200 mm²
398 mm²
Nút xử lý
16 nm
28 nm
GP106 được trang bị hai GPC, vì vậy bạn có tổng cộng 1280 lõi CUDA và 80 đơn vị kết cấu. Con chip này được hưởng lợi từ cùng thời gian được tối ưu hóa cho phép Nvidia tăng tốc độ xung nhịp trên GP104, tạo điều kiện cho tần số cơ bản là 1506 MHz và xếp hạng GPU Boost điển hình là 1708 MHz.
Mặt sau của bộ xử lý cũng được cắt giảm. Sáu bộ điều khiển bộ nhớ 32-bit cung cấp một đường dẫn dữ liệu tổng hợp 192-bit. Giống như GP104 lớn hơn, mỗi bộ điều khiển được liên kết với tám ROP và 256KB của L2, thêm tối đa 48 ROP và 1,5MB bộ nhớ đệm. Nvidia thả 6GB 8 GT / s GDDR5 lên bảng, cung cấp thông lượng tối đa 192 GB / s. Mặc dù con số đó thấp hơn 224 GB / s của GTX 980, nhưng hãy nhớ rằng Pascal sử dụng các kỹ thuật không mất dữ liệu mới để tiết kiệm trong hệ thống con bộ nhớ, tăng băng thông có thể sử dụng một cách hiệu quả. Được điều chỉnh từ phạm vi phủ sóng GTX 1080 của chúng tôi, “[GP106 ]’s] nén màu delta cố gắng đạt được mức tiết kiệm 2: 1 và chế độ này được cải tiến một cách có chủ đích để có thể sử dụng thường xuyên hơn. Ngoài ra, còn có một chế độ 4: 1 mới bao gồm các trường hợp khi sự khác biệt trên mỗi pixel rất nhỏ và có thể nén vào ít dung lượng hơn. Cuối cùng,
Tất nhiên, GP106 được sản xuất bằng quy trình TSMC 16FF + giống như GP104. Trong khi GPU lớn hơn bao gồm 7,2 tỷ bóng bán dẫn trên khuôn 314 mm², Nvidia gói 4,4 tỷ bóng bán dẫn FinFET vào 200 mm² cho GP106. Bộ xử lý ít phức tạp hơn, cùng với ít bộ nhớ hơn trên PCA đơn giản hơn, dẫn đến TDP 120W.
Thứ nhất: Không có SLI cho Dòng Thượng lưu
Nhận thấy thiếu đầu nối SLI ở trên cùng? Nvidia đề xuất GeForce GTX 1070 hoặc 1080 cho các game thủ đang tìm kiếm hiệu suất cao hơn so với 1060 mang lại (tất nhiên) và không hỗ trợ SLI trên 1060. Về mặt thế hệ, đây là bo mạch cao cấp nhất mà chúng tôi có thể thu hồi nếu không có công nghệ. Chắc chắn, GeForce GTX 750 Ti không có nhưng 760 thì có. GeForce GTX 950 cũng vậy.
Chính thức, Nvidia đưa ra quyết định. Không có nhiều game thủ ghép nối các GPU chính và công ty không muốn phân bổ tài nguyên mỏng, vì vậy họ đang tập trung vào việc tối ưu hóa SLI trên các thẻ dựa trên Pascal nhanh hơn. Tuy nhiên, ngoài lời giải thích đó, sự phát triển trò chơi đang đi theo một hướng khác với các hiệu ứng xử lý hậu kỳ và máy tính hướng tới không thân thiện với kết xuất khung hình thay thế. Và với DirectX 12, nhiều quyền kiểm soát hơn được chuyển sang các ISV mong muốn đưa nội dung của họ ra ngoài nhanh nhất có thể. Điều đó có nghĩa là phần lớn công việc mà Nvidia đổ vào các trình điều khiển của nó đã bị phá vỡ.
Chúng tôi có một trò chơi trong bộ phần mềm của mình hỗ trợ nhiều GPU thông qua DirectX 12: Ashes of the Singularity. Sau khi thêm GeForce GTX 1060 thứ hai và nhấp vào một hộp kiểm, chúng tôi thấy tốc độ tăng nhanh như sau:
Mặc dù đó không phải là loại tỷ lệ mà chúng ta thường thấy từ SLI, nhưng ~ 50% không phải là xấu. Thật không may, chúng tôi thậm chí không thể thử nghiệm với các trò chơi DirectX 11 và các tiêu đề DX12 mà không hỗ trợ nhiều bộ điều hợp được tích hợp sẵn.
Cho rằng đây là một thẻ tập trung 1080p, Nvidia có thể kích hoạt SLI trở lại PCI Express thông qua bản cập nhật trình điều khiển và chúng tôi hy vọng nó sẽ làm được điều đó. Bất chấp việc ít game thủ có thể quan tâm đến việc ghép nối các thẻ GTX 1060, vẫn có rất nhiều tựa game DX11 được hưởng lợi từ cấu hình GPU đột biến. Và bất kỳ vấn đề nào mà GP106 đã vượt qua các vấn đề về tỷ lệ do DX12 đặt ra cũng áp dụng cho các thẻ dựa trên GP104. Hãy để các tiêu chuẩn hiệu suất xác định mức độ hấp dẫn của SLI’ed 1060s có hấp dẫn hay không, chúng tôi nói.
Cái nhìn kỹ hơn về phiên bản dành cho người sáng lập GeForce GTX 1060
Nvidia tiếp tục với thiết kế phiên bản Founders Edition 10-series sắc sảo hơn, mặc dù GTX 1060 có cách triển khai có lẽ ít tốn kém hơn so với 1070 và 1080.
Tuy nhiên, điều đó không có nghĩa là thẻ mới nhỏ. Nó dài 25,4 cm (tính từ nắp khe cắm đến cuối thẻ), cao 10,7 cm (tính từ đầu khe cắm bo mạch chủ đến đầu thẻ) và sâu 3,8 cm. Trên thực tế, độ sâu của thẻ chỉ là 3,5 cm, nhưng nắp khe cắm của nó nhô ra 0,3 cm.
Với trọng lượng 845g, GeForce GTX 1060 Founders Edition cũng không đặc biệt nhẹ.
Thiết kế, Cảm nhận & Kết nối
Một lần nữa, Nvidia sử dụng hỗn hợp nhôm và nhựa để bọc thẻ. Tuy nhiên, nó đơn giản hơn một chút vào khoảng thời gian này. Vỏ, bao gồm cả quạt, có thể được tháo rời thành một mảnh. Ở phía trên, chúng tôi tìm thấy logo GeForce GTX được chiếu sáng, cùng với một đầu nối nguồn sáu chân.
Mặt sau của GeForce GTX 1060 có một chút khác biệt so với các thiết kế trước đó. Các card đồ họa có PCA ngắn thường có cửa hút không khí nơi bộ làm mát nhô ra ngoài bo mạch, phục vụ cho quạt hướng tâm. Thay vào đó, 1060 có một nắp bình thường không có lỗ mở. Không nghi ngờ gì nữa, do lo ngại về chi phí, nên cũng không có tấm nền nào cả.
Mặt sau của thẻ cho chúng ta thấy một cảnh tượng quen thuộc.
Bảng điều khiển I / O được sao chép từ GeForce GTX 1080 và 1070 của Nvidia mà không có một thay đổi nào. Nó bị chi phối bởi ba đầu nối DisplayPort, tương thích với phiên bản 1.2. Tuy nhiên, công ty của họ cho chúng tôi biết rằng họ cũng đã sẵn sàng cho phiên bản 1.3 và 1.4, phù hợp với bộ điều khiển hiển thị của GPU. Ngoài ra, có một đầu nối HDMI 2.0 và một đầu nối DVI liên kết kép; không có đầu ra tương tự.
Thiết kế Cooler, Bo mạch & Nguồn điện
Hướng sự chú ý vào bên trong, chúng tôi tháo tấm che để lộ giải pháp làm mát của GeForce GTX 1060.
Lên trên, chúng tôi ngay lập tức nhận thấy vị trí lạ của đầu nối nguồn. Nó nằm trong một phần của bộ làm mát nhô ra ngoài PCA thực tế. Điều này đòi hỏi một số dây cáp để gắn vào bảng.
Việc triển khai là bất cứ điều gì ngoại trừ thanh lịch và nó ngăn cản các đối tác của Nvidia xây dựng những chiếc 1060 ngắn hơn. Mặc dù thẻ chỉ dài 17,5cm nhưng nó không có bất kỳ khoảng trống nào để chứa đầu nối nguồn.
Tháo bốn con vít đang giữ chặt phần thân của bộ làm mát và nó sẽ ra ngay. Có một tản nhiệt lớn bằng đồng và khung kim loại bên dưới. Thiết kế vây làm mát khép kín khiến chúng ta liên tưởng đến GeForce GTX 1070 và nó sẽ cung cấp hiệu suất dồi dào với TDP 120W của 1060.
Khung duy trì và làm mát lớn phục vụ nhiệm vụ kép bằng cách giữ mọi thứ ở đúng vị trí và làm mát mạch điều chỉnh điện áp / mô-đun bộ nhớ.
Khi khung được mở ra và tháo ra, nó cần được lật lên và lật lại. Điều này là do các cáp kết nối đầu nối nguồn PCIe riêng biệt, được hàn cố định vào bo mạch. Làm điều này cho thấy PCA trần trong tất cả các vinh quang của nó.
Như thường lệ, GPU nằm ở phía trước và trung tâm. GP106 đương nhiên nhỏ hơn một chút so với GPU GP104 mà chúng tôi tìm thấy trên GeForce GTX 1080 và 1070 của Nvidia. Tuy nhiên, sự khác biệt giữa các bo mạch không dừng lại ở đó.
Lấy mô-đun bộ nhớ làm ví dụ. Chỉ có sáu trong số các vị trí của 1060 được trang bị Samsung K4G80325FB-HC25 GDDR5. Chúng có dung lượng 8Gb (32 x 256Mb) mỗi chiếc và chạy ở bất kỳ đâu từ 1.305V đến 1.597V, tùy thuộc vào tốc độ xung nhịp. Tất cả đã nói, đây là nơi chúng tôi nhận được thông số kỹ thuật 6GB của 1060.
Thật không may, bộ điều khiển PWM không được ghi lại. Nó được sản xuất bởi uPI Semiconductor và mang số model uP9509, có nghĩa là nó có thể là người anh em nhỏ hơn của uP9511P (bộ điều khiển thứ hai là những gì chúng tôi tìm thấy được ghép nối với bộ xử lý GP104).
Các mô-đun bộ nhớ và một trong các giai đoạn của GPU nhận sức mạnh của chúng thông qua khe cắm PCIe của bo mạch chủ. Hai pha GPU còn lại và các phụ kiện của thẻ lấy điện từ đầu nối nguồn sáu chân. Chúng ta sẽ xem xét kỹ hơn điều này có nghĩa là gì về mặt phân bổ tải trên các đường ray ở trang tiếp theo.
Khi nói đến điều chỉnh điện áp, Nvidia chỉ sử dụng một MOSFET kênh N Kép, E6930, mỗi pha cho cả phía cao và thấp; trình điều khiển cổng riêng biệt không cần thiết. Thành phần tích hợp cao này giải thích các không gian trống trên bảng.
Ba pha của GPU là hoàn toàn đủ và sự phân bố của chúng ở đây có ý nghĩa hơn so với Radeon RX 480 của AMD.
Ngoài đầu nối nguồn sáu chân, dường như đã đi nhầm chỗ nào đó, GeForce GTX 1060 tham chiếu của Nvidia thực sự trông khá tốt. Và với lượng nhiệt thải tương đối thấp, quạt hướng trục của nó cũng không phải là một lựa chọn tồi.