Chuyển tới nội dung

Đánh giá Nvidia GeForce GTX 1660 Ti 6GB: Turing Without RTX

    1649727002

    Nhận định của chúng tôi

    Mặc dù GeForce GTX 1660 Ti đắt hơn 1060 6GB mà nó thay thế, nhưng bo mạch dựa trên Turing mới nhất của Nvidia mang lại hiệu suất tương tự như GeForce GTX 1070. Hiệu năng cao, mức giá hợp lý và mức tiêu thụ điện năng khiêm tốn kết hợp với nhau trong một card đồ họa phổ thông cao cấp. .

    Hiệu suất tuyệt vời ở 1920 x 1080
    Tỷ lệ khung hình chấp nhận được ở 2560 x 1440
    Giữ lại các tính năng tăng tốc mã hóa / giải mã video của Turing
    Công suất bo mạch 120W so sánh thuận lợi với đối thủ cạnh tranh của AMD

    Chống lại

    Không có lõi RT / Tensor có nghĩa là bạn sẽ không thể thử dò tia hoặc DLSS

    Turing mà không cần RTX

    Cập nhật ngày 21/11/2019: Kể từ khi ra mắt GTX 1660 Ti vào tháng 2 năm 2019, bối cảnh GPU đã thay đổi đáng kể, với một loạt các thẻ “Siêu” dựa trên cùng một kiến ​​trúc Turing, nhưng đẩy cả hiệu suất cao hơn và giá thấp hơn dòng sản phẩm Turing ban đầu của công ty. Phù hợp nhất với những người mua tiềm năng của GTX 1660 Ti là GeForce GTX 1660 Super, mang lại hiệu suất tương tự như 1660 Ti, với mức giá khởi điểm thấp hơn là 229 đô la. Tại thời điểm này, con số này thấp hơn khoảng 30 đô la so với GTX 1660 Ti giá thấp nhất.

    Nvidia GeForce GTX 1660 Ti được xây dựng trên TU116 — một bộ xử lý đồ họa hoàn toàn mới kết hợp các trình tạo bóng được cải tiến của Turing, kiến ​​trúc bộ nhớ đệm thống nhất, hỗ trợ đổ bóng thích ứng và bổ sung đầy đủ các tính năng tăng tốc mã hóa / giải mã video. GPU được ghép nối với bộ nhớ GDDR6, giống như các mẫu GeForce RTX 20-series cao cấp hơn. Nhưng nó không đủ nhanh để biện minh cho việc trang bị lõi RT để theo dõi tia tăng tốc hoặc lõi Tensor để truyền thông tin trong trò chơi. Do đó, TU116 là một con chip gọn gàng hơn với danh sách các thông số kỹ thuật nhấn mạnh các tựa game hàng đầu hiện nay.

    Nvidia nói rằng GeForce GTX 1660 Ti sẽ bắt đầu từ $ 280 và thay thế hoàn toàn GeForce GTX 1060 6GB. Mặc dù giá cơ bản đó cao hơn 30 đô la (hoặc 12 phần trăm) so với mức 1060 6GB dựa trên Pascal bắt đầu hành trình trở lại vào năm 2016, công ty tuyên bố GeForce GTX 1660 Ti nhanh hơn tới 1,5 lần — và ở cùng mức công suất bảng 120W, không ít.

    Cải thiện hiệu suất trên mỗi đô la không phải là điều mà chúng tôi đã thấy nhiều từ thế hệ Turing cho đến nay. Nvidia có thể xoay chuyển điều đó với một GPU được xây dựng có mục đích hơn cho hiệu suất ở 1920 x 1080 không?

    Làm quen với TU116: Turing Sans RT và Tensor Cores

    Chúng tôi đã thấy Nvidia ra mắt bốn GPU riêng biệt khi nó hộ tống chúng tôi xuống hệ thống phân cấp Turing. Với mỗi, công ty bóc tách các nguồn lực để nhắm đến các mức giá thấp hơn. Nhưng chúng tôi biết rằng họ đang cố gắng duy trì sự cân bằng trong suốt quá trình, giảm thiểu các nút thắt cổ chai không cần thiết khiến các bộ vi xử lý cấp thấp hơn mất đi hiệu suất cao nhất của chúng.

    GeForce RTX 2060 được trang bị 44 phần trăm số lõi và đơn vị kết cấu CUDA của 2080 Ti, 54 phần trăm ROP và băng thông bộ nhớ và 50 phần trăm bộ nhớ đệm L2. Trước khi ra mắt năm 2060, chúng tôi đã nghi ngờ rằng những thứ xa xỉ như lõi RT và Tensor sẽ không còn có ý nghĩa ở những cấp độ đó nữa. Nhưng một loạt các bản vá cho Battlefield V – trò chơi hỗ trợ truy tìm tia một lần có sẵn vào thời điểm đó – đã cho phép tăng hiệu suất lớn, chứng minh rằng các tính năng đặc trưng của Turing vẫn có thể được sử dụng ở tốc độ khung hình có thể chơi được.

    Hóa ra chúng tôi đã đi lệch một bậc. Nvidia coi TU116 là ranh giới nơi mã lực đổ bóng giảm xuống đủ thấp để ngăn các khả năng tương lai của Turing phục vụ nhiều mục đích. Sau khi loại bỏ các lõi RT và Tensor, chúng ta còn lại một con chip 284mm² bao gồm 6,6 tỷ bóng bán dẫn được sản xuất bằng quy trình FinFET 12nm của TSMC. Nhưng mặc dù có các bóng bán dẫn nhỏ hơn, TU116 vẫn lớn hơn 42% so với bộ xử lý GP106 trước đó.

    Một số sự phát triển là do các trình tạo bóng phức tạp hơn của Turing. Giống như các thẻ GeForce RTX 20-series cao cấp hơn, GeForce GTX 1660 Ti hỗ trợ thực thi đồng thời các lệnh số học FP32, tạo thành hầu hết các khối lượng công việc đổ bóng và các hoạt động INT32 (để định địa chỉ / tìm nạp dữ liệu, dấu phẩy động min / max, so sánh, v.v. .). Khi bạn nghe về việc lõi Turing đạt được hiệu suất tốt hơn Pascal ở một tốc độ xung nhịp nhất định, khả năng này phần lớn giải thích tại sao.

    Các bộ xử lý phát trực tuyến của Turing bao gồm ít lõi CUDA hơn so với Pascal, nhưng thiết kế bù đắp một phần bằng cách trải rộng nhiều SM hơn trên mỗi GPU. Kiến trúc mới hơn chỉ định một bộ lập lịch cho mỗi bộ 16 lõi CUDA (2x Pascal), cùng với một đơn vị điều phối trên 16 lõi CUDA (giống như Pascal). Bốn trong số các nhóm 16 lõi đó bao gồm SM, cùng với 96KB bộ nhớ đệm có thể được định cấu hình thành bộ nhớ chia sẻ 64KB L1 / 32KB hoặc ngược lại và bốn đơn vị kết cấu. Bởi vì Turing tăng gấp đôi theo lịch trình, nó chỉ cần đưa ra lệnh cho các lõi CUDA sau mỗi chu kỳ xung nhịp khác để giữ cho chúng luôn đầy. Ở giữa, bạn có thể tự do đưa ra một hướng dẫn khác cho bất kỳ đơn vị nào khác, bao gồm cả các lõi INT32.

    Cụ thể là trong TU116, Nvidia cho biết họ thay thế các lõi Tensor của Turing bằng 128 lõi FP16 chuyên dụng cho mỗi SM, cho phép GeForce GTX 1660 Ti xử lý các hoạt động nửa chính xác với tốc độ gấp 2 lần FP32. Tuy nhiên, các GPU dựa trên Turing khác cũng tự hào có FP16 tốc độ gấp đôi, vì vậy vẫn chưa rõ GeForce GTX 1660 Ti độc đáo như thế nào trong gia đình của nó. Rõ ràng hơn, dựa trên biểu đồ bên dưới, là 1660 Ti mang đến một cải tiến lớn về thông lượng chính xác một nửa so với GeForce GTX 1060 và chip GP106 dựa trên Pascal của nó.

    Nhưng khi chúng tôi chạy mô-đun Phân tích khoa học của Sandra, kiểm tra phép nhân ma trận chung, chúng tôi thấy các lõi Tensor của TU106 đạt được thông lượng FP16 nhiều hơn bao nhiêu so với TU116. GeForce GTX 1060, chỉ hỗ trợ FP16 một cách tượng trưng, ​​hầu như không đăng ký trên biểu đồ.

    Ngoài bộ đổ bóng và bộ đệm hợp nhất của kiến ​​trúc Turing, TU116 cũng hỗ trợ một cặp thuật toán được gọi là Tạo bóng thích ứng nội dung và Tạo bóng thích ứng chuyển động, được gọi chung là Tạo bóng tỷ lệ thay đổi. Chúng tôi đã đề cập đến công nghệ này trong Kiến trúc Turing của Nvidia đã khám phá: Bên trong GeForce RTX 2080. Câu chuyện đó cũng giới thiệu khả năng giải mã và mã hóa video tăng tốc của Turing, cũng được chuyển sang GeForce GTX 1660 Ti.

    Để tất cả chúng cùng nhau…

    Nvidia gói 24 SM vào TU116, chia chúng thành ba Cụm xử lý đồ họa. Với 64 lõi FP32 mỗi SM, đó là 1.536 lõi CUDA và 96 đơn vị kết cấu trên toàn bộ GPU. Các đối tác của bo mạch chắc chắn sẽ nhắm mục tiêu một dải tần số để lấp đầy khoảng cách giữa GTX 1660 Ti và RTX 2060. Tuy nhiên, tốc độ xung nhịp cơ bản chính thức là 1.500 MHz với thông số kỹ thuật GPU Boost là 1.770 MHz. Mẫu EVGA GeForce GTX 1660 Ti XC Black Gaming của chúng tôi đạt xung nhịp 1.845 MHz thông qua ba lần chạy Metro: Last Light, trong khi các thẻ khác mà chúng tôi đã thấy sẵn sàng vượt quá 2.000 MHz. Trên lý thuyết, GeForce GTX 1660 Ti cung cấp tới 5,4 TFLOPS hiệu suất FP32 và 10,9 TFLOPS cho thông lượng FP16.

    Sáu bộ điều khiển bộ nhớ 32 bit cung cấp cho TU116 một bus tổng hợp 192 bit, được cung cấp bởi các mô-đun GDDR6 12 Gb / s (Micron MT61K256M32JE-12: A) đẩy lên đến 288 GB / giây. Đó là băng thông bộ nhớ nhiều hơn 50% so với GeForce GTX 1060 nhận được, giúp GeForce GTX 1660 Ti duy trì lợi thế hiệu suất ở 2560 x 1440 với tính năng khử răng cưa được bật.

    Mỗi bộ điều khiển bộ nhớ được liên kết với tám ROP và một lát 256KB của bộ nhớ đệm L2. Tổng cộng, TU116 cho thấy 48 ROP và 1,5 MB L2. Số lượng ROP của GeForce GTX 1660 Ti so sánh thuận lợi với RTX 2060, cũng sử dụng 48 đầu ra kết xuất. Nhưng các lát bộ nhớ cache L2 của nó lớn bằng một nửa.

    Mặc dù có khuôn lớn hơn, số lượng bóng bán dẫn cao hơn 50% và tốc độ xung nhịp GPU Boost mạnh hơn, GeForce GTX 1660 Ti được đánh giá cho công suất 120W giống như GeForce GTX 1060. Thật không may, cả hai card đồ họa đều không hỗ trợ đa GPU. Nvidia tiếp tục tuyên bố rằng SLI nhằm mục đích thúc đẩy hiệu suất tuyệt đối cao hơn, thay vì cung cấp cho game thủ một cách để phù hợp với cấu hình GPU đơn.

    EVGA GeForce GTX 1660 Ti XC Black GamingGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FE Kiến trúc (GPU) CUDA Cores Peak FP32 Compute Tensor Cores RT Cores Texture Unit Tốc độ xung nhịp cơ bản GPU Boost Tốc độ bộ nhớ Dung lượng bộ nhớ Bus bộ nhớ Băng thông ROPs L2 Cache TDP Đếm bóng bán dẫn Hỗ trợ SLI kích thước khuôn

    Turing (TU116)
    Turing (TU106)
    Pascal (GP106)
    Pascal (GP104)

    1536
    1920
    1280
    1920

    5,4 TFLOPS
    6,45 TLFOPS
    4.4 TFLOPS
    6,5 TFLOPS

    N / A
    240
    N / A
    N / A

    N / A
    30
    N / A
    N / A

    96
    120
    80
    120

    1500 MHz
    1365 MHz
    1506 MHz
    1506 MHz

    1770 MHz
    1680 MHz
    1708 MHz
    1683 MHz

    6 GB GDDR6
    6 GB GDDR6
    6 GB GDDR5
    8GB GDDR5

    192-bit
    192-bit
    192-bit
    256-bit

    288 GB / giây
    336 GB / giây
    192 GB / giây
    256 GB / giây

    48
    48
    48
    64

    1,5 MB
    3MB
    1,5 MB
    2 MB

    120W
    160W
    120W
    150W

    6,6 tỷ
    10,8 tỷ
    4,4 tỷ
    7,2 tỷ

    284 mm²
    445 mm²
    200 mm²
    314 mm²

    Không
    Không
    Không
    Có (MIO)

    GeForce GTX 1660 Ti XC Black Gaming của EVGA

    GeForce GTX 1060 Founders Edition cũng là một card 120W và nó có một đầu nối phụ sáu chân. Mặt khác, GeForce GTX 1660 Ti XC Black Gaming của EVGA sử dụng đầu vào tám chân, mang lại cho nó một khoảng không gian rộng hơn. Như chúng ta sẽ thấy trong thử nghiệm nguồn trên mỗi thanh ray của chúng tôi, thẻ rút dòng điện 3A qua khe cắm PCIe của nó trong quá trình kiểm tra căng thẳng của chúng tôi — phần còn lại đến từ đầu nối tám chân của nó.

    EVGA sử dụng bốn pha nguồn cho TU116. Các pha của GPU được điều khiển bởi ON Semiconductor NCP81276 cũ hơn ở mặt sau của PCB, được gắn với một bộ tứ ON Semiconductor NCP302155s.

    Bốn thành phần đó tích hợp MOSFET bên cao và bên thấp, một trình điều khiển và diode bootstrap. Chúng là những bộ phận giống nhau được sử dụng trên GeForce RTX 2070 Founders Edition, có khả năng dòng điện trung bình lên đến 55A.

    UP1666Q pha kép quen thuộc của Ubiq Semiconductor điều khiển mạch điều chỉnh điện áp của bộ nhớ bằng hai MOSFET kênh N kép QM3816N6.

    Có lẽ, thú vị hơn so với nguồn cung cấp năng lượng khá đơn giản của GeForce GTX 1660 Ti XC Black Gaming là PCB của EVGA có các miếng đệm trống cho thêm hai pha GPU. Ngoài ra còn có một cặp vị trí cho thêm hai mô-đun bộ nhớ GDDR6. Nvidia đã làm điều gì đó tương tự với GeForce GTX 1060, để lại một vài chỗ trống trên thẻ Founders Edition của nó chưa bao giờ được điền. Đây là một biện pháp tiết kiệm thời gian và chi phí, cho phép công ty sử dụng một PCB cho nhiều sản phẩm.

    Một tấm kim loại nằm trên PCB, kẹp các miếng tản nhiệt giữa trình điều khiển / MOSFET tích hợp, mô-đun bộ nhớ GDDR6 và điện trở cảm nhận dòng điện. Nhiều miếng tản nhiệt hơn trên đầu tấm giữ nhiệt di chuyển vào cụm tản nhiệt chính, được gắn xung quanh GPU tại bốn điểm và được vặn vào qua mặt sau của PCB.

    Bản thân dung dịch tản nhiệt này bao gồm một miếng đồng khá mỏng tiếp xúc trực tiếp với TU116. Ba ống dẹt được hàn vào đầu của nó, và một loạt các cánh tản nhiệt bằng nhôm lần lượt được hàn vào các ống dẫn nhiệt. Một lớp vây tương đối dày được phóng đại bởi tấm che, nơi chứa một quạt 85mm duy nhất và tăng thêm chiều sâu hơn nữa. Tất cả đã nói, GeForce GTX 1660 Ti XC Black Gaming của EVGA tiêu thụ ba khe cắm mở rộng trên bo mạch chủ của bạn.

    EVGA kết thúc độ dày giao dịch theo chiều dài. GeForce GTX 1660 Ti XC Black Gaming có thể sâu 2 inch, nhưng nó chỉ dài khoảng 7,5 ”(~ 190mm) và cao 4 ⅜” (111mm). Hơn nữa, so với các thẻ Founders Edition mạnh mẽ mà chúng tôi đang xem xét, tổng trọng lượng là 1 lb. 7 oz. (656g) cảm thấy hết sức nhẹ nhàng.

    Ở phía trước, GeForce GTX 1660 Ti XC Black Gaming có một đầu nối DVI liên kết kép, một cổng HDMI và giao diện DisplayPort. Đầu nối VirtualLink dựa trên USB Type-C được thấy trên mọi thẻ loại Turing khác cho đến nay đã không còn nữa, một dấu hiệu cho thấy chúng ta đang giảm xuống mức hiệu suất không có kết quả của trò chơi VR mượt mà (ngay cả trên những bộ tai nghe VR tốt nhất). Các đối tác hội đồng quản trị chọn thêm VirtualLink vào thiết kế của họ được tự do làm như vậy; EVGA chỉ đơn giản là không thực hiện nó trên mô hình này.

    Cách chúng tôi kiểm tra GeForce GTX 1660 Ti XC Black Gaming của EVGA

    Rõ ràng, GeForce GTX 1660 Ti là chủ đạo hơn so với các bo mạch dựa trên Turing khác mà chúng tôi đã đánh giá. Do đó, máy trạm đồ họa của chúng tôi, dựa trên bo mạch chủ MSI Z170 Gaming M7 và CPU Intel Core i7-7700K ở tốc độ 4,2 GHz, là apropos. Bộ xử lý được bổ sung bởi bộ nhớ F4-3000C15Q-16GRR của G.Skill. SSD MX200 của Crucial có mặt ở đây, cùng với Intel DC P3700 1,6TB được tải xuống với các trò chơi.

    Về mặt cạnh tranh, 1660 Ti chủ yếu so với GeForce GTX 1070, mặc dù chúng tôi cũng bao gồm 1070 Ti. Tất nhiên, việc so sánh với GeForce GTX 1060 là không thể tránh khỏi. Tất cả những thẻ đó đều có trong dòng sản phẩm của chúng tôi, cùng với GeForce RTX 2060 và GeForce RTX 2070. Về phía AMD, chúng tôi chủ yếu quan tâm đến Radeon RX 590, mặc dù Radeon RX Vega 64 và Radeon RX Vega 56 tạo nên sự thú vị bổ sung, quá.

    Lựa chọn điểm chuẩn của chúng tôi bao gồm Ashes of the Singularity: Escalation, Battlefield V, Destiny 2, Far Cry 5, Forza Horizon 4, Grand Theft Auto V, Metro: Last Light Redux, Shadow of the Tomb Raider, Tom Clancy’s The Division, Tom Clancy’s Ghost Recon Wildlands, The Witcher 3 và Wolfenstein II: The New Colossus.

    Phương pháp thử nghiệm chúng tôi đang sử dụng đến từ PresentMon: Hiệu suất Trong DirectX, OpenGL và Vulkan. Tóm lại, các trò chơi này được đánh giá bằng cách sử dụng kết hợp OCAT và GUI nội bộ của chúng tôi cho PresentMon, với việc ghi nhật ký qua GPU-Z.

    Chúng tôi đang sử dụng phiên bản trình điều khiển 418.91 để kiểm tra GeForce GTX 1660 Ti và xây dựng 417.54 cho mọi thứ khác. Các thẻ của AMD sử dụng Crimson Adrenalin 2019 Edition 18.12.3.

    0 0 đánh giá
    Rating post
    Theo dõi
    Thông báo của
    guest
    0 comments
    Phản hồi nội tuyến
    Xem tất cả bình luận
    0
    Rất thích suy nghĩ của bạn, hãy bình luận.x