Nasz werdykt
Chociaż GeForce GTX 1660 Ti kosztuje więcej niż 1060 6 GB, który zastępuje, najnowsza karta Nvidia oparta na architekturze Turing zapewnia wydajność zbliżoną do GeForce GTX 1070. Wysoka wydajność, rozsądna cena i skromne zużycie energii łączą się w solidnej karcie graficznej z wyższej półki. .
Do
Świetna wydajność przy 1920 x 1080
Dopuszczalna liczba klatek na sekundę przy 2560 x 1440
Zachowuje funkcje przyspieszenia kodowania/dekodowania wideo Turinga
Moc płyty 120 W wypada korzystnie w porównaniu z konkurencją AMD
Przeciwko
Brak rdzeni RT/Tensor oznacza, że nie będziesz mógł wypróbować ray tracingu ani DLSS
Turing bez RTX
Aktualizacja z 21.11.2019: Od czasu premiery GTX 1660 Ti w lutym 2019 r. krajobraz GPU zmienił się radykalnie, wprowadzając szereg kart „super” opartych na tej samej architekturze Turing, ale zapewniających wyższą wydajność i niższe ceny niż początkowy skład firmy Turing. Najważniejszy dla potencjalnych nabywców GTX 1660 Ti jest GeForce GTX 1660 Super, który zapewnia podobną wydajność do 1660 Ti, przy niższej cenie początkowej 229 USD. W chwili obecnej jest to około 30 USD mniej niż najtańszy GTX 1660 Ti.
Nvidia GeForce GTX 1660 Ti jest zbudowana na TU116 — całkowicie nowym procesorze graficznym, który zawiera ulepszone moduły cieniujące Turing, zunifikowaną architekturę pamięci podręcznej, obsługę cieniowania adaptacyjnego oraz pełen zestaw funkcji przyspieszania kodowania/dekodowania wideo. GPU jest sparowany z pamięcią GDDR6, podobnie jak modele wyższej klasy z serii GeForce RTX 20. Ale to nie jest wystarczająco szybkie, aby uzasadnić przyczepianie rdzeni RT do przyspieszonego ray tracingu lub rdzeni Tensor do wnioskowania w grach. W rezultacie TU116 jest szczuplejszym chipem z listą specyfikacji, która podkreśla dzisiejsze najlepsze tytuły.
Nvidia twierdzi, że GeForce GTX 1660 Ti zacznie się od 280 dolarów i całkowicie zastąpi GeForce GTX 1060 6 GB. Chociaż ta cena podstawowa jest o 30 USD (lub 12 procent) wyższa niż w przypadku, gdy w 2016 r. rozpoczął swoją podróż oparty na Pascalu 1060 6 GB, firma twierdzi, że GeForce GTX 1660 Ti jest do 1,5 raza szybszy — i przy tej samej mocy znamionowej płyty 120 W, nie mniej.
Poprawiona wydajność za dolara nie jest czymś, co do tej pory widzieliśmy w pokoleniu Turinga. Czy Nvidia może to zmienić dzięki procesorowi graficznemu zaprojektowanemu specjalnie pod kątem wydajności w rozdzielczości 1920 x 1080?
Poznaj TU116: Turing Sans RT i rdzenie tensorowe
Widzieliśmy, jak Nvidia uruchamia cztery oddzielne procesory graficzne, eskortując nas w dół hierarchii Turinga. Z każdym z nich firma usuwa zasoby, aby uzyskać niższe punkty cenowe. Ale wiemy, że stara się zachować równowagę po drodze, minimalizując wąskie gardła, które niepotrzebnie pozbawiałyby procesory niższej klasy ich maksymalnej wydajności.
GeForce RTX 2060 jest wyposażony w 44 procent rdzeni CUDA i jednostek teksturujących 2080 Ti, 54 procent jego ROP i przepustowości pamięci oraz 50 procent pamięci podręcznej L2. Przed premierą 2060 podejrzewaliśmy, że luksusy, takie jak rdzenie RT i Tensor, nie będą już miały sensu na tych poziomach. Jednak seria poprawek do Battlefield V — jedynej dostępnej w tamtym czasie gry obsługującej ray tracing — umożliwiła duży wzrost wydajności, udowadniając, że charakterystyczne funkcje Turinga można nadal wykorzystywać przy grywalnej liczbie klatek na sekundę.
Okazuje się, że przesunęliśmy się o jeden poziom. Nvidia uważa TU116 za granicę, na której moc cieniowania spada na tyle nisko, by uniemożliwić przyszłościowe możliwości Turinga, by służyły wielu celom. Po usunięciu rdzeni RT i Tensor pozostaje nam chip o powierzchni 284 mm² złożony z 6,6 miliarda tranzystorów wyprodukowanych w 12-nanometrowym procesie FinFET firmy TSMC. Ale pomimo mniejszych tranzystorów, TU116 jest nadal o 42 procent większy niż procesor GP106, który go poprzedzał.
Część wzrostu można przypisać bardziej wyrafinowanym shaderom Turinga. Podobnie jak wyższej klasy karty GeForce RTX z serii 20, GeForce GTX 1660 Ti obsługuje jednoczesne wykonywanie instrukcji arytmetycznych FP32, które stanowią większość obciążeń shaderów, oraz operacji INT32 (adresowanie/pobieranie danych, zmiennoprzecinkowe min/maks, porównanie itp. .). Kiedy słyszysz o rdzeniach Turinga osiągających lepszą wydajność niż Pascal przy danej częstotliwości taktowania, ta możliwość w dużej mierze wyjaśnia dlaczego.
Multiprocesory strumieniowe Turinga składają się z mniejszej liczby rdzeni CUDA niż Pascal, ale konstrukcja kompensuje to częściowo poprzez rozłożenie większej liczby modułów SM na każdym GPU. Nowsza architektura przypisuje jeden program planujący do każdego zestawu 16 rdzeni CUDA (2x Pascal) wraz z jedną jednostką wysyłkową na 16 rdzeni CUDA (tak samo jak Pascal). Cztery z tych 16-rdzeniowych grup obejmują moduł SM wraz z 96 KB pamięci podręcznej, którą można skonfigurować jako 64 KB pamięci współdzielonej L1/32 KB lub odwrotnie, oraz cztery jednostki tekstur. Ponieważ Turing podwaja się w harmonogramach, wystarczy, że co drugi cykl zegara wyda instrukcje do rdzeni CUDA, aby utrzymać je w całości. W międzyczasie można bezpłatnie wydać inną instrukcję dowolnej innej jednostce, w tym rdzeniom INT32.
Konkretnie w przypadku TU116, Nvidia twierdzi, że zastępuje rdzenie Tensor firmy Turing 128 dedykowanymi rdzeniami FP16 na SM, co pozwala GeForce GTX 1660 Ti przetwarzać operacje o połowicznej precyzji z dwukrotnie większą szybkością niż w przypadku FP32. Inne procesory graficzne oparte na architekturze Turing również mogą pochwalić się podwójną szybkością FP16, więc nie jest jasne, w jaki sposób GeForce GTX 1660 Ti jest wyjątkowy w swojej rodzinie. Bardziej oczywiste, na podstawie poniższego wykresu, jest to, że 1660 Ti zapewnia ogromną poprawę przepustowości z połowiczną precyzją w porównaniu z GeForce GTX 1060 i jego układem GP106 opartym na Pascalu.
Ale kiedy uruchomimy moduł analizy naukowej Sandry, który testuje ogólne mnożenia macierzy, widzimy, o ile większą przepustowość osiągają rdzenie Tensor w TU106 w porównaniu z TU116. GeForce GTX 1060, który tylko symbolicznie wspierał FP16, w ogóle ledwo rejestruje się na wykresie.
Oprócz shaderów architektury Turing i ujednoliconej pamięci podręcznej, TU116 obsługuje również parę algorytmów o nazwie Content Adaptive Shading i Motion Adaptive Shading, określanych łącznie jako cieniowanie o zmiennej szybkości. Omówiliśmy tę technologię w eksplorowanej architekturze Turing firmy Nvidia: Wewnątrz GeForce RTX 2080. Ta historia przedstawiła również możliwości przyspieszonego kodowania i dekodowania wideo Turinga, które przeniesiono również na GeForce GTX 1660 Ti.
Kładąc wszystko razem…
Nvidia pakuje 24 moduły SM do TU116, dzieląc je między trzy klastry przetwarzania grafiki. Przy 64 rdzeniach FP32 na SM, to 1536 rdzeni CUDA i 96 jednostek tekstur na całym GPU. Partnerzy na płycie z pewnością postawią na taki zakres częstotliwości, aby wypełnić lukę między GTX 1660 Ti a RTX 2060. Jednak oficjalna bazowa częstotliwość taktowania wynosi 1500 MHz przy specyfikacji GPU Boost wynoszącej 1770 MHz. Nasza próbka EVGA GeForce GTX 1660 Ti XC Black Gaming osiągnęła szczyt około 1845 MHz w trzech cyklach Metro: Last Light, podczas gdy inne karty, które widzieliśmy, z łatwością przekraczały 2000 MHz. Na papierze GeForce GTX 1660 Ti oferuje do 5,4 TFLOPS wydajności FP32 i 10,9 TFLOPS przepustowości FP16.
Sześć 32-bitowych kontrolerów pamięci zapewnia TU116 zagregowaną 192-bitową magistralę, która jest obsługiwana przez moduły GDDR6 12 Gb/s (Micron MT61K256M32JE-12:A), które zapewniają prędkość do 288 GB/s. To o 50% większa przepustowość pamięci niż w przypadku GeForce GTX 1060, co pomaga GeForce GTX 1660 Ti utrzymać przewagę wydajności na poziomie 2560 x 1440 z włączonym antyaliasingiem.
Każdy kontroler pamięci jest powiązany z ośmioma ROP i 256 KB wycinkiem pamięci podręcznej L2. W sumie TU116 udostępnia 48 ROP i 1,5 MB L2. Liczba ROP GeForce GTX 1660 Ti wypada korzystnie w porównaniu z RTX 2060, który również wykorzystuje 48 wyjść renderowania. Ale jego wycinki pamięci podręcznej L2 są o połowę mniejsze.
Pomimo większej matrycy, o 50% większej liczby tranzystorów i bardziej agresywnego taktowania GPU Boost, GeForce GTX 1660 Ti ma taką samą moc 120W jak GeForce GTX 1060. Niestety żadna z kart graficznych nie obsługuje wielu GPU. Nvidia kontynuuje narrację, że SLI ma zapewniać wyższą wydajność bezwzględną, a nie dawać graczom możliwość dopasowania konfiguracji z jednym GPU.
EVGA GeForce GTX 1660 Ti XC Czarny GamingGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FE Architektura (GPU) Rdzenie CUDA Szczytowe rdzenie tensorowe FP32 Rdzenie RT Jednostki tekstury Bazowa częstotliwość taktowania GPU Szybkość doładowania Pojemność pamięci Magistrala pamięci Przepustowość pamięci ROP Pamięć podręczna L2 TDP Liczba tranzystorów Obsługa formatu matrycy SLI
Turinga (TU116)
Turinga (TU106)
Paskal (GP106)
Paskal (GP104)
1536
1920
1280
1920
5.4 TFLOPS
6.45 TLFOPS
4.4 TFLOPS
6,5 TFLOPS
Nie dotyczy
240
Nie dotyczy
Nie dotyczy
Nie dotyczy
30
Nie dotyczy
Nie dotyczy
96
120
80
120
1500 MHz
1365 MHz
1506 MHz
1506 MHz
1770 MHz
1680 MHz
1708 MHz
1683 MHz
6 GB pamięci GDDR6
6 GB pamięci GDDR6
6 GB pamięci GDDR5
8 GB pamięci GDDR5
192-bitowy
192-bitowy
192-bitowy
256-bitowy
288 GB/s
336 GB/s
192 GB/s
256 GB/s
48
48
48
64
1,5 MB
3MB
1,5 MB
2MB
120W
160W
120W
150W
6,6 miliarda
10,8 miliarda
4,4 miliarda
7,2 miliarda
284 mm²
445 mm²
200 mm²
314 mm²
Nie
Nie
Nie
Tak (MIO)
GeForce GTX 1660 Ti XC Black Gaming firmy EVGA
GeForce GTX 1060 Founders Edition również była kartą o mocy 120 W i przebiła się z jednym sześciopinowym złączem pomocniczym. Z drugiej strony, GeForce GTX 1660 Ti XC Black Gaming firmy EVGA wykorzystuje ośmiopinowe wejście, co daje mu sporo dodatkowego zapasu. Jak zobaczymy w naszych testach mocy na szynę, karta pobiera 3 A prądu przez gniazdo PCIe podczas naszego testu warunków skrajnych — reszta pochodzi z ośmiopinowego złącza.
EVGA wykorzystuje cztery fazy zasilania dla TU116. Fazy GPU są kontrolowane przez starszy ON Semiconductor NCP81276 z tyłu PCB, który jest podłączony do kwartetu ON Semiconductor NCP302155.
Te cztery komponenty integrują tranzystory MOSFET o wysokiej i niskiej stronie, sterownik i diodę ładowania początkowego. Są to te same części, które zastosowano w GeForce RTX 2070 Founders Edition, zdolne do średnich prądów do 55A.
Znany z Ubiq Semiconductor dwufazowy układ uP1666Q steruje obwodami regulacji napięcia pamięci za pomocą dwóch dwukanałowych tranzystorów MOSFET QM3816N6.
Bardziej interesujący niż dość prosty zasilacz GeForce GTX 1660 Ti XC Black Gaming, być może, jest fakt, że PCB EVGA ma wolne pady dla dodatkowych dwóch faz GPU. Jest też para miejsc na dwa kolejne moduły pamięci GDDR6. Nvidia zrobiła coś podobnego z GeForce GTX 1060, pozostawiając kilka pustych miejsc na swojej karcie Founders Edition, które nigdy nie zostały zapełnione. Jest to środek oszczędzający czas i koszty, który pozwala firmie na używanie jednej płytki drukowanej do wielu produktów.
Na górze płytki drukowanej znajduje się metalowa płytka, która umieszcza podkładki termiczne między zintegrowanymi sterownikami/MOSFETami, modułami pamięci GDDR6 i rezystorem czujnika prądu. Więcej podkładek termicznych na górze płyty utrzymuje przepływ ciepła do głównego zespołu radiatora, który jest zamontowany wokół GPU w czterech punktach i przykręcony przez tylną stronę PCB.
Samo rozwiązanie termiczne składa się z dość cienkiej miedzianej podkładki, która ma bezpośredni kontakt z TU116. Do jego górnej części przylutowane są trzy spłaszczone rurki, a do rurek cieplnych z kolei przylutowany jest szereg aluminiowych żeberek. Stosunkowo gruby stos żeber jest wyolbrzymiony przez osłonę, w której mieści się pojedynczy wentylator 85 mm i dodaje jeszcze większej głębi. Podsumowując, GeForce GTX 1660 Ti XC Black Gaming firmy EVGA pochłania trzy gniazda rozszerzeń na Twojej płycie głównej.
EVGA kończy wymianę grubości na długość. GeForce GTX 1660 Ti XC Black Gaming może mieć 2 cale głębokości, ale ma tylko około 7,5 cala (~190 mm) długości i 4 ⅜” (111 mm) wysokości. Co więcej, w porównaniu do masywnych kart Founders Edition, które testowaliśmy, łączna waga to 1 funt i 7 uncji. (656g) jest wręcz lekki.
Z przodu, GeForce GTX 1660 Ti XC Black Gaming ma jedno złącze dual-link DVI, port HDMI i interfejs DisplayPort. Złącze VirtualLink oparte na USB Type-C, które do tej pory można znaleźć na każdej innej karcie klasy Turing, zniknęło, co oznacza, że schodzimy do poziomu wydajności, który nie sprzyja płynnej rozgrywce VR (nawet w najlepszych zestawach VR). Partnerzy forum, którzy zdecydują się dodać VirtualLink do swoich projektów, mogą to zrobić za darmo; EVGA po prostu nie zaimplementowała tego w tym modelu.
Jak przetestowaliśmy GeForce GTX 1660 Ti XC Black Gaming firmy EVGA
Oczywiście, GeForce GTX 1660 Ti jest bardziej popularny niż inne testowane przez nas karty oparte na architekturze Turing. W związku z tym nasza graficzna stacja robocza, oparta na płycie głównej MSI Z170 Gaming M7 i procesorze Intel Core i7-7700K z częstotliwością 4,2 GHz, jest dobrym wyborem. Procesor uzupełnia zestaw pamięci F4-3000C15Q-16GRR firmy G.Skill. Dysk SSD MX200 firmy Crucial jest tutaj, do którego dołączył dysk Intel DC P3700 o pojemności 1,6 TB wypełniony grami.
Jeśli chodzi o konkurencję, 1660 Ti w większości konkuruje z GeForce GTX 1070, chociaż uwzględniamy również 1070 Ti. Oczywiście porównania do GeForce GTX 1060 są nieuniknione. Wszystkie te karty znajdują się w naszej ofercie, wraz z GeForce RTX 2060 i GeForce RTX 2070. Po stronie AMD najbardziej interesuje nas Radeon RX 590, chociaż Radeon RX Vega 64 i Radeon RX Vega 56 są interesujące. dodatki też.
Nasz wybór benchmarków obejmuje Ashes of the Singularity: Escalation, Battlefield V, Destiny 2, Far Cry 5, Forza Horizon 4, Grand Theft Auto V, Metro: Last Light Redux, Shadow of the Tomb Raider, Tom Clancy’s The Division, Tom Clancy’s Ghost Recon Wildlands, Wiedźmin 3 i Wolfenstein II: The New Colossus.
Metodologia testowania, której używamy, pochodzi z PresentMon: Wydajność w DirectX, OpenGL i Vulkan. Krótko mówiąc, te gry są oceniane przy użyciu kombinacji OCAT i naszego własnego GUI dla PresentMon, z logowaniem przez GPU-Z.
Używamy sterownika w wersji 418.91 do testowania GeForce GTX 1660 Ti i kompilacji 417.54 dla wszystkich innych elementów. Karty AMD wykorzystują Crimson Adrenalin 2019 Edition 18.12.3.