Unser Urteil
Obwohl die GeForce GTX 1660 Ti mehr kostet als die 1060 6 GB, die sie ersetzt, liefert Nvidias neuestes Turing-basiertes Board eine ähnliche Leistung wie die GeForce GTX 1070. Hohe Leistung, ein vernünftiger Preis und bescheidener Stromverbrauch vereinen sich in einer soliden Grafikkarte der oberen Mittelklasse .
Für
Hervorragende Leistung bei 1920 x 1080
Akzeptable Bildraten bei 2560 x 1440
Behält Turings Beschleunigungsfunktionen für die Videocodierung/-decodierung bei
Die 120-W-Platinenleistung ist im Vergleich zur AMD-Konkurrenz günstig
Gegen
Keine RT/Tensor-Kerne bedeuten, dass Sie Raytracing oder DLSS nicht ausprobieren können
Turing ohne RTX
Update vom 21.11.2019: Seit der Einführung der GTX 1660 Ti im Februar 2019 hat sich die GPU-Landschaft dramatisch verändert, mit einer Reihe von „Super“-Karten, die auf der gleichen Turing-Architektur basieren, aber sowohl eine höhere Leistung als auch niedrigere Preise erzielen die ursprüngliche Turing-Aufstellung des Unternehmens. Am relevantesten für potenzielle Käufer der GTX 1660 Ti ist die GeForce GTX 1660 Super, die eine ähnliche Leistung wie die 1660 Ti zu einem niedrigeren Startpreis von 229 US-Dollar bietet. Zum jetzigen Zeitpunkt sind das etwa 30 US-Dollar weniger als bei der günstigsten GTX 1660 Ti.
Nvidia GeForce GTX 1660 Ti basiert auf TU116 – einem brandneuen Grafikprozessor, der die verbesserten Shader von Turing, seine einheitliche Cache-Architektur, Unterstützung für adaptives Shading und eine vollständige Palette von Beschleunigungsfunktionen für die Videocodierung/-decodierung enthält. Die GPU ist mit GDDR6-Speicher gekoppelt, genau wie die High-End-Modelle der GeForce RTX 20-Serie. Aber es ist nicht schnell genug, um das Anhängen an RT-Kerne für beschleunigtes Raytracing oder Tensor-Kerne für Inferenzen in Spielen zu rechtfertigen. Infolgedessen ist TU116 ein schlankerer Chip mit einer Liste von Spezifikationen, die die heutigen Top-Titel hervorhebt.
Nvidia sagt, dass die GeForce GTX 1660 Ti bei 280 US-Dollar beginnen und die GeForce GTX 1060 6 GB vollständig ersetzen wird. Obwohl dieser Grundpreis 30 US-Dollar (oder 12 Prozent) höher ist als damals, als die Pascal-basierte 1060 6 GB ihre Reise im Jahr 2016 begann, behauptet das Unternehmen, dass die GeForce GTX 1660 Ti bis zu 1,5-mal schneller ist – und das bei gleicher Nennleistung von 120 W. nicht weniger.
Von einer verbesserten Leistung pro Dollar haben wir bisher nicht viel von der Turing-Generation gesehen. Kann Nvidia das mit einer GPU umkehren, die speziell für die Leistung bei 1920 x 1080 entwickelt wurde?
Treffen Sie TU116: Turing Sans RT und Tensor Cores
Wir haben gesehen, wie Nvidia vier separate GPUs auf den Markt gebracht hat, während es uns die Turing-Hierarchie nach unten eskortiert. Mit jedem zieht das Unternehmen Ressourcen ab, um niedrigere Preispunkte anzustreben. Aber wir wissen, dass es versucht, auf dem Weg das Gleichgewicht zu halten und die Engpässe zu minimieren, die Prozessoren der unteren Preisklasse unnötigerweise ihrer Spitzenleistung berauben würden.
GeForce RTX 2060 ist mit 44 Prozent der CUDA-Kerne und Textureinheiten des 2080 Ti, 54 Prozent seiner ROPs und Speicherbandbreite und 50 Prozent seines L2-Cache ausgestattet. Vor dem Start von 2060 vermuteten wir, dass Luxus wie RT- und Tensor-Kerne auf diesen Ebenen keinen Sinn mehr machen würden. Aber eine Reihe von Patches für Battlefield V – das einzige damals verfügbare Spiel mit Raytracing – ermöglichte große Leistungssteigerungen und bewies, dass die charakteristischen Funktionen von Turing immer noch mit spielbaren Bildraten genutzt werden konnten.
Es stellte sich heraus, dass wir um eine Stufe daneben lagen. Nvidia betrachtet TU116 als die Grenze, an der die Shading-Pferdestärke niedrig genug ist, um Turings zukunftsweisende Fähigkeiten daran zu hindern, viel Zweck zu erfüllen. Nachdem wir die RT- und Tensor-Kerne entfernt haben, bleibt uns ein 284 mm² großer Chip, der aus 6,6 Milliarden Transistoren besteht, die mit dem 12-nm-FinFET-Prozess von TSMC hergestellt wurden. Aber trotz seiner kleineren Transistoren ist der TU116 immer noch 42 Prozent größer als der GP106-Prozessor, der ihm vorausging.
Ein Teil des Wachstums ist Turings ausgefeilteren Shadern zuzuschreiben. Wie die High-End-Karten der GeForce RTX 20-Serie unterstützt die GeForce GTX 1660 Ti die gleichzeitige Ausführung von arithmetischen FP32-Anweisungen, die die meisten Shader-Arbeitslasten ausmachen, und INT32-Operationen (zum Adressieren/Abrufen von Daten, Gleitkomma-Min/Max, Vergleichen usw .). Wenn Sie hören, dass Turing-Kerne bei einer bestimmten Taktrate eine bessere Leistung als Pascal erzielen, erklärt diese Fähigkeit weitgehend, warum.
Die Streaming-Multiprozessoren von Turing bestehen aus weniger CUDA-Kernen als die von Pascal, aber das Design gleicht dies teilweise aus, indem es mehr SMs auf jede GPU verteilt. Die neuere Architektur weist jedem Satz von 16 CUDA-Kernen (2x Pascal) einen Scheduler zu, zusammen mit einer Dispatch-Einheit pro 16 CUDA-Kernen (wie Pascal). Vier dieser 16-Kern-Gruppierungen umfassen den SM, zusammen mit 96 KB Cache, der als 64 KB L1/32 KB Shared Memory oder umgekehrt konfiguriert werden kann, und vier Textureinheiten. Da Turing die Scheduler verdoppelt, muss es nur jeden zweiten Taktzyklus eine Anweisung an die CUDA-Kerne ausgeben, um sie voll zu halten. Dazwischen steht es frei, eine andere Anweisung an jede andere Einheit auszugeben, einschließlich der INT32-Kerne.
Insbesondere in TU116 sagt Nvidia, dass es die Tensor-Kerne von Turing durch 128 dedizierte FP16-Kerne pro SM ersetzt, wodurch die GeForce GTX 1660 Ti Operationen mit halber Genauigkeit mit der doppelten Rate von FP32 verarbeiten kann. Die anderen Turing-basierten GPUs verfügen jedoch auch über FP16 mit doppelter Geschwindigkeit, sodass unklar ist, inwiefern die GeForce GTX 1660 Ti innerhalb ihrer Familie einzigartig ist. Offensichtlicher, basierend auf dem Diagramm unten, ist, dass die 1660 Ti im Vergleich zur GeForce GTX 1060 und ihrem Pascal-basierten GP106-Chip eine massive Verbesserung des halbgenauen Durchsatzes liefert.
Aber wenn wir Sandras Scientific Analysis-Modul laufen lassen, das allgemeine Matrixmultiplikationen testet, sehen wir, wie viel mehr FP16-Durchsatz die Tensor-Kerne von TU106 im Vergleich zu TU116 erreichen. GeForce GTX 1060, die FP16 nur symbolisch unterstützte, wird kaum in der Tabelle registriert.
Zusätzlich zu den Shadern und dem einheitlichen Cache der Turing-Architektur unterstützt TU116 auch zwei Algorithmen namens Content Adaptive Shading und Motion Adaptive Shading, die zusammen als Shading mit variabler Rate bezeichnet werden. Wir haben diese Technologie in Nvidias Turing Architecture Explored: Inside the GeForce RTX 2080 behandelt. In dieser Geschichte wurden auch Turings beschleunigte Videocodierungs- und -decodierungsfunktionen vorgestellt, die sich auch auf die GeForce GTX 1660 Ti übertragen lassen.
Alles zusammenfügen…
Nvidia packt 24 SMs in TU116 und teilt sie auf drei Grafikverarbeitungscluster auf. Bei 64 FP32-Kernen pro SM sind das 1.536 CUDA-Kerne und 96 Textureinheiten über die gesamte GPU. Die Board-Partner werden zweifellos eine Reihe von Frequenzen anvisieren, um die Lücke zwischen GTX 1660 Ti und RTX 2060 zu schließen. Die offizielle Basistaktrate beträgt jedoch 1.500 MHz mit einer GPU-Boost-Spezifikation von 1.770 MHz. Unser EVGA GeForce GTX 1660 Ti XC Black Gaming-Sample hat bei drei Durchläufen von Metro: Last Light rund 1.845 MHz erreicht, während andere Karten, die wir gesehen haben, 2.000 MHz leicht überschreiten. Auf dem Papier bietet die GeForce GTX 1660 Ti also bis zu 5,4 TFLOPS FP32-Leistung und 10,9 TFLOPS FP16-Durchsatz.
Sechs 32-Bit-Speichercontroller verleihen TU116 einen aggregierten 192-Bit-Bus, der mit 12-Gb/s-GDDR6-Modulen (Micron MT61K256M32JE-12:A) bestückt ist, die bis zu 288 GB/s pushen. Das sind 50 % mehr Speicherbandbreite als die GeForce GTX 1060, was der GeForce GTX 1660 Ti hilft, ihren Leistungsvorteil bei 2560 x 1440 mit aktiviertem Anti-Aliasing aufrechtzuerhalten.
Jeder Speichercontroller ist acht ROPs und einem 256-KB-Slice des L2-Cache zugeordnet. Insgesamt macht TU116 48 ROPs und 1,5 MB L2 verfügbar. Die ROP-Zahl der GeForce GTX 1660 Ti ist im Vergleich zur RTX 2060, die ebenfalls 48 Renderausgänge nutzt, günstig. Aber seine L2-Cache-Slices sind halb so groß.
Trotz eines größeren Chips, einer um 50 % höheren Transistoranzahl und einer aggressiveren GPU-Boost-Taktrate ist die GeForce GTX 1660 Ti für die gleichen 120 W ausgelegt wie die GeForce GTX 1060. Leider bietet keine der Grafikkarten Unterstützung für mehrere GPUs. Nvidia treibt weiterhin die Erzählung voran, dass SLI eine höhere absolute Leistung erzielen soll, anstatt Spielern die Möglichkeit zu geben, Single-GPU-Konfigurationen anzupassen.
EVGA GeForce GTX 1660 Ti XC Black GamingGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FE Architecture (GPU) CUDA Cores Peak FP32 Compute Tensor Cores RT Cores Texture Units Base Clock Rate GPU Boost Rate Memory Capacity Memory Bus Memory Bandwidth ROPs L2 Cache TDP Transistor Count Die-Size-SLI-Unterstützung
Turing (TU116)
Turing (TU106)
Pascal (GP106)
Pascal (GP104)
1536
1920
1280
1920
5.4 TFLOPS
6,45 TLFOPS
4.4 TFLOPS
6,5 TFLOPS
N / A
240
N / A
N / A
N / A
30
N / A
N / A
96
120
80
120
1500MHz
1365MHz
1506MHz
1506MHz
1770MHz
1680MHz
1708MHz
1683 MHz
6GB GDDR6
6GB GDDR6
6 GB GDDR5
8 GB GDDR5
192-Bit
192-Bit
192-Bit
256-Bit
288GB/Sek
336GB/Sek
192 GB/s
256 GB/s
48
48
48
64
1,5 MB
3MB
1,5 MB
2MB
120 W
160W
120 W
150W
6,6 Milliarden
10,8 Milliarden
4,4 Milliarden
7,2 Milliarden
284 mm²
445 mm²
200 mm²
314 mm²
Nein
Nein
Nein
Ja (MIO)
EVGAs GeForce GTX 1660 Ti XC Black Gaming
Die GeForce GTX 1060 Founders Edition war ebenfalls eine 120-W-Karte und quietschte mit einem sechspoligen AUX-Anschluss vorbei. Die GeForce GTX 1660 Ti XC Black Gaming von EVGA hingegen verwendet einen Acht-Pin-Eingang, der ihr einiges an zusätzlichem Headroom verleiht. Wie wir in unserem Per-Rail-Leistungstest sehen werden, zieht die Karte während unseres Stresstests 3 A Strom über ihren PCIe-Steckplatz – der Rest kommt von ihrem achtpoligen Anschluss.
EVGA nutzt vier Leistungsphasen für TU116. Die Phasen der GPU werden von einem älteren ON Semiconductor NCP81276 auf der Rückseite der Platine gesteuert, der an ein Quartett von ON Semiconductor NCP302155 angeschlossen ist.
Diese vier Komponenten integrieren die High- und Low-Side-MOSFETs, einen Treiber und die Bootstrap-Diode. Es handelt sich um die gleichen Teile, die auf der GeForce RTX 2070 Founders Edition verwendet werden und für durchschnittliche Ströme von bis zu 55 A geeignet sind.
Der bekannte zweiphasige uP1666Q von Ubiq Semiconductor steuert die Spannungsregelungsschaltung des Speichers über zwei QM3816N6 Dual-N-Kanal-MOSFETs.
Interessanter als die relativ einfache Stromversorgung der GeForce GTX 1660 Ti XC Black Gaming ist vielleicht die Tatsache, dass EVGAs PCB freie Pads für zwei zusätzliche GPU-Phasen hat. Es gibt auch ein Paar Plätze für zwei weitere GDDR6-Speichermodule. Nvidia hat etwas Ähnliches mit der GeForce GTX 1060 gemacht und ein paar leere Stellen auf seiner Founders Edition-Karte hinterlassen, die nie besetzt wurden. Dies ist eine zeit- und kostensparende Maßnahme, die es dem Unternehmen ermöglicht, eine Leiterplatte für mehrere Produkte zu verwenden.
Auf der Leiterplatte sitzt eine Metallplatte, die Wärmeleitpads zwischen den integrierten Treibern/MOSFETs, GDDR6-Speichermodulen und dem Strommesswiderstand einschließt. Weitere Wärmeleitpads oben auf der Platte sorgen dafür, dass die Wärme in die Hauptkühlkörperbaugruppe gelangt, die an vier Punkten um die GPU herum montiert und durch die Rückseite der Platine eingeschraubt ist.
Die thermische Lösung selbst besteht aus einem ziemlich dünnen Kupferpad, das direkten Kontakt mit TU116 herstellt. Auf die Oberseite sind drei abgeflachte Rohre gelötet, und eine Reihe von Aluminiumlamellen ist wiederum mit den Wärmerohren verlötet. Ein relativ dicker Lamellenstapel wird durch die Ummantelung übertrieben, die einen einzelnen 85-mm-Lüfter beherbergt und noch mehr Tiefe hinzufügt. Alles in allem frisst die GeForce GTX 1660 Ti XC Black Gaming von EVGA drei Erweiterungssteckplätze auf Ihrem Motherboard.
EVGA tauscht schließlich Dicke gegen Länge. Die GeForce GTX 1660 Ti XC Black Gaming ist zwar 2 Zoll tief, aber nur etwa 7,5 Zoll (~190 mm) lang und 4 ⅜ Zoll (111 mm) hoch. Darüber hinaus ist im Vergleich zu den bulligen Founders Edition-Karten, die wir getestet haben, ein Gesamtgewicht von 1 lb. 7 oz. (656g) fühlt sich geradezu leicht an.
Auf der Vorderseite bietet die GeForce GTX 1660 Ti XC Black Gaming einen Dual-Link-DVI-Anschluss, einen HDMI-Anschluss und eine DisplayPort-Schnittstelle. Der USB Type-C-basierte VirtualLink-Anschluss, der bisher auf jeder anderen Karte der Turing-Klasse zu sehen war, ist weg, ein Zeichen dafür, dass wir auf ein Leistungsniveau kommen, das einem reibungslosen VR-Gameplay (selbst auf den besten VR-Headsets) nicht förderlich ist. Boardpartner, die sich dafür entscheiden, VirtualLink zu ihren Designs hinzuzufügen, können dies tun; EVGA hat es bei diesem Modell einfach nicht implementiert.
So haben wir die GeForce GTX 1660 Ti XC Black Gaming von EVGA getestet
Offensichtlich ist die GeForce GTX 1660 Ti mehr Mainstream als die anderen Turing-basierten Boards, die wir getestet haben. Daher ist unsere Grafik-Workstation, basierend auf einem MSI Z170 Gaming M7-Mainboard und einer Intel Core i7-7700K-CPU mit 4,2 GHz, angemessen. Ergänzt wird der Prozessor durch das Speicherkit F4-3000C15Q-16GRR von G.Skill. Die MX200-SSD von Crucial ist da, zusammen mit einer 1,6 TB großen Intel DC P3700, die mit Spielen vollgepackt ist.
Was die Konkurrenz betrifft, tritt die 1660 Ti meistens gegen die GeForce GTX 1070 an, obwohl wir auch die 1070 Ti einbeziehen. Natürlich sind Vergleiche zur GeForce GTX 1060 unumgänglich. Alle diese Karten sind in unserem Sortiment enthalten, zusammen mit GeForce RTX 2060 und GeForce RTX 2070. Auf der AMD-Seite interessieren wir uns hauptsächlich für Radeon RX 590, obwohl Radeon RX Vega 64 und Radeon RX Vega 56 interessant sind auch Ergänzungen.
Unsere Benchmark-Auswahl umfasst Ashes of the Singularity: Escalation, Battlefield V, Destiny 2, Far Cry 5, Forza Horizon 4, Grand Theft Auto V, Metro: Last Light Redux, Shadow of the Tomb Raider, Tom Clancy’s The Division, Tom Clancy’s Ghost Recon Wildlands, The Witcher 3 und Wolfenstein II: The New Colossus.
Die von uns verwendete Testmethodik stammt von PresentMon: Performance In DirectX, OpenGL und Vulkan. Kurz gesagt, diese Spiele werden mit einer Kombination aus OCAT und unserer hauseigenen GUI für PresentMon bewertet, mit Protokollierung über GPU-Z.
Wir verwenden die Treiberversion 418.91 zum Testen der GeForce GTX 1660 Ti und bauen 417.54 für alles andere. Die Karten von AMD verwenden Crimson Adrenalin 2019 Edition 18.12.3.