Begrüßen Sie eine neue Pascal-basierte GPU
Zwei Monate nach ihrem Debüt füllt Nvidias Pascal-Architektur langsam das Desktop-Grafikkarten-Portfolio des Unternehmens von oben nach unten aus. Zuerst kam die GeForce GTX 1080, die für weniger Geld mehr als 30 % mehr Leistung bietet als eine GeForce GTX 980 Ti. Online-Händler können sie immer noch nicht auf Lager halten (Newegg hat zum jetzigen Zeitpunkt keine). Dann wurde uns die GeForce GTX 1070 vorgestellt, die auch eine 980 Ti für Hunderte von Dollar weniger übertrifft.
Jetzt bekommen wir ein drittes Pascal-basiertes Board in der GeForce GTX 1060. Anfang dieses Monats angekündigt, wissen wir bereits, dass Nvidias Partner Versionen ab 250 US-Dollar haben werden. Die Founders Edition-Implementierung wird für 300 US-Dollar auf nvidia.com und in Best Buy Stores verkauft, also seien Sie nicht überrascht, wenn Sie sie nirgendwo anders online finden.
GeForce GTX 1060 basiert auf einer brandneuen GPU namens GP106, die viele der gleichen Funktionen wie GP104 bietet, jedoch in einem Mainstream-Paket. Lassen Sie sich von diesem Begriff jedoch nicht abschrecken. Die 1060 ist vielleicht nur eine 120-W-Karte, aber Nvidia sagt, dass sie gut für Bildraten der GeForce GTX 980-Klasse ist. Vor zwei Jahren wurde dieses Leistungsniveau für 550 US-Dollar verkauft. Wir haben einen langen Weg zurückgelegt, um sicher zu sein.
Lernen Sie GP106 kennen
Nvidia baut sein Flaggschiff GeForce GTX 1080 mit einem vollständigen GP104-Prozessor mit vier aktivierten Grafikverarbeitungsclustern. Das ergibt eine Karte mit 2560 CUDA-Kernen und 160 Textureinheiten. Die GTX 1070 konzentriert sich auf dieselbe GPU, wobei drei ihrer GPCs eingeschaltet sind, was bis zu 1920 Kerne und 120 Textureinheiten hinzufügt.
Die GeForce GTX 1060 lässt sich ähnlich verkleinern und verwendet dieselben architektonischen Bausteine. Aus unserer GeForce GTX 1080 Launch-Berichterstattung:
„Jeder GPC umfasst fünf Thread/Texture Processing Clusters und eine Raster-Engine. Weiter aufgeschlüsselt kombiniert ein TPC einen Streaming-Multiprozessor und eine PolyMorph-Engine. Der SM kombiniert 128 CUDA-Kerne mit einfacher Genauigkeit, 256 KB Registerdateikapazität, 96 KB gemeinsam genutzten Speicher, 48 KB L1/Textur-Cache und acht Textureinheiten. In der Zwischenzeit enthält die PolyMorph-Engine der vierten Generation einen neuen Logikblock, der sich am Ende der Geometrie-Pipeline und vor der Rastereinheit befindet, um Nvidias Simultaneous Multi-Projection-Funktion zu handhaben.“
Grafikkarte
GeForce GTX 1060 (GP106)
Geforce GTX 980 (GM204)
SMS
10
16
CUDA-Kerne
1280
2048
Basisuhr
1506 MHz
1126 MHz
GPU-Boost-Takt
1708 MHz
1216 MHz
GFLOPs (Basistakt)
3855
4612
Textureinheiten
80
128
Texel-Füllrate
120,5 GT/s
144,1 GT/s
Speicherdatenrate
8 GB/s
7 GB/s
Speicherbandbreite
192 GB/s
224GB/Sek
ROPs
48
64
L2-Cache
1,5 MB
2MB
TDP
120 W
165W
Transistoren
4,4 Milliarden
5,2 Mrd
Die Größe
200 mm²
398 mm²
Prozessknoten
16nm
28 Nanometer
GP106 ist mit zwei GPCs ausgestattet, sodass Sie insgesamt 1280 CUDA-Kerne und 80 Textureinheiten haben. Der Chip profitiert von denselben optimierten Timings, die es Nvidia ermöglicht haben, die Taktraten auf GP104 zu erhöhen, was eine Basisfrequenz von 1506 MHz und eine typische GPU-Boost-Bewertung von 1708 MHz ermöglicht.
Auch das Backend des Prozessors ist abgespeckt. Sechs 32-Bit-Speichercontroller stellen einen aggregierten 192-Bit-Datenpfad bereit. Wie beim größeren GP104 sind jedem Controller acht ROPs und 256 KB L2 zugeordnet, was insgesamt 48 ROPs und 1,5 MB Cache ergibt. Nvidia bringt 6 GB GDDR5 mit 8 GT/s auf das Board und liefert bis zu 192 GB/s Spitzendurchsatz. Obwohl diese Zahl niedriger ist als die 224 GB/s der GTX 980, bedenken Sie auch, dass Pascal neue verlustfreie Techniken einsetzt, um Einsparungen im Speichersubsystem zu erzielen und die nutzbare Bandbreite effektiv zu erhöhen. In Anlehnung an unsere GTX 1080-Abdeckung versucht „[GP106s] Delta-Farbkomprimierung, Einsparungen von 2:1 zu erzielen, und dieser Modus wurde angeblich verbessert, um häufiger verwendet zu werden. Es gibt auch einen neuen 4:1-Modus, der Fälle abdeckt, in denen Unterschiede pro Pixel auftreten sind sehr klein und lassen sich auf noch weniger Raum komprimieren.
Natürlich wird GP106 mit dem gleichen TSMC 16FF+-Prozess wie GP104 hergestellt. Während die größere GPU aus 7,2 Milliarden Transistoren auf einem 314-mm²-Die besteht, packt Nvidia beim GP106 4,4 Milliarden FinFET-Transistoren auf 200 mm². Der weniger komplexe Prozessor, gekoppelt mit weniger Speicher auf einem einfacheren PCA, führt zu einer TDP von 120 W.
Eine Premiere: Kein SLI für gehobenen Mainstream
Beachten Sie das Fehlen eines SLI-Anschlusses oben? Nvidia empfiehlt eine GeForce GTX 1070 oder 1080 für Spieler, die nach mehr Leistung suchen, als eine 1060 liefert (natürlich), und unterstützt kein SLI auf der 1060. Generationsübergreifend ist dies das High-End-Board, an das wir uns ohne die Technologie erinnern können. Sicher, die GeForce GTX 750 Ti hatte es nicht, aber die 760 hatte es. So auch die GeForce GTX 950.
Offiziell verinnerlicht Nvidia die Entscheidung. Es gibt nicht viele Spieler, die Mainstream-GPUs koppeln, und das Unternehmen möchte die Ressourcen nicht dünn verteilen, also konzentriert es sich auf die Optimierung von SLI auf schnelleren Pascal-basierten Karten. Abgesehen von dieser Erklärung geht die Spieleentwicklung jedoch in eine andere Richtung mit Nachbearbeitung und rechenorientierten Effekten, die für das Rendering mit alternativen Frames nicht geeignet sind. Und mit DirectX 12 wird mehr Kontrolle auf ISVs verlagert, die bestrebt sind, ihre Inhalte so schnell wie möglich herauszubringen. Das bedeutet, dass ein Großteil der Arbeit, die Nvidia in seine Treiber investiert, umgangen wird.
Wir haben ein Spiel in unserer Suite, das mehrere GPUs über DirectX 12 unterstützt: Ashes of the Singularity. Nachdem wir eine zweite GeForce GTX 1060 hinzugefügt und ein Kontrollkästchen angeklickt haben, sehen wir die folgende Beschleunigung:
Das ist zwar nicht die Art der Skalierung, die wir von SLI gewohnt sind, aber ~50 % sind nicht schlecht. Leider können wir nicht einmal mit DirectX-11-Spielen und DX12-Titeln ohne Unterstützung für mehrere integrierte Adapter experimentieren.
Da es sich um eine 1080p-fokussierte Karte handelt, könnte Nvidia SLI über PCI Express durch ein Treiber-Update rückwirkend aktivieren, und wir hoffen, dass dies der Fall ist. Unabhängig davon, wie wenige Spieler daran interessiert sind, GTX 1060-Karten zu paaren, gibt es immer noch viele DX11-Titel, die von Multi-GPU-Konfigurationen profitieren. Und jedes Problem, das GP106 hat, um die von DX12 auferlegten Skalierungsprobleme zu überwinden, gilt auch für GP104-basierte Karten. Lassen Sie Performance-Benchmarks bestimmen, wie attraktiv SLI-fähige 1060er sind oder nicht, sagen wir.
Ein genauerer Blick auf die GeForce GTX 1060 Founders Edition
Nvidia fährt mit seinem kantigeren Founders Edition-Design der 10er-Serie fort, obwohl die GTX 1060 im Vergleich zu 1070 und 1080 eine vermutlich günstigere Implementierung aufweist.
Das bedeutet jedoch nicht, dass die neue Karte klein ist. Es ist 25,4 cm lang (gemessen von der Steckplatzabdeckung bis zum Ende der Karte), 10,7 cm hoch (gemessen von der Oberkante des Mainboard-Steckplatzes bis zur Oberkante der Karte) und 3,8 cm tief. Tatsächlich ist die Karte nur 3,5 cm tief, aber ihre Slot-Abdeckung steht 0,3 cm hervor.
Mit 845 g ist die GeForce GTX 1060 Founders Edition auch nicht besonders leicht.
Design, Haptik & Anschlüsse
Auch hier setzt Nvidia beim Gehäuse der Karte auf eine Mischung aus Aluminium und Kunststoff. Diesmal ist es allerdings etwas einfacher. Die Abdeckung samt Lüfter ist in einem Stück abnehmbar. Oben finden wir das beleuchtete GeForce-GTX-Logo zusammen mit einem sechspoligen Stromanschluss.
Das Backend der GeForce GTX 1060 weicht ein wenig von früheren Designs ab. Grafikkarten mit kurzen PCAs haben oft Lufteinlässe, an denen der Kühler über die Platine hinausragt und den Radiallüfter bedient. Stattdessen hat der 1060 einen normalen Deckel ohne Öffnung. Zweifellos aus Kostengründen gibt es auch keine Backplate.
Die Rückseite der Karte bietet uns einen vertrauten Anblick.
Das I/O-Panel ist unverändert von Nvidias GeForce GTX 1080 und 1070 kopiert. Es wird von drei DisplayPort-Anschlüssen dominiert, die Version 1.2-kompatibel sind. Das Unternehmen teilt uns jedoch mit, dass es auch für die Versionen 1.3 und 1.4 bereit ist, die zum Display-Controller der GPU passen. Darüber hinaus gibt es einen HDMI 2.0-Anschluss und einen Dual-Link-DVI-Anschluss; kein Analogausgang vorhanden.
Kühlerdesign, Platine & Netzteil
Wir wenden unsere Aufmerksamkeit nach innen und entfernen die Abdeckung, um die Kühllösung der GeForce GTX 1060 freizulegen.
Oben fällt uns sofort die seltsame Position des Stromanschlusses auf. Es befindet sich in einem Teil des Kühlers, der über das eigentliche PCA hinausragt. Dies erfordert eine Reihe von Kabeln, die an der Platine befestigt werden müssen.
Die Umsetzung ist alles andere als elegant und hält Nvidias Partner davon ab, kürzere 1060er zu bauen. Obwohl die Karte nur 17,5 cm lang ist, bietet sie keinen Platz für einen Stromanschluss.
Entfernen Sie die vier Schrauben, mit denen der Körper des Kühlers befestigt ist, und er lässt sich sofort lösen. Darunter befindet sich ein massiver Kupferkühlkörper und ein Metallrahmen. Das geschlossene Kühlrippendesign erinnert uns an die GeForce GTX 1070 und sollte angesichts der 120 W TDP der 1060 ausreichend Leistung bieten.
Der massive Halte- und Kühlrahmen erfüllt eine doppelte Aufgabe, indem er alles an Ort und Stelle hält und die Spannungsregelungsschaltung/Speichermodule kühlt.
Sobald der Rahmen gelöst und abgenommen ist, muss er hochgeklappt und umgedreht werden. Das liegt an den Verbindungskabeln zum separaten PCIe-Stromanschluss, die fest mit der Platine verlötet sind. Dadurch wird das nackte PCA in seiner ganzen Pracht sichtbar.
Wie üblich sitzt die GPU vorne und in der Mitte. GP106 ist natürlich um einiges kleiner als die GP104-GPU, die wir auf Nvidias GeForce GTX 1080 und 1070 gefunden haben. Damit enden die Unterschiede zwischen den Boards jedoch noch nicht.
Nehmen Sie als Beispiel die Speichermodule. Nur sechs der Positionen des 1060 sind mit Samsung K4G80325FB-HC25 GDDR5 bestückt. Sie haben eine Kapazität von jeweils 8 GB (32 x 256 MB) und laufen je nach Taktrate zwischen 1,305 V und 1,597 V. Alles in allem erhalten wir hier die 6-GB-Spezifikation der 1060.
Leider ist der PWM-Controller nicht dokumentiert. Es wird von uPI Semiconductor hergestellt und trägt die Modellnummer uP9509, was bedeutet, dass es wahrscheinlich der kleinere Bruder des uP9511P ist (letzteren Controller haben wir in Verbindung mit dem GP104-Prozessor gefunden).
Die Speichermodule und eine der GPU-Phasen werden über den PCIe-Steckplatz des Mainboards mit Strom versorgt. Die beiden verbleibenden GPU-Phasen und das Zubehör der Karte werden über den sechspoligen Stromanschluss mit Strom versorgt. Was das für die Lastverteilung auf den Schienen bedeutet, sehen wir uns auf der nächsten Seite genauer an.
Bei der Spannungsregelung setzt Nvidia nur einen Dual-N-Channel-MOSFET, den E6930, pro Phase sowohl für die High- als auch für die Low-Side ein; separate Gate-Treiber werden nicht benötigt. Diese hochintegrierte Komponente erklärt die Leerstellen auf der Platine.
Die drei Phasen der GPU reichen vollkommen aus, ihre Verteilung ist hier sinnvoller als bei AMDs Radeon RX 480.
Abgesehen vom sechspoligen Stromanschluss, der irgendwo falsch abgebogen zu sein scheint, sieht Nvidias Referenz GeForce GTX 1060 eigentlich ganz gut aus. Und angesichts einer relativ geringen Abwärme ist auch der Axiallüfter keine schlechte Wahl.