Saluta una nuova GPU basata su Pascal
Due mesi dopo il suo debutto, l’architettura Pascal di Nvidia sta lentamente riempiendo il portafoglio di schede grafiche desktop dell’azienda da cima a fondo. Per prima è arrivata la GeForce GTX 1080, che offre il 30% di prestazioni in più in più rispetto a una GeForce GTX 980 Ti a un prezzo inferiore. I venditori online non possono ancora tenerli in stock (Newegg non ne ha al momento della stesura). Poi ci è stata presentata la GeForce GTX 1070, che supera anche una 980 Ti per centinaia di dollari in meno.
Ora stiamo ottenendo una terza scheda basata su Pascal nella GeForce GTX 1060. Annunciata all’inizio di questo mese, sappiamo già che i partner di Nvidia avranno versioni a partire da $ 250. L’implementazione della Founders Edition sarà venduta a $ 300 su nvidia.com e nei negozi Best Buy, quindi non sorprenderti se non li trovi altrove online.
La GeForce GTX 1060 si basa su una nuovissima GPU chiamata GP106 che espone molte delle stesse funzionalità della GP104, ma in un pacchetto più mainstream. Non lasciare che quel termine ti dissuada, però. La 1060 potrebbe essere una semplice scheda da 120 W, ma Nvidia dice che è buona per i frame rate di classe GeForce GTX 980. Due anni fa, quel livello di prestazioni è stato venduto per $ 550. Abbiamo fatto molta strada, questo è certo.
Incontra GP106
Nvidia costruisce la sua ammiraglia GeForce GTX 1080 utilizzando un processore GP104 completo con quattro cluster di elaborazione grafica abilitati. Questo produce una scheda con 2560 core CUDA e 160 unità texture. La GTX 1070 è incentrata sulla stessa GPU con tre dei suoi GPC accesi, sommando fino a 1920 core e 120 unità di texture.
La GeForce GTX 1060 si ridimensiona in modo simile utilizzando gli stessi elementi costitutivi dell’architettura. Dalla nostra copertura di lancio della GeForce GTX 1080:
“Ogni GPC include cinque Thread/Texture Processing Cluster e un motore raster. Scomposto ulteriormente, un TPC combina uno Streaming Multiprocessor e un motore PolyMorph. L’SM combina 128 core CUDA a precisione singola, 256 KB di capacità del file di registro, 96 KB di memoria condivisa, 48 KB di cache L1/texture e otto unità texture. Nel frattempo, il motore PolyMorph di quarta generazione include un nuovo blocco logico che si trova alla fine della pipeline geometrica e davanti all’unità raster per la gestione della funzione di multi-proiezione simultanea di Nvidia”.
GPU
GeForce GTX 1060 (GP106)
GeForce GTX 980 (GM204)
Sms
10
16
Nuclei CUDA
1280
2048
Orologio di base
1506 MHz
1126 MHz
Orologio potenziato GPU
1708 MHz
1216 MHz
GFLOP (orologio di base)
3855
4612
Unità di trama
80
128
Tasso di riempimento di Texel
120,5 GT/s
144,1 GT/s
Velocità dati di memoria
8 Gb/s
7 Gb/s
Banda di memoria
192 GB/s
224 GB/s
ROP
48
64
Cache L2
1,5 MB
2 MB
TDP
120 W
165 W
transistor
4,4 miliardi
5,2 miliardi
Dimensione del dado
200 mm²
398 mm²
Nodo di processo
16 nm
28 nm
GP106 è dotato di due GPC, quindi ti ritroverai con un totale di 1280 core CUDA e 80 unità texture. Il chip beneficia degli stessi tempi ottimizzati che consentono a Nvidia di aumentare le frequenze di clock su GP104, facilitando una frequenza base di 1506 MHz e una tipica valutazione GPU Boost di 1708 MHz.
Anche il back-end del processore è ridotto. Sei controller di memoria a 32 bit forniscono un percorso dati aggregato a 192 bit. Come il più grande GP104, ogni controller è associato a otto ROP e 256 KB di L2, per un totale di 48 ROP e 1,5 MB di cache. Nvidia rilascia 6 GB di GDDR5 da 8 GT/s sulla scheda, offrendo fino a 192 GB/s di throughput di picco. Sebbene tale cifra sia inferiore ai 224 GB/s della GTX 980, ricordate anche che Pascal utilizza nuove tecniche lossless per estrarre risparmi nel sottosistema di memoria, aumentando di fatto la larghezza di banda utilizzabile. Adattato dalla nostra copertura GTX 1080, “la compressione del colore delta [di GP106] cerca di ottenere un risparmio di 2:1 e questa modalità è presumibilmente migliorata per essere utilizzata più spesso. C’è anche una nuova modalità 4:1 che copre i casi in cui le differenze per pixel sono molto piccoli e comprimibili in ancora meno spazio.
Ovviamente, GP106 è prodotto utilizzando lo stesso processo TSMC 16FF+ di GP104. Mentre la GPU più grande è composta da 7,2 miliardi di transistor su un die da 314 mm², Nvidia racchiude 4,4 miliardi di transistor FinFET in 200 mm² per GP106. Il processore meno complesso, accoppiato con meno memoria su un PCA più semplice, si traduce in un TDP di 120 W.
Una prima: nessun SLI per l’Upper Mainstream
Notate la mancanza di un connettore SLI in alto? Nvidia consiglia una GeForce GTX 1070 o 1080 ai giocatori che cercano più prestazioni di una 1060 (ovviamente) e non supporta SLI sulla 1060. Generativamente, questa è la scheda di fascia più alta che possiamo ricordare senza la tecnologia. Certo, la GeForce GTX 750 Ti non ce l’aveva, ma la 760 sì. Così ha fatto anche la GeForce GTX 950.
Ufficialmente, Nvidia interiorizza la decisione. Non ci sono molti giocatori che accoppiano le GPU tradizionali e l’azienda non vuole distribuire le risorse al minimo, quindi si sta concentrando sull’ottimizzazione dell’SLI su schede basate su Pascal più veloci. Al di là di questa spiegazione, tuttavia, lo sviluppo del gioco sta andando in una direzione diversa con effetti di post-elaborazione ed orientamento al calcolo che non sono amichevoli per il rendering a fotogrammi alternativi. E con DirectX 12, un maggiore controllo viene trasferito agli ISV desiderosi di diffondere i propri contenuti il più rapidamente possibile. Ciò significa che gran parte del lavoro che Nvidia riversa sui suoi driver viene aggirato.
Abbiamo un gioco nella nostra suite che supporta più GPU tramite DirectX 12: Ashes of the Singularity. Dopo aver aggiunto una seconda GeForce GTX 1060 e aver fatto clic su una casella di controllo, vediamo il seguente aumento di velocità:
Anche se questo non è il tipo di ridimensionamento che siamo abituati a vedere da SLI, circa il 50% non è male. Sfortunatamente, non possiamo nemmeno sperimentare con i giochi DirectX 11 e i titoli DX12 senza il supporto per più adattatori integrati.
Dato che si tratta di una scheda focalizzata sui 1080p, Nvidia potrebbe abilitare retroattivamente SLI su PCI Express tramite un aggiornamento del driver e speriamo che lo faccia. Indipendentemente da quanti pochi giocatori potrebbero essere interessati ad accoppiare le schede GTX 1060, ci sono ancora molti titoli DX11 che beneficiano di configurazioni multi-GPU. E qualsiasi problema che GP106 ha nel tagliare i problemi di ridimensionamento imposti da DX12 si applica anche alle schede basate su GP104. Lascia che i benchmark delle prestazioni determinino quanto siano attraenti o meno i 1060 con SLI, diciamo.
Uno sguardo più da vicino alla GeForce GTX 1060 Founders Edition
Nvidia continua con il suo design più spigoloso della Founders Edition della serie 10, anche se la GTX 1060 sfoggia un’implementazione presumibilmente meno costosa rispetto alla 1070 e alla 1080.
Ciò non significa che la nuova carta sia piccola, però. È lungo 25,4 cm (misurato dal coperchio dello slot all’estremità della scheda), alto 10,7 cm (misurato dalla parte superiore dello slot della scheda madre alla parte superiore della scheda) e profondo 3,8 cm. In realtà, la profondità della scheda è di soli 3,5 cm, ma il coperchio dello slot sporge di 0,3 cm.
Con 845g, anche la GeForce GTX 1060 Founders Edition non è particolarmente leggera.
Design, sensazione e connettori
Ancora una volta, Nvidia utilizza una miscela di alluminio e plastica per la copertura della scheda. È un po’ più semplice questa volta, però. Il coperchio, inclusa la ventola, può essere rimosso in un unico pezzo. In alto, troviamo il logo GeForce GTX illuminato, insieme a un connettore di alimentazione a sei pin.
Il back-end della GeForce GTX 1060 è un po’ diverso dai progetti precedenti. Le schede grafiche con PCA corti hanno spesso prese d’aria in cui il dispositivo di raffreddamento sporge oltre la scheda, servendo la ventola radiale. Invece, il 1060 ha una normale cover senza apertura. Indubbiamente a causa di problemi di costi, non c’è nemmeno il backplate.
Il retro della carta ci presenta uno spettacolo familiare.
Il pannello I/O viene copiato dalle GeForce GTX 1080 e 1070 di Nvidia senza alcuna modifica. È dominato da tre connettori DisplayPort, che sono compatibili con la versione 1.2. Tuttavia, l’azienda ci dice che sono pronti anche per le versioni 1.3 e 1.4, corrispondenti al controller del display della GPU. Inoltre, c’è un connettore HDMI 2.0 e un connettore DVI dual-link; non è disponibile alcuna uscita analogica.
Design, scheda e alimentazione del dispositivo di raffreddamento
Rivolgendo la nostra attenzione verso l’interno, rimuoviamo la copertura per esporre la soluzione di raffreddamento della GeForce GTX 1060.
In alto, notiamo immediatamente la strana posizione del connettore di alimentazione. Si trova in una parte del dissipatore che sporge oltre l’attuale PCA. Ciò richiede un numero di cavi da collegare alla scheda.
L’implementazione è tutt’altro che elegante e impedisce ai partner di Nvidia di costruire 1060 più brevi. Sebbene la scheda sia lunga solo 17,5 cm, non ha spazio per ospitare un connettore di alimentazione.
Rimuovere le quattro viti che fissano il corpo del dispositivo di raffreddamento e si stacca subito. Sotto c’è un enorme dissipatore di calore in rame e una struttura in metallo. Il design dell’aletta di raffreddamento chiusa ci ricorda la GeForce GTX 1070 e dovrebbe fornire ampie prestazioni dato il TDP di 120 W del 1060.
L’enorme struttura di ritenzione e raffreddamento svolge un duplice compito mantenendo tutto in posizione e raffreddando i circuiti di regolazione della tensione/i moduli di memoria.
Una volta che il telaio è stato sganciato e tolto, deve essere ribaltato e ribaltato. Ciò è dovuto ai cavi che collegano il connettore di alimentazione PCIe separato, che sono saldati permanentemente alla scheda. In questo modo si rivela la nuda PCA in tutto il suo splendore.
Come al solito, la GPU si trova davanti e al centro. La GP106 è naturalmente un po’ più piccola della GPU GP104 che abbiamo trovato sulle GeForce GTX 1080 e 1070 di Nvidia. Le differenze tra le schede non finiscono qui, però.
Prendi i moduli di memoria come esempio. Solo sei delle postazioni del 1060 sono popolate con Samsung K4G80325FB-HC25 GDDR5. Hanno una capacità di 8 Gb (32 x 256 Mb) ciascuno e funzionano da 1,305 V a 1,597 V, a seconda della frequenza di clock. Tutto sommato, è qui che otteniamo le specifiche da 6 GB del 1060.
Sfortunatamente, il controller PWM non è documentato. È prodotto da uPI Semiconductor e porta il numero di modello uP9509, il che significa che probabilmente è il fratello minore dell’uP9511P (quest’ultimo controller è quello che abbiamo trovato accoppiato al processore GP104).
I moduli di memoria e una delle fasi della GPU ottengono la loro alimentazione attraverso lo slot PCIe della scheda madre. Le due fasi rimanenti della GPU e gli accessori della scheda assorbono energia dal connettore di alimentazione a sei pin. Nella pagina successiva daremo un’occhiata più da vicino a cosa significa in termini di distribuzione del carico sui binari.
Quando si tratta di regolazione della tensione, Nvidia utilizza un solo MOSFET Dual N-Channel, l’E6930, per fase sia per il lato alto che per quello basso; non sono necessari gate driver separati. Questo componente altamente integrato spiega gli spazi vuoti sulla scheda.
Le tre fasi della GPU sono completamente sufficienti e la loro distribuzione ha più senso qui che sulla Radeon RX 480 di AMD.
A parte il connettore di alimentazione a sei pin, che sembra aver preso una svolta sbagliata da qualche parte, la GeForce GTX 1060 di riferimento di Nvidia sembra in realtà piuttosto buona. E data una quantità relativamente bassa di calore di scarto, anche la sua ventola assiale non è una cattiva scelta.