Il nostro verdetto
Sebbene la GeForce GTX 1660 Ti costi più dei 1060 da 6 GB che sostituisce, la nuovissima scheda Turing di Nvidia offre prestazioni simili alla GeForce GTX 1070. Prestazioni elevate, un prezzo ragionevole e un consumo energetico modesto si uniscono in una solida scheda grafica di fascia alta .
Per
Ottime prestazioni a 1920 x 1080
Frame rate accettabili a 2560 x 1440
Mantiene le funzioni di accelerazione di codifica/decodifica video di Turing
La potenza della scheda di 120 W si confronta favorevolmente con la concorrenza AMD
Contro
Nessun core RT/tensore significa che non sarai in grado di provare il ray tracing o il DLSS
Turing senza RTX
Aggiornamento 21/11/2019: dal lancio della GTX 1660 Ti nel febbraio 2019, il panorama della GPU è cambiato radicalmente, con una serie di schede “Super” basate sulla stessa architettura Turing, ma spingendo sia prestazioni più elevate che prezzi inferiori rispetto a formazione Turing iniziale dell’azienda. La più rilevante per i potenziali acquirenti della GTX 1660 Ti è la GeForce GTX 1660 Super, che offre prestazioni simili alla 1660 Ti, a un prezzo iniziale inferiore di $ 229. Al momento della stesura di questo articolo, si tratta di circa $ 30 in meno rispetto alla GTX 1660 Ti a prezzo più basso.
Nvidia GeForce GTX 1660 Ti è basata su TU116, un nuovissimo processore grafico che incorpora gli shader migliorati di Turing, la sua architettura cache unificata, il supporto per lo shading adattivo e una serie completa di funzioni di accelerazione di codifica/decodifica video. La GPU è abbinata alla memoria GDDR6, proprio come i modelli GeForce RTX serie 20 di fascia alta. Ma non è abbastanza veloce da giustificare la virata sui core RT per il ray tracing accelerato o sui core Tensor per l’inferenza nei giochi. Di conseguenza, TU116 è un chip più snello con un elenco di specifiche che enfatizza i titoli più importanti di oggi.
Nvidia afferma che la GeForce GTX 1660 Ti partirà da $ 280 e sostituirà completamente la GeForce GTX 1060 6GB. Sebbene il prezzo base sia di $ 30 (o 12%) in più rispetto a dove il 1060 6GB basato su Pascal ha iniziato il suo viaggio nel 2016, la società afferma che la GeForce GTX 1660 Ti è fino a 1,5 volte più veloce e con la stessa potenza nominale della scheda di 120 W, non di meno.
Il miglioramento delle prestazioni per dollaro non è qualcosa che abbiamo visto finora dalla generazione Turing. Nvidia può ribaltare la situazione con una GPU più specifica per prestazioni a 1920 x 1080?
Incontra TU116: Turing Sans RT e Tensor Cores
Abbiamo visto Nvidia lanciare quattro GPU separate mentre ci accompagna lungo la gerarchia di Turing. Con ciascuno, l’azienda rimuove le risorse per puntare a prezzi più bassi. Ma sappiamo che sta cercando di mantenere l’equilibrio lungo il percorso, riducendo al minimo i colli di bottiglia che priverebbero inutilmente i processori di fascia bassa delle loro massime prestazioni.
GeForce RTX 2060 è dotata del 44% dei core CUDA e delle unità texture del 2080 Ti, del 54% dei suoi ROP e della larghezza di banda della memoria e del 50% della sua cache L2. Prima del lancio del 2060, sospettavamo che lussi come i core RT e Tensor non avrebbero più senso a quei livelli. Ma una serie di patch per Battlefield V, l’unico gioco abilitato al ray tracing disponibile all’epoca, ha consentito grandi miglioramenti delle prestazioni, dimostrando che le caratteristiche distintive di Turing potevano ancora essere utilizzate a frame rate riproducibili.
Si scopre che eravamo fuori di un livello. Nvidia considera TU116 il confine in cui la potenza dell’ombreggiatura scende abbastanza da impedire alle capacità future di Turing di servire a molti scopi. Dopo aver rimosso i core RT e Tensor, ci resta un chip da 284 mm² composto da 6,6 miliardi di transistor prodotti utilizzando il processo FinFET a 12 nm di TSMC. Ma nonostante i suoi transistor più piccoli, TU116 è ancora il 42% più grande del processore GP106 che lo ha preceduto.
Parte della crescita è attribuibile agli shader più sofisticati di Turing. Come le schede GeForce RTX serie 20 di fascia alta, la GeForce GTX 1660 Ti supporta l’esecuzione simultanea di istruzioni aritmetiche FP32, che costituiscono la maggior parte dei carichi di lavoro degli shader, e operazioni INT32 (per l’indirizzamento/recupero di dati, min/max in virgola mobile, confronto, ecc. .). Quando si sente parlare di core Turing che ottengono prestazioni migliori rispetto a Pascal a una determinata frequenza di clock, questa capacità spiega in gran parte il perché.
I multiprocessori di streaming di Turing sono composti da un minor numero di core CUDA rispetto a quelli di Pascal, ma il design compensa in parte distribuendo più SM su ciascuna GPU. L’architettura più recente assegna uno scheduler a ciascun set di 16 core CUDA (2x Pascal), insieme a un’unità di invio per 16 core CUDA (come Pascal). Quattro di questi raggruppamenti a 16 core comprendono l’SM, insieme a 96 KB di cache che può essere configurata come memoria condivisa da 64 KB L1/32 KB o viceversa e quattro unità di texture. Poiché Turing raddoppia gli scheduler, ha solo bisogno di inviare un’istruzione ai core CUDA ogni altro ciclo di clock per mantenerli pieni. Nel frattempo, è possibile inviare un’istruzione diversa a qualsiasi altra unità, inclusi i core INT32.
In TU116 in particolare, Nvidia afferma di sostituire i core Tensor di Turing con 128 core FP16 dedicati per SM, che consentono alla GeForce GTX 1660 Ti di elaborare operazioni di mezza precisione a una velocità doppia rispetto a FP32. Anche le altre GPU basate su Turing vantano FP16 a doppia velocità, quindi non è chiaro come la GeForce GTX 1660 Ti sia unica nella sua famiglia. Più ovvio, in base al grafico sottostante, è che il 1660 Ti offre un enorme miglioramento della velocità effettiva di metà precisione rispetto alla GeForce GTX 1060 e al suo chip GP106 basato su Pascal.
Ma quando eseguiamo il modulo di analisi scientifica di Sandra, che verifica la moltiplicazione della matrice generale, vediamo quanto più throughput FP16 ottengono i core Tensor di TU106 rispetto a TU116. La GeForce GTX 1060, che supportava solo simbolicamente FP16, si registra a malapena sul grafico.
Oltre agli shader e alla cache unificata dell’architettura Turing, TU116 supporta anche una coppia di algoritmi chiamati Content Adaptive Shading e Motion Adaptive Shading, chiamati insieme Variable Rate Shading. Abbiamo trattato questa tecnologia in Turing Architecture Explored: Inside the GeForce RTX 2080 di Nvidia. Questa storia ha anche introdotto le capacità di codifica e decodifica video accelerata di Turing, che vengono trasferite anche alla GeForce GTX 1660 Ti.
Mettere tutto insieme…
Nvidia racchiude 24 SM in TU116, suddividendoli tra tre cluster di elaborazione grafica. Con 64 core FP32 per SM, sono 1.536 core CUDA e 96 unità texture sull’intera GPU. I partner di bordo punteranno senza dubbio a una gamma di frequenze per colmare il divario tra GTX 1660 Ti e RTX 2060. Tuttavia, la frequenza di clock di base ufficiale è di 1.500 MHz con una specifica GPU Boost di 1.770 MHz. Il nostro campione EVGA GeForce GTX 1660 Ti XC Black Gaming ha raggiunto circa 1.845 MHz attraverso tre esecuzioni di Metro: Last Light, mentre altre schede che abbiamo visto superano prontamente i 2.000 MHz. Sulla carta, quindi, la GeForce GTX 1660 Ti offre fino a 5,4 TFLOPS di prestazioni FP32 e 10,9 TFLOPS di throughput FP16.
Sei controller di memoria a 32 bit forniscono a TU116 un bus aggregato a 192 bit, popolato da moduli GDDR6 da 12 Gb/s (Micron MT61K256M32JE-12:A) che spingono fino a 288 GB/s. Questo è il 50% in più di larghezza di banda della memoria rispetto alla GeForce GTX 1060, aiutando la GeForce GTX 1660 Ti a mantenere il suo vantaggio in termini di prestazioni a 2560 x 1440 con l’anti-aliasing abilitato.
Ciascun controller di memoria è associato a otto ROP e a una porzione di cache L2 da 256 KB. In totale, TU116 espone 48 ROP e 1,5 MB di L2. Il conteggio ROP della GeForce GTX 1660 Ti si confronta favorevolmente con l’RTX 2060, che utilizza anche 48 output di rendering. Ma le sue fette di cache L2 sono grandi la metà.
Nonostante un die più grande, un numero di transistor superiore del 50% e una frequenza di clock GPU Boost più aggressiva, la GeForce GTX 1660 Ti è classificata per gli stessi 120 W della GeForce GTX 1060. Sfortunatamente, nessuna delle due schede grafiche include il supporto multi-GPU. Nvidia continua a spingere la narrativa secondo cui SLI dovrebbe aumentare le prestazioni assolute, piuttosto che offrire ai giocatori un modo per abbinare le configurazioni a GPU singola.
EVGA GeForce GTX 1660 Ti XC Nero GamingGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FE Architecture (GPU) CUDA Core Peak FP32 Compute Tensor Core Core RT Texture Units Frequenza clock di base GPU Boost rate Capacità di memoria Bus di memoria Larghezza di banda della memoria ROPs Cache L2 TDP Conteggio transistor Supporto SLI per dimensioni fustella
Turing (TU116)
Turing (TU106)
Pascal (GP106)
Pascal (GP104)
1536
1920
1280
1920
5.4 TFLOPS
6.45 TLFOPS
4.4 TFLOPS
6.5 TFLOPS
N / A
240
N / A
N / A
N / A
30
N / A
N / A
96
120
80
120
1500 MHz
1365 MHz
1506 MHz
1506 MHz
1770 MHz
1680 MHz
1708 MHz
1683 MHz
GDDR6 da 6 GB
GDDR6 da 6 GB
GDDR5 da 6 GB
GDDR5 da 8 GB
192 bit
192 bit
192 bit
256 bit
288 GB/s
336 GB/s
192 GB/s
256 GB/s
48
48
48
64
1,5 MB
3 MB
1,5 MB
2 MB
120 W
160 W
120 W
150 W
6,6 miliardi
10,8 miliardi
4,4 miliardi
7,2 miliardi
284 mm²
445 mm²
200 mm²
314 mm²
No
No
No
Sì (MIO)
GeForce GTX 1660 Ti XC di EVGA Black Gaming
Anche la GeForce GTX 1060 Founders Edition era una scheda da 120 W e cigolava con un connettore ausiliario a sei pin. La GeForce GTX 1660 Ti XC Black Gaming di EVGA, d’altra parte, utilizza un ingresso a otto pin, dandogli un po’ di margine aggiuntivo. Come vedremo nei nostri test di alimentazione per-rail, la scheda assorbe 3 A di corrente sul suo slot PCIe durante il nostro stress test, il resto proviene dal suo connettore a otto pin.
EVGA utilizza quattro fasi di alimentazione per TU116. Le fasi della GPU sono controllate da un vecchio ON Semiconductor NCP81276 sul retro del PCB, che è collegato a un quartetto di ON Semiconductor NCP302155.
Questi quattro componenti integrano i MOSFET high-side e low-side, un driver e il diodo bootstrap. Sono le stesse parti utilizzate su GeForce RTX 2070 Founders Edition, capaci di correnti medie fino a 55A.
Il familiare uP1666Q bifase di Ubiq Semiconductor controlla i circuiti di regolazione della tensione della memoria tramite due MOSFET a doppio canale N QM3816N6.
Più interessante dell’alimentazione abbastanza semplice della GeForce GTX 1660 Ti XC Black Gaming, forse, è il fatto che il PCB di EVGA ha pad vuoti per altre due fasi della GPU. C’è anche un paio di postazioni per altri due moduli di memoria GDDR6. Nvidia ha fatto qualcosa di simile con la GeForce GTX 1060, lasciando un paio di punti vuoti sulla sua scheda Founders Edition che non sono mai stati popolati. Questa è una misura per risparmiare tempo e denaro, che consente all’azienda di utilizzare un PCB per più prodotti.
Una piastra metallica si trova sulla parte superiore del PCB, a sandwich dei pad termici tra il driver integrato/MOSFET, i moduli di memoria GDDR6 e il resistore di rilevamento della corrente. Più pad termici sulla parte superiore della piastra mantengono il calore in movimento nel gruppo dissipatore principale, che è montato attorno alla GPU in quattro punti e avvitato attraverso il lato posteriore del PCB.
La soluzione termica stessa è composta da un pad di rame abbastanza sottile che entra in contatto diretto con TU116. Tre tubi appiattiti sono saldati alla parte superiore e una serie di alette di alluminio sono, a loro volta, saldate ai tubi di calore. Una pila di pinne relativamente spessa è esagerata dalla copertura, che ospita una singola ventola da 85 mm e aggiunge ancora più profondità. Tutto sommato, la GeForce GTX 1660 Ti XC Black Gaming di EVGA occupa tre slot di espansione sulla scheda madre.
EVGA finisce per scambiare spessore per lunghezza. La GeForce GTX 1660 Ti XC Black Gaming può essere profonda 2 pollici, ma è lunga solo circa 7,5 pollici (~190 mm) e alta 4 ⅜ pollici (111 mm). Inoltre, rispetto alle robuste carte Founders Edition che abbiamo recensito, un peso totale di 1 lb. 7 oz. (656g) sembra decisamente leggero.
In primo piano, la GeForce GTX 1660 Ti XC Black Gaming espone un connettore DVI dual-link, una porta HDMI e un’interfaccia DisplayPort. Il connettore VirtualLink basato su USB Type-C visto su ogni altra scheda di classe Turing finora è scomparso, segno che stiamo scendendo a un livello di prestazioni non favorevole al gameplay VR fluido (anche sui migliori visori VR). I partner di Board che scelgono di aggiungere VirtualLink ai loro progetti sono liberi di farlo; EVGA semplicemente non l’ha implementato su questo modello.
Come abbiamo testato la GeForce GTX 1660 Ti XC Black Gaming di EVGA
Ovviamente, la GeForce GTX 1660 Ti è più mainstream rispetto alle altre schede Turing che abbiamo recensito. In quanto tale, la nostra workstation grafica, basata su una scheda madre MSI Z170 Gaming M7 e CPU Intel Core i7-7700K a 4,2 GHz, è giusta. Il processore è completato dal kit di memoria F4-3000C15Q-16GRR di G.Skill. L’SSD MX200 di Crucial è qui, insieme a un Intel DC P3700 da 1,6 TB caricato con i giochi.
Per quanto riguarda la concorrenza, la 1660 Ti si scontra principalmente con la GeForce GTX 1070, anche se includiamo anche la 1070 Ti. Naturalmente, i confronti con la GeForce GTX 1060 sono inevitabili. Tutte queste schede sono incluse nella nostra gamma, insieme a GeForce RTX 2060 e GeForce RTX 2070. Sul lato AMD, siamo principalmente interessati a Radeon RX 590, sebbene Radeon RX Vega 64 e Radeon RX Vega 56 siano interessanti anche aggiunte.
La nostra selezione di benchmark include Ashes of the Singularity: Escalation, Battlefield V, Destiny 2, Far Cry 5, Forza Horizon 4, Grand Theft Auto V, Metro: Last Light Redux, Shadow of the Tomb Raider, Tom Clancy’s The Division, Tom Clancy’s Ghost Recon Wildlands, The Witcher 3 e Wolfenstein II: The New Colossus.
La metodologia di test che stiamo utilizzando proviene da PresentMon: Performance In DirectX, OpenGL e Vulkan. In breve, questi giochi vengono valutati utilizzando una combinazione di OCAT e la nostra GUI interna per PresentMon, con registrazione tramite GPU-Z.
Stiamo usando la versione del driver 418.91 per testare la GeForce GTX 1660 Ti e costruire 417.54 per tutto il resto. Le schede AMD utilizzano Crimson Adrenalin 2019 Edition 18.12.3.