Notre avis
Basée sur le même processeur TU116 que la GeForce GTX 1660 Ti, la GeForce GTX 1660 de Nvidia perd deux multiprocesseurs de streaming et remplace la mémoire GDDR6 par une GDDR5 plus lente. De ce fait, il reste un excellent choix pour les jeux en 1920×1080 mais n’est pas recommandé en 2560×1440. Assurez-vous simplement de comparer les prix avant de faire votre achat. Les bonnes affaires sur les cartes Radeon RX 580 peuvent justifier un coup d’œil, malgré leurs performances inférieures.
Pour
Excellentes performances 1080p
Prix attractif au point d’entrée de 220 $
La consommation d’énergie raisonnable de 120 W aide à réduire la chaleur et le bruit
Contre
Pas idéal pour les jeux en 1440p
Profil de puissance similaire à celui de la GeForce GTX 1660 Ti plus rapide
Test de la Nvidia GeForce GTX 1660
Ce n’était qu’une question de temps avant que Nvidia ne prenne le processeur graphique TU116 dans sa GeForce GTX 1660 Ti et le découpe un peu pour créer un dérivé à moindre coût. La nouvelle GeForce GTX 1660 est, sans surprise, très similaire au modèle haut de gamme en ce sens qu’elle ne dispose pas des cœurs RT et Tensor de l’architecture Turing. Au lieu de cela, il vise les ressources sur puce pour accélérer les jeux pixellisés d’aujourd’hui.
Nvidia n’a même pas beaucoup coupé du pool de ressources de TU116 lors de la création de GeForce GTX 1660 : une paire de multiprocesseurs de streaming est supprimée, emportant 128 cœurs CUDA et huit unités de texture avec eux. Mais le GPU est par ailleurs assez complet. La plus grande perte de cette carte est son manque de mémoire GDDR6. En échangeant à la place avec 8 Gb/s GDDR5, la bande passante passe des 288 Go/s du 1660 Ti à seulement 192 Go/s.
Nvidia Geforce GTX 1660 (Nvidia) sur Amazon pour 605,32 $
Naturellement, la GeForce GTX 1660 est principalement destinée aux jeux FHD, où 6 Go de mémoire plus lente ne nuiront pas autant aux performances qu’à des résolutions plus élevées. La carte à 220 $ / 200 £ peut-elle maintenir des fréquences d’images suffisamment rapides pour éviter la Radeon RX 590 d’AMD avec plus de GDDR5 sur un bus plus large, cependant?
Récapitulatif TU116 : Turing sans les noyaux RT et Tensor
Le GPU au cœur de GeForce GTX 1660 est spécifiquement nommé TU116-300-A1. C’est un proche parent du TU116-400-A1 de la GeForce GTX 1660 Ti, réduit de 24 multiprocesseurs de streaming à 22. On a évidemment toujours affaire à un processeur dépourvu des futurs cœurs RT et Tensor de Nvidia, mesurant 284 mm² et composé de 6,6 milliards de transistors fabriqués à l’aide du procédé FinFET 12 nm de TSMC.
Malgré ses transistors plus petits, le TU116 est 42 % plus grand que le processeur GP106 qui l’a précédé. Une partie de cette croissance est attribuable aux shaders plus sophistiqués de l’architecture de Turing. Comme les cartes GeForce RTX 20 haut de gamme, la GeForce GTX 1660 prend en charge l’exécution simultanée des instructions arithmétiques FP32, qui constituent la plupart des charges de travail de shader, et les opérations INT32 (pour l’adressage/récupération de données, min/max en virgule flottante, comparaison, etc. ). Lorsque vous entendez parler de cœurs Turing atteignant de meilleures performances que Pascal à une fréquence d’horloge donnée, cette capacité explique en grande partie pourquoi.
Les multiprocesseurs de streaming de Turing sont composés de moins de cœurs CUDA que ceux de Pascal, mais la conception compense en partie en répartissant plus de SM sur chaque GPU. La nouvelle architecture attribue un planificateur à chaque ensemble de 16 cœurs CUDA (2x Pascal), ainsi qu’une unité de répartition par 16 cœurs CUDA (identique à Pascal). Quatre de ces groupes de 16 cœurs comprennent le SM, ainsi que 96 Ko de cache pouvant être configurés en tant que mémoire partagée de 64 Ko L1/32 Ko ou vice versa, et quatre unités de texture. Parce que Turing double les planificateurs, il suffit d’émettre une instruction aux cœurs CUDA tous les deux cycles d’horloge pour les garder pleins. Entre les deux, il est libre d’émettre une instruction différente à toute autre unité, y compris les cœurs INT32.
Dans TU116, Nvidia remplace les cœurs Tensor de Turing par 128 cœurs FP16 dédiés par SM, ce qui permet à GeForce GTX 1660 de traiter des opérations de demi-précision à 2 fois le taux de FP32. Les autres GPU basés sur Turing disposent également d’un FP16 à double débit via leurs cœurs Tensor, de sorte que la configuration de TU116 sert à maintenir cette norme grâce au matériel mis en place spécifiquement pour ce GPU. Le graphique suivant est une version mise à jour de celui publié dans notre revue GeForce GTX 1660 Ti, qui illustre l’amélioration massive du débit de demi-précision de TU116 par rapport à GeForce GTX 1060 et sa puce GP106 basée sur Pascal.
Lorsque nous avons exécuté le module d’analyse scientifique de Sandra, qui teste les multiplications matricielles générales, nous voyons à quel point les cœurs Tensor de TU106 atteignent un débit supérieur à celui de TU116. La GeForce GTX 1060, qui ne supportait que symboliquement le FP16, s’inscrit à peine sur le graphique.
En plus des shaders et du cache unifié de l’architecture Turing, TU116 prend également en charge une paire d’algorithmes appelés Content Adaptive Shading et Motion Adaptive Shading, appelés ensemble Variable Rate Shading. Nous avons couvert cette technologie dans l’architecture Turing de Nvidia explorée : à l’intérieur de la GeForce RTX 2080. Cette histoire a également présenté les capacités d’encodage et de décodage vidéo accélérées de Turing, qui s’appliquent également à la GeForce GTX 1660.
Mettre tous ensemble…
Nvidia emballe 24 SM dans TU116, les répartissant entre trois clusters de traitement graphique. Avec 64 cœurs FP32 par SM, cela représente 1 536 cœurs CUDA et 96 unités de texture sur l’ensemble du GPU. En perdant deux SM, la GeForce GTX 1660 se retrouve avec 1 408 cœurs CUDA actifs et 88 unités de texture utilisables.
Les partenaires du conseil cibleront sans aucun doute une gamme de fréquences pour différencier leurs cartes. Cependant, la fréquence d’horloge de base officielle est de 1 530 MHz avec une spécification GPU Boost de 1 785 MHz. Ces deux chiffres sont légèrement supérieurs aux horloges de la GeForce GTX 1660 Ti, bien qu’ils ne puissent pas compenser entièrement les SM manquants.
Notre échantillon Gigabyte GeForce GTX 1660 OC 6G a maintenu une fréquence constante de 1 935 MHz pendant trois exécutions de Metro: Last Light, fonctionnant environ 90 MHz plus rapidement que le 1660 Ti que nous avons examiné il y a quelques semaines. Sur le papier, la GeForce GTX 1660 offre donc jusqu’à 5 TFLOPS de performances FP32 et 10 TFLOPS de débit FP16.
Six contrôleurs de mémoire 32 bits donnent au TU116 un bus agrégé de 192 bits, qui est peuplé de modules GDDR5 de 8 Gb/s qui poussent jusqu’à 192 Go/s. C’est comparable à GeForce GTX 1060 6 Go, et une réduction de 33 % par rapport à GeForce GTX 1660 Ti. Combiné à la perte de deux SM, le passage de la mémoire GDDR6 à la mémoire GDDR5 explique les performances inférieures de la GeForce GTX 1660 par rapport à la 1660 Ti.
Chaque contrôleur de mémoire est associé à huit ROP et à une tranche de 256 Ko de cache L2. Au total, TU116 expose 48 ROP et 1,5 Mo de L2. Le nombre de ROP de GeForce GTX 1660 se compare favorablement à RTX 2060, qui utilise également 48 sorties de rendu. Mais les tranches de cache L2 du TU116 sont moitié moins grandes que celles du TU106.
Compte tenu des similitudes avec la GeForce GTX 1660 Ti, il n’est pas surprenant que la GeForce GTX 1660 soit conçue pour le même 120W. Malheureusement, aucune des cartes graphiques n’inclut le support multi-GPU. Nvidia continue de pousser le récit selon lequel le SLI est destiné à générer des performances absolues plus élevées, plutôt que de donner aux joueurs un moyen de faire correspondre les configurations à un seul GPU.
Gigabyte GeForce GTX 1660 OC 6GGeForce GTX 1660 TiGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 Architecture FE (GPU) Cœurs CUDA Pic FP32 Cœurs de tenseur de calcul Cœurs RT Unités de texture Fréquence d’horloge de base Taux de suralimentation GPU Capacité mémoire Bus mémoire Bande passante mémoire ROP Cache L2 Transistor TDP Prise en charge SLI de la taille de matrice
Turing (TU116)
Turing (TU116)
Touring (TU106)
Pascal (GP106)
Pascal (GP104)
1408
1536
1920
1280
1920
5 TFLOPS
5.4 TFLOPS
6.45 TLFOPS
4.4 TFLOPS
6,5 TFLOPS
N / A
N / A
240
N / A
N / A
N / A
N / A
30
N / A
N / A
88
96
120
80
120
1530 MHz
1500 MHz
1365 MHz
1506 MHz
1506 MHz
1785 MHz
1770 MHz
1680 MHz
1708MHz
1683 MHz
6 Go de mémoire GDDR5
6 Go de mémoire GDDR6
6 Go de mémoire GDDR6
6 Go de mémoire GDDR5
8 Go de mémoire GDDR5
192 bits
192 bits
192 bits
192 bits
256 bits
192 Go/s
288 Go/s
336 Go/s
192 Go/s
256 Go/s
48
48
48
48
64
1,5 Mo
1,5 Mo
3 Mo
1,5 Mo
2 Mo
120W
120W
160W
120W
150W
6,6 milliards
6,6 milliards
10,8 milliards
4,4 milliards
7,2 milliards
284mm²
284mm²
445 mm²
200 mm²
314 mm²
Non
Non
Non
Non
Oui (MIO)