Rencontrez GP102
Note de l’éditeur : Nous avons mis à jour l’article pour inclure les mesures de puissance, de chaleur et de bruit aux pages sept et huit, et nous avons apporté des modifications à notre conclusion pour refléter ces mesures (voir page 10).
Vous avez le don d’échanger la livre sterling contre le yen japonais. Vous avez une recette de sauce piquante qui tue, et elle est distribuée dans le monde entier. Vous venez de devenir associé dans l’entreprise de votre beau-père. Quoi qu’il en soit, vous faites partie de ce groupe d’élite qui ne se soucie pas vraiment de l’argent. Vous avez la maison de plage, la Bentley et la Bulgari. Et maintenant, Nvidia a une carte graphique pour votre PC de jeu : le Titan X. Il est construit sur un nouveau processeur graphique GP102 avec 3584 cœurs CUDA, soutenu par 12 Go de mémoire GDDR5X sur un bus 384 bits, et proposé sans vergogne à 1200 $.
Avant qu’un seul benchmark ne soit publié, Nvidia a reçu des éloges pour avoir lancé un troisième GPU basé sur Pascal en autant de mois et des critiques pour avoir augmenté le prix de son produit phare – une approche qui a brûlé Intel lorsqu’il a introduit le Core i7-6950X à un prix sans précédent de 1700 $ + . Voici la chose, cependant : les gens qui achètent le meilleur du meilleur ne sont pas affectés par une taxe de luxe rampante. Et ceux qui gagnent réellement de l’argent avec leurs PC paient joyeusement des primes pour du matériel capable d’accélérer leurs revenus.
Tout cela rend notre temps avec le Titan X un peu moins gênant, pensons-nous. Il n’y a aucune considération de valeur le lendemain. Vous payez 70 % de plus que le coût d’une GeForce GTX 1080 pour 40 % de cœurs CUDA en plus et une augmentation de 50 % de la bande passante mémoire. Nous savions avant même de recevoir une carte que les performances n’évolueraient pas avec le coût. Pourtant, nous ne pouvions pas attendre pour exécuter les benchmarks. Titan X améliore-t-il suffisamment les fréquences d’images à 4K pour satisfaire les quarts-arrière en fauteuil qui appellent rapidement 1080 insuffisants pour des jeux de qualité maximale? Il n’y a qu’un moyen de le savoir.
GP102 : C’est comme le GP104, sauf qu’il est plus grand
Avec sa GeForce GTX 1080, Nvidia nous a présenté le processeur GP104 (Pascal haut de gamme). Dans l’esprit, ce GPU a succédé au GM204 (Maxwell haut de gamme), vu pour la dernière fois au cœur de GeForce GTX 980. Mais comme l’architecture Pascal a été programmée pour coïncider avec la fabrication FinFET 16 nm et une mémoire GDDR5X plus rapide, la GTX 1080 résultante n’a eu aucun mal à mettre en baisse de 30% + des fréquences d’images moyennes supérieures à celles de la GTX 980 Ti et de la Titan X, toutes deux alimentées par GM200 (ultra haut de gamme Maxwell). Cela a permis d’oublier facilement la prochaine étape, d’autant plus que nous savions que le GP100 à 15,3 milliards de transistors (Pascal ultra haut de gamme) était orienté calcul et probablement pas destiné au bureau.
Maintenant, pour la première fois, nous avons une sorte de GPU « tweener », entouré du processeur le plus haut de gamme de Nvidia et du GP104. Celui-ci s’appelle GP102, et son architecture est similaire au GP104, mais en plus grand. Quatre clusters de traitement graphique deviennent six. À leur tour, 20 multiprocesseurs de streaming deviennent 30. Et avec 128 cœurs FP32 CUDA par SM, le GP102 utilise jusqu’à 3840 blocs de construction programmables. GP102 est cependant incroyablement complexe (il est composé de 12 milliards de transistors). Afin d’améliorer les rendements, Nvidia désactive deux des SM du processeur pour son Titan X, ramenant le nombre de cœurs CUDA de la carte à 3584. Et parce que chaque SM héberge également huit unités de texture, la désactivation de deux d’entre elles laisse 224 unités de texture activées.
La spécification du Titan X cite une horloge de base de 1417 MHz, avec des fréquences GPU Boost typiques dans la plage de 1531 MHz. Cela donne à la carte un taux FP32 de 10,1+ TFLOPS, soit environ 23 % de plus que la GeForce GTX 1080.
Nul doute que le GP104 aurait bénéficié d’une interface mémoire encore plus large, notamment en 4K. Mais le plus grand potentiel d’ombrage/texturation du GP102 appelle définitivement un rééquilibrage en quelque sorte. En tant que tel, le back-end du processeur se développe pour inclure 12 contrôleurs de mémoire 32 bits, chacun lié à huit ROP et 256 Ko de L2 (comme avec GP104), ce qui donne un total de 96 ROP et 3 Mo de cache partagé. Cela se traduit par un chemin agrégé de 384 bits, que Nvidia remplit avec 12 Go du même GDDR5X à 10 Gb/s trouvé sur GTX 1080.
La bande passante mémoire théorique de la carte est de 480 Go/s (contre 320 Go/s pour la 1080, soit une augmentation de 50 %), bien que le débit effectif devrait être plus élevé après avoir pris en compte les améliorations de la compression des couleurs delta de l’architecture Pascal.
Pourquoi l’utilisation continue de la technologie dérivée de GDDR5 alors qu’AMD nous a montré les nombreux avantages de HBM il y a plus d’un an ? Nous ne pouvons qu’imaginer que pendant la phase de conception du GP102, Nvidia n’était pas sûr de la façon dont l’offre de HBM2 allait secouer, et l’a joué en toute sécurité avec un sous-système basé sur GDDR5X à la place. GP100 reste le seul GPU de sa gamme avec HBM2.
GPUTitan X (GP102)GeForce GTX 1080 (GP104)Titan X (GM100) SMs CUDA Cores Horloge de base GPU Boost Clock GFLOPs (Base Clock) Unités de texture Texel Taux de remplissage Mémoire Débit de données Bande passante mémoire ROP Cache L2 Transistors TDP Taille de matrice Nœud de processus
28
20
24
3584
2560
3072
1417 MHz
1607 MHz
1000 MHz
1531 MHz
1733 MHz
1075 MHz
10 157
8228
6144
224
160
192
342,9 GT/s
277,3 GT/s
192 GT/s
10 Go/s
10 Go/s
7 Go/s
480 Go/s
320 Go/s
336,5 Go/s
96
64
96
3 Mo
2 Mo
3 Mo
250W
180W
250W
12 milliards
7,2 milliards
8 milliards
471mm²
314mm²
601 mm²
16nm
16nm
28nm
Il est intéressant que Nvidia, apparemment à la dernière minute, ait choisi d’éloigner Titan X de sa famille GeForce. La page d’accueil Titan X sur geforce.com appelle cela la carte graphique ultime. Pas la carte graphique de jeu ultime. Plutôt, « L’Ultime. Période. » Bien sûr, étant donné que nous avons affaire à un GP104 de taille supérieure, Titan X devrait être bon pour les jeux.
Mais la décision de l’entreprise de dévoiler Titan X lors d’une réunion sur l’IA organisée à Stanford montre qu’elle se concentre cette fois-ci sur l’apprentissage en profondeur. À cette fin, alors que les taux FP16 et FP64 sont lamentablement lents sur GP104 (et par extension, sur GP102), les deux processeurs prennent en charge INT8 à 4: 1, ce qui donne 40,6 TOPS à la fréquence de base de Titan X.