Vai al contenuto

Aggiornamento: recensione di Nvidia Titan X Pascal 12GB

    1650133802

    Incontra GP102

    Nota del redattore: abbiamo aggiornato l’articolo per includere le misurazioni di potenza, calore e rumore alle pagine sette e otto e abbiamo apportato modifiche alla nostra conclusione per riflettere tali misurazioni (vedere pagina 10).

    Hai un talento per scambiare la sterlina britannica con lo yen giapponese. Hai una ricetta di salsa piccante killer, ed è in distribuzione in tutto il mondo. Sei appena diventato socio dello studio di tuo suocero. In ogni caso, sei in quel gruppo d’élite che non si preoccupa davvero dei soldi. Hai la casa sulla spiaggia, la Bentley e la Bulgari. E ora Nvidia ha una scheda grafica per il tuo PC da gioco: la Titan X. È costruita su un nuovo processore grafico GP102 con 3584 CUDA core, supportato da 12 GB di memoria GDDR5X su un bus a 384 bit e offerto senza scusarsi a $ 1200.

    Prima che un singolo benchmark fosse pubblicato, Nvidia ha ricevuto elogi per aver lanciato una terza GPU basata su Pascal in altrettanti mesi e critiche per aver aumentato il prezzo della sua ammiraglia, un approccio che ha bruciato Intel quando ha introdotto il Core i7-6950X a un prezzo senza precedenti di $ 1700+ . Ecco la cosa, però: le persone che comprano il meglio del meglio non sono interessate da una tassa sul lusso strisciante. E coloro che effettivamente guadagnano con i loro PC pagano allegramente premi per hardware in grado di accelerare i loro guadagni.

    Tutto ciò rende il nostro tempo con la Titan X un po’ meno imbarazzante, pensiamo. Non c’è considerazione del valore del giorno dopo. Paghi il 70% in più rispetto al costo di una GeForce GTX 1080 per il 40% in più di core CUDA e un aumento della larghezza di banda della memoria del 50%. Sapevamo prima ancora di ricevere una carta che le prestazioni non sarebbero aumentate con il costo. Tuttavia, non vedevamo l’ora di eseguire i benchmark. Titan X migliora i frame rate a 4K abbastanza da soddisfare i quarterback della poltrona che si affrettano a definire 1080 insufficiente per giochi di massima qualità? C’è solo un modo per scoprirlo.

    GP102: È come GP104, tranne che più grande

    Con la sua GeForce GTX 1080, Nvidia ci ha presentato il processore GP104 (pascal di fascia alta). Nello spirito, quella GPU è succeduta alla GM204 (Maxwell di fascia alta), vista l’ultima volta nel cuore della GeForce GTX 980. Ma poiché l’architettura Pascal era programmata per coincidere con la produzione FinFET a 16 nm e la memoria GDDR5X più veloce, la GTX 1080 risultante non ha avuto problemi a mettere frame rate medi inferiori del 30% e superiori rispetto a GTX 980 Ti e Titan X, entrambi alimentati da GM200 (Maxwell di fascia ultra-alta). Ciò ha reso facile dimenticare il passaggio successivo, soprattutto perché sapevamo che il GP100 da 15,3 miliardi di transistor (Pascal di fascia ultra alta) era orientato al calcolo e probabilmente non era destinato al desktop.

    Ora, per la prima volta, abbiamo una sorta di GPU tweener, circondata dal processore di fascia più alta di Nvidia e dalla GP104. Questo si chiama GP102 e architettonicamente è simile a GP104, solo più grande. Quattro cluster di elaborazione grafica diventano sei. A loro volta, 20 multiprocessori di streaming diventano 30. E con 128 core CUDA FP32 per SM, GP102 gestisce fino a 3840 blocchi di costruzione programmabili. Tuttavia, GP102 è incredibilmente complesso (è composto da 12 miliardi di transistor). Per migliorare i rendimenti, Nvidia disabilita due degli SM del processore per la sua Titan X, portando il conto alla rovescia dei core CUDA della scheda a 3584. E poiché ogni SM ospita anche otto unità texture, disattivarne due lascia 224 unità texture abilitate.

    Le specifiche di Titan X cita un clock di base di 1417 MHz, con tipiche frequenze GPU Boost nella gamma di 1531 MHz. Ciò conferisce alla scheda una velocità FP32 di 10,1+ TFLOPS, che è circa il 23% in più rispetto alla GeForce GTX 1080.

    Senza dubbio, GP104 avrebbe beneficiato di un’interfaccia di memoria ancora più ampia, in particolare a 4K. Ma il maggiore potenziale di ombreggiatura/texture di GP102 richiede sicuramente una sorta di ribilanciamento. In quanto tale, il back-end del processore cresce fino a includere 12 controller di memoria a 32 bit, ciascuno legato a otto ROP e 256 KB di L2 (come con GP104), per un totale di 96 ROP e 3 MB di cache condivisa. Ciò si traduce in un percorso aggregato a 384 bit, che Nvidia popola con 12 GB della stessa GDDR5X da 10 Gb/s trovata su GTX 1080.

    La larghezza di banda della memoria teorica della scheda è di 480 GB/s (contro i 320 GB/s di 1080, con un aumento del 50%), sebbene il throughput effettivo dovrebbe essere maggiore dopo aver preso in considerazione i miglioramenti della compressione del colore delta dell’architettura Pascal.

    Perché l’uso continuato della tecnologia derivata da GDDR5 quando AMD ci ha mostrato i numerosi vantaggi della HBM più di un anno fa? Possiamo solo immaginare che durante la fase di progettazione della GP102, Nvidia non fosse sicura di come sarebbe andata a finire la fornitura di HBM2, e invece ha giocato sul sicuro con un sottosistema basato su GDDR5X. GP100 rimane l’unica GPU nella sua formazione con HBM2.

    GPUTitan X (GP102)GeForce GTX 1080 (GP104)Titan X (GM100) SMs CUDA Cores Base Clock GPU Boost Clock GFLOPs (Base Clock) Unità texture Texel Fill Rate Memoria Velocità dati Larghezza di banda della memoria ROP Cache L2 TDP Transistori Dimensioni matrici Process Node

    28
    20
    24

    3584
    2560
    3072

    1417 MHz
    1607 MHz
    1000 MHz

    1531 MHz
    1733 MHz
    1075 MHz

    10.157
    8228
    6144

    224
    160
    192

    342,9 GT/s
    277,3 GT/s
    192 GT/s

    10 Gb/s
    10 Gb/s
    7 Gb/s

    480 GB/s
    320 GB/s
    336,5 GB/s

    96
    64
    96

    3 MB
    2 MB
    3 MB

    250 W
    180 W
    250 W

    12 miliardi
    7,2 miliardi
    8 miliardi

    471 mm²
    314 mm²
    601 mm²

    16 nm
    16 nm
    28 nm

    È interessante notare che Nvidia, apparentemente all’ultimo minuto, abbia scelto di allontanare Titan X dalla sua famiglia GeForce. La pagina di destinazione di Titan X su geforce.com la chiama la scheda grafica definitiva. Non è la scheda grafica da gioco definitiva. Piuttosto, “The Ultimate. Periodo.” Ovviamente, dato che abbiamo a che fare con un GP104 di grandi dimensioni, Titan X dovrebbe essere bravo nei giochi.

    Ma la decisione dell’azienda di presentare Titan X a un meetup di intelligenza artificiale ospitato a Stanford dimostra che questa volta si sta concentrando sul deep learning. A tal fine, mentre le velocità di FP16 e FP64 sono leggermente lente su GP104 (e, per estensione, su GP102), entrambi i processori supportano INT8 a 4:1, ottenendo 40,6 TOPS alla frequenza di base di Titan X.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x