Vai al contenuto

Recensione Nvidia Titan RTX: gioco, allenamento, inferenza, Pro Viz, Oh mio!

    1646339763

    Il nostro verdetto

    Titan RTX è la carta giusta per il cliente giusto. È un gioco da ragazzi se stai lavorando con modelli geometrici di grandi dimensioni, addestrando reti neurali con batch di grandi dimensioni o inferendo reti addestrate utilizzando framework come TensorRT con supporto per le funzionalità dell’hardware. Giocare su Titan RTX non ha molto senso quando potresti avere due GeForce RTX 2080 Ti a un prezzo simile.

    Per

    24 GB di memoria sono l’ideale per grandi carichi di lavoro professionali e di deep learning
    I core Tensor migliorati avvantaggiano in modo specifico le prestazioni di inferenza
    Eccellenti frame rate di gioco 4K
    Supporto NVLink (che manca a Titan V)
    Design accattivante

    Contro

    I limiti di prezzo di $ 2.500 attraggono i professionisti con tasche profonde
    Il design della ventola assiale scarica (molto) calore nella custodia
    Scarse capacità dell’FP64 rispetto a Titan V

    Recensione Nvidia Titan RTX

    Il lancio di Titan RTX è stato decisamente senza cerimonie. I membri della stampa tecnologica sapevano che la carta sarebbe arrivata ma non ne hanno ricevuta una da testare. Nvidia sapeva senza dubbio che il suo messaggio sarebbe stato oscurato dai confronti tra Titan RTX e l’altra scheda basata su TU102, GeForce RTX 2080 Ti, nei giochi. Basato su un processore TU102 completo, Titan RTX era destinato a essere più veloce della GeForce in tutti i benchmark, indipendentemente dalla disciplina. Tuttavia, il suo prezzo sbalorditivo di $ 2.500 sarebbe difficile da giustificare solo per l’intrattenimento.

    Ma anche se i giocatori riflettono sull’effetto di quattro Streaming Multiprocessor in più sui loro frame rate, sappiamo tutti che Titan RTX non era destinato a quelle persone. Ovviamente, lo faremo ancora attraverso la nostra suite di benchmark di gioco. Tuttavia, Nvidia afferma che questa scheda è stata progettata per “ricercatori di intelligenza artificiale, sviluppatori di deep learning, data scientist, creatori di contenuti e artisti”.

    AMD RX Vega 64 (Blue AMD) su Amazon per $ 1.750

    I partecipanti a quei segmenti con tasche particolarmente profonde spesso scelgono piattaforme basate su Tesla o schede Quadro con driver certificati. Quelli non sono sempre necessari, però. Di conseguenza, i professionisti “sensibili ai costi” che lavorano in negozi più piccoli si trovano da qualche parte nel mezzo, avendo bisogno di più di una GeForce ma incapaci di spendere $ 6.300 per una Quadro RTX 6000 equivalente.

    Per necessità, la nostra suite di test si sta espandendo per includere visualizzazione professionale e metriche di deep learning, oltre all’analisi del consumo energetico che ci piace eseguire. Preparati per un confronto a tre tra Titan RTX, Titan V e Titan Xp (con un po’ di GeForce RTX 2080 Ti spruzzata).

    Incontra Titan RTX: inizia con un TU102 completo

    Il pubblico di Tom’s Hardware dovrebbe ormai conoscere bene la GPU TU102 di Nvidia: è il motore al centro della GeForce RTX 2080 Ti, composta da 18,6 miliardi di transistor e misura 754 millimetri quadrati.

    Come appare nel 2080 Ti, tuttavia, TU102 dispone di 68 multiprocessori di streaming attivi. Quattro dei 72 del chip sono spenti. Anche uno dei suoi controller di memoria a 32 bit è disabilitato, portando con sé otto ROP e 512 KB di cache L2.

    Titan RTX si basa sullo stesso processore, ma con ogni blocco attivo. Ciò significa che la scheda vanta una GPU con 72 SM, 4.608 core CUDA, 576 core Tensor, 72 core RT, 288 unità texture e 36 motori PolyMorph.

    Non solo Titan RTX sfoggia più core CUDA rispetto a GeForce RTX 2080 Ti, ma offre anche una frequenza di clock GPU Boost più elevata (1.770 MHz contro 1.635 MHz). In quanto tale, la sua velocità massima di precisione singola aumenta a 16,3 TFLOPS.

    Ogni SM contiene anche una coppia di core CUDA compatibili con FP64, ottenendo una velocità di doppia precisione pari a 1/32 delle prestazioni FP32 di TU102 o 0,51 TFLOPS. Questa è un’area in cui Titan RTX perde molto rispetto al suo predecessore. Il processore GV100 di Titan V è migliore nello spazio HPC grazie alle prestazioni FP64 di picco di 6,9 TFLOPS (la metà della sua velocità di precisione singola). Un rapido esame del benchmark aritmetico Sandra GPGPU di SiSoftware conferma la forza di Titan V, insieme al supporto di precisione mista inerente a Turing e Volta, di cui Pascal manca.

    I GPC della GPU sono alimentati da 12 controller di memoria GDDR6 a 32 bit, ciascuno collegato a un cluster da otto ROP e 512 KB di cache L2 che producono un bus di memoria aggregato a 384 bit, 96 ROP e una cache L2 da 6 MB. Alla stessa velocità di trasmissione dati di 14 Gb/s, una postazione di memoria aggiuntiva acquista a Titan RTX circa il 9% in più di larghezza di banda della memoria rispetto a GeForce RTX 2080 Ti.

    Titano RTX
    GeForce RTX 2080 Ti FE
    Titano V
    Titan Xp

    Architettura (GPU)
    Turing (TU102)
    Turing (TU102)
    Volta (GV100)
    Pascal (GP102)

    Nuclei CUDA
    4608
    4352
    5120
    3840

    Picco di calcolo FP32
    16.3 TFLOPS
    14.2 TFLOPS
    14.9 TFLOPS
    12.1 TFLOPS

    Nuclei tensoriali
    576
    544
    640
    N / A

    Nuclei RT
    72
    68
    N / A
    N / A

    Unità di trama
    288
    272
    320
    240

    Frequenza di clock di base
    1.350 MHz
    1.350 MHz
    1.200 MHz
    1.404 MHz

    Velocità di incremento della GPU
    1.770 MHz
    1.635 MHz
    1.455 MHz
    1.582 MHz

    Capacità di memoria
    24GB GDDR6
    11GB GDDR6
    12GB HBM2
    12GB GDDR5X

    Bus di memoria
    384 bit
    352 bit
    3.072 bit
    384 bit

    Banda di memoria
    672 GB/s
    616 GB/s
    653 GB/s
    547,7 GB/s

    ROP
    96
    88
    96
    96

    Cache L2
    6 MB
    5,5 MB
    4,5 MB
    3 MB

    TDP
    280 W
    260 W
    250 W
    250 W

    Conteggio transistor
    18,6 miliardi
    18,6 miliardi
    21,1 miliardi
    12 miliardi

    Dimensione del dado
    754 mm²
    754 mm²
    815 mm²
    471 mm²

    Supporto SLI
    Sì (x8 NVLink, x2)
    Sì (x8 NVLink, x2)
    No
    Sì (MIO)

    Mentre GeForce RTX 2080 Ti Founders Edition utilizza i moduli MT61K256M32JE-14:A di Micron, l’azienda non ha circuiti integrati da 16 Gb nel suo catalogo delle parti. Samsung, d’altra parte, offre un modulo K4ZAF325BM-HC14 a densità più elevata con una velocità dati di 14 Gb/s. Dodici di loro danno a Titan RTX la sua capacità di 24 GB e un throughput di picco di 672 GB/s.  

    Molta memoria extra, una GPU con più risorse attive e frequenze di clock più elevate richiedono una maggiore potenza nominale di progettazione termica. Mentre la GeForce RTX 2080 Ti Founders Edition è specificata a 260 W, Titan RTX è una scheda da 280 W. Quell’aumento di 20 W non è affatto un problema per la coppia di connettori di alimentazione ausiliaria a otto pin che si trovano lungo il bordo superiore, né è una sfida per l’alimentazione e la soluzione termica di Nvidia, che sembrano entrambe identiche alla sua GeForce RTX 2080 Ti.

    Come la 2080 Ti Founders Edition, contiamo tre fasi per la memoria GDDR6 di Titan RTX e un corrispondente controller PWM in anticipo. Rimangono in totale 13 fasi. Cinque fasi sono alimentate dai connettori a otto pin e raddoppiate. Con due circuiti di controllo per fase, 5*2=10 circuiti di regolazione della tensione. Le restanti tre fasi a sinistra della GPU sono alimentate dallo slot PCIe della scheda madre e non raddoppiate. Questo ci dà il numero fortunato 13 di Nvidia (insieme a uno schema di distribuzione del carico intelligente). Naturalmente, implementare tutto questo bene richiede i componenti giusti…

    In primo piano e al centro di questo design c’è il controller buck a otto fasi uP9512 di uPI progettato specificamente per supportare le GPU di nuova generazione. Secondo uPI, “l’uP9512 fornisce tensione di uscita programmabile e funzioni di posizionamento della tensione attiva per regolare la tensione di uscita in funzione della corrente di carico, quindi è posizionato in modo ottimale per un transitorio di corrente di carico”.

    L’uP9512 supporta la tecnologia Open Voltage Regulator Type 4i+ di Nvidia con PWMVID. Questo ingresso è tamponato e filtrato per produrre una tensione di riferimento molto precisa. La tensione di uscita viene quindi controllata con precisione sull’ingresso di riferimento. Un’interfaccia SMBus integrata offre flessibilità sufficiente per ottimizzare prestazioni ed efficienza, facilitando anche la comunicazione con il software appropriato. Tutti i 13 circuiti di regolazione della tensione sono dotati di un modulo Smart Power Stage FDMF3170 di ON Semiconductor con MOSFET PowerTrench e circuiti integrati di pilotaggio integrati.

    I circuiti integrati di memoria K4ZAF325BM-HC14 di Samsung sono alimentati da tre fasi provenienti da un secondo uP9512. Gli stessi moduli Smart Power Stage FDMF3170 riappaiono ancora. Le bobine da 470 mH offrono un’induttanza maggiore rispetto a quelle che si trovano sulle fasi di alimentazione della GPU, ma sono completamente identiche in termini di dimensioni fisiche.

    Sotto il cofano, anche la soluzione termica di Titan RTX è la stessa che abbiamo trovato su GeForce RTX 2080 Ti. Una camera di vapore a tutta lunghezza copre il PCB ed è sormontata da una pila di alette in alluminio. Una copertura sopra il dissipatore di calore ospita due ventole assiali da 8,5 cm con 13 pale ciascuna. Queste ventole soffiano attraverso le alette e scaricano il calore di scarto dai bordi superiore e inferiore della scheda. Anche se non ci piace necessariamente che Nvidia ricircoli l’aria calda con i suoi dissipatori di riferimento basati su Turing, le loro prestazioni sono certamente superiori alle precedenti configurazioni in stile soffiante.

    Il backplate di Titan RTX non è solo per l’aspetto. Nvidia incorpora la piastra nel suo concetto di raffreddamento inserendo i pad termici tra il metallo e il PCB, dietro dove si trovano i moduli di memoria in primo piano. L’azienda probabilmente avrebbe potuto fare a meno del pad sotto TU102, però: le nostre misurazioni non hanno mostrato differenze quando l’abbiamo rimosso.

    Non dovrebbe sorprendere che lo stesso PCB, gli stessi componenti, lo stesso dissipatore e le stesse dimensioni producano una scheda dallo stesso peso anche della GeForce RTX 2080 Ti. Il nostro Titan RTX registra 2 libbre. 14,6 once (1.322 kg) su una scala. Anche l’adesivo sul retro di Titan RTX dice GeForce RTX 2080 Ti. Nvidia differenzia la scheda esteticamente con una finitura oro opaco (piuttosto che argento), con accenti in oro lucido attorno alle ventole e alla copertura. Un logo Titan dorato lucido sul bordo superiore si illumina di bianco sotto il potere.

    Come abbiamo testato Titan RTX

    Il benchmarking Titan RTX è un po’ più complesso di una tipica scheda grafica da gioco. Poiché gestivamo carichi di lavoro di visualizzazione, deep learning e giochi professionali, abbiamo finito per utilizzare più macchine per soddisfare i requisiti di queste applicazioni disparate.

    Per facilitare i test di deep learning, abbiamo impostato una CPU Core i7-8086K (6C/12T) su una scheda madre Gigabyte Z370 Aorus Ultra Gaming. Tutti e quattro i suoi slot di memoria sono stati popolati con moduli Corsair Vengeance LPX da 16 GB a DDR4-2400, per un totale di 64 GB. Quindi, abbiamo caricato Ubuntu 18.04 LTS su un Intel SSD DC P3700 da 1,6 TB. Titan RTX viene confrontato con Titan V, Titan Xp e GeForce RTX 2080 Ti in questi benchmark.

    Per una visualizzazione professionale, abbiamo impostato una CPU Core i7-8700K (6C/12T) su una scheda madre MSI Z370 Gaming Pro Carbon AC. Ancora una volta, tutti e quattro i suoi slot di memoria sono stati popolati con moduli Corsair Vengeance LPX da 16 GB a DDR4-2400, per un totale di 64 GB. Quindi, abbiamo caricato Windows 10 Professional su un’unità SSD Intel serie 750 da 1,2 TB. Per inciso, questo è lo stesso sistema che esegue il nostro software Powenetics per la misurazione del consumo energetico. Titan RTX viene confrontato con Titan V, Titan Xp e GeForce RTX 2080 Ti in questi benchmark.

    Infine, raccogliamo i risultati di gioco sullo stesso Core i7-7700K utilizzato nelle recensioni precedenti. Popola una scheda madre MSI Z170 Gaming M7, che ospita anche il kit di memoria F4-3000C15Q-16GRR di G.Skill. L’SSD MX200 di Crucial rimane, affiancato da un Intel DC P3700 da 1,6 TB carico di giochi. Titan RTX viene confrontato con Aorus GeForce RTX 2080 Ti Xtreme 11G di Gigabyte, GeForce RTX 2080 Ti Founders Edition, Titan V, GeForce RTX 2080, GeForce RTX 2080, GeForce GTX 1080 Ti, Titan X, GeForce GTX 1070 Ti, GeForce GTX 1070, Radeon RX Vega 64 e Radeon RX Vega 56 in questi benchmark.

    Tutte queste carte sono state testate a 2560×1440 e 3840×2160 in Ashes of the Singularity: Escalation, Battlefield V, Destiny 2, Far Cry 5, Forza Motorsport 7, Grand Theft Auto V, Metro: Last Light Redux, Rise of the Tomb Raider, Tom Clancy’s The Division, Tom Clancy’s Ghost Recon Wildlands, The Witcher 3 e Wolfenstein II: The New Colossus.

    Abbiamo invitato AMD a presentare un prodotto più orientato al calcolo per il nostro deep learning e test delle workstation. Tuttavia, i rappresentanti dell’azienda non hanno risposto dopo aver inizialmente esaminato la richiesta. Fortunatamente, dovremmo testare Radeon VII molto presto.

    La metodologia di test che stiamo utilizzando proviene da PresentMon: Performance In DirectX, OpenGL e Vulkan. In breve, questi giochi vengono valutati utilizzando una combinazione di OCAT e la nostra GUI interna per PresentMon, con registrazione tramite GPU-Z.

    Quando generiamo nuovi dati, utilizziamo i driver più recenti. Per Linux, ciò significava utilizzare 415.18 per Titan RTX e Titan V, e quindi 410.93 per Titan Xp. In Windows 10, abbiamo scelto il driver della stampante 417.26 di Nvidia per Titan RTX, 417.22 per la scheda Gigabyte, 416.33 per GeForce RTX 2070 e 411.51 per 2080/2080 Ti FE. Le vecchie schede basate su Pascal sono state testate con la build 398.82. I risultati di Titan V sono stati controllati a campione con 411,51 per garantire che le prestazioni non cambiassero. Le schede AMD utilizzano Crimson Adrenalin Edition 18.8.1 (ad eccezione dei test Battlefield V e Wolfenstein, che sono testati con Adrenalin Edition 18.11.2).

    Un ringraziamento speciale a Noctua per aver inviato un lotto di dissipatori di calore NH-D15S con ventole. Questi sono i migliori di tutti e tre i sistemi, dandoci coerenza nel raffreddamento efficace e silenzioso.

    0 0 votes
    Rating post
    Subscribe
    Notificami
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x