Lompat ke konten

Seni Bina Turing Nvidia Dijelajahi: Di ​​Dalam GeForce RTX 2080

    1647427204

    Temui TU102 dan GeForce RTX 2080 Ti

    Nvidia memanggil Turing lompatan seni bina terbesarnya dalam lebih 10 tahun. Untuk membuktikannya, syarikat itu mempamerkan ringkasan keupayaan berpandangan ke hadapan yang mempercepatkan prestasi dalam permainan hari ini, memperkenalkan kecerdasan buatan kepada grafik desktop, menjadikan pengesanan sinar masa nyata berdaya maju buat kali pertama, mempercepatkan penstriman video dan menyokong perkakasan VR generasi akan datang.

    Tetapi ada satu masalah dengan mengambil pusingan kemenangan sebelum loceng pembukaan berbunyi: jangkaan ditetapkan sangat, sangat tinggi.

    Kebanyakan ciri Turing yang paling mencolok belum dapat diuji lagi. Dan walaupun kad GeForce RTX 2080 Ti dan 2080 mula muncul di makmal Perkakasan Tom, pemandu tetap dikawal ketat oleh Nvidia. Sungguh, tiada cara untuk mengetahui prestasi perkara ini merentas suite penanda aras kami. Tetapi kami tahu sedikit tentang seni bina Turing yang mendasari. Kami juga boleh memberitahu anda tentang TU102, TU104 dan TU106—tiga GPU Turing yang pertama—serta produk Edisi Pengasas berdasarkan pemproses tersebut.

    Ia amat jelas kepada semua orang bahawa Nvidia akan muncul di sisi lain pelancaran Turing ini dengan kad grafik permainan terpantas yang boleh anda beli. Apa yang masih tidak pasti ialah sama ada harga syarikat yang menaikkan kening, antara $600 hingga $1200, mewajarkan peningkatan sekarang atau menggalakkan pemain untuk menangguhkan sehingga pengesanan sinar memperoleh momentum.

    Grand Turing: Temui GPU TU102

    Bahagian tengah smorgasbord tertumpu grafik hari ini ialah TU102, GPU 754 milimeter persegi yang terletak di tengah-tengah GeForce RTX 2080 Ti Nvidia. 18.6 bilion transistornya direka pada proses pembuatan FinFET 12nm TSMC, yang kononnya mencerminkan peningkatan ketumpatan sedikit berbanding nod 16nm TSMC sebelumnya. Faundri itu juga mengklasifikasikan teknologi 12nm di bawah payung yang sama seperti 16nm di laman webnya. Kami tidak biasa membuat liputan GPU permainan “besar” Nvidia pada masa yang sama dengan seni bina baharu. Tetapi Nvidia tahu bahawa untuk pengesanan sinar masa nyata untuk menarik minat peminat, ia perlu berjalan pada kadar bingkai yang lancar. Penyerahan TU102 ke tangan pengguna awal adalah kritikal kali ini.

    Berbanding dengan GPU berasaskan Pascal terbesar yang digunakan dalam kad grafik desktop, GP102, TU102 Nvidia adalah 60% lebih besar dengan kiraan transistor 55% lebih tinggi. Tetapi ia bukan pemproses paling besar syarikat. Kapal perdana berasaskan Turing dikalahkan oleh GV100, sebuah raksasa transistor 21.1 bilion berukuran 815mm². GPU itu telah diperkenalkan pada 2017 dengan penekanan pada aplikasi pusat data, dan masih terdapat pada $3000 Titan V.

    TU102 disasarkan kepada pasaran sasaran yang berbeza daripada GV100, dan seterusnya diperuntukkan dengan senarai sumber untuk dipadankan. Walaupun elemen Turing meminjam daripada kerja Nvidia dalam Volta/GV100, kepingan seni bina yang sama ada tidak memberi manfaat kepada pemain atau tidak kos efektif pada desktop sengaja dilucutkan.

    Contohnya, setiap Volta Streaming Multiprocessor (SM) menyertakan 32 teras FP64 untuk matematik berketepatan berkembar yang pantas, menambah sehingga 2688 teras FP64 merentas GV100. Mereka tidak begitu berguna dalam permainan walaupun, dan mereka memakan banyak ruang die, jadi Nvidia menarik kesemuanya kecuali dua daripada setiap Turing SM. Akibatnya, kadar ketepatan berganda TU102 ialah 1/32 daripada prestasi FP32nya, meninggalkan pengiraan FP64 yang mencukupi untuk mengekalkan keserasian dengan perisian yang bergantung padanya. Begitu juga, lapan pengawal memori 512-bit GV100 yang dilampirkan pada empat susunan HBM2 akan menjadi sangat mahal (cuma tanya AMD tentang masalah yang dihadapinya untuk menetapkan harga Radeon yang dilengkapi HBM2 secara kompetitif). Oleh itu, mereka telah digantikan dengan GDDR6 buatan Micron, memudahkan penyelesaian yang lebih murah yang masih mampu memberikan peningkatan lebar jalur yang besar berbanding pendahulu berasaskan Pascal.

    Pemproses TU102 yang lengkap terdiri daripada enam Kluster Pemprosesan Grafik (GPC) yang terdiri daripada Enjin Raster dan enam Kluster Pemprosesan Tekstur (TPC). Setiap TPC terdiri daripada satu Enjin PolyMorph (talian paip geometri fungsi tetap) dan dua Multipemproses Penstriman (SM). Sekali lagi, di peringkat SM, kami mendapati 64 teras CUDA, lapan teras Tensor, satu teras RT, empat unit tekstur, 16 unit muat/simpan, 256KB ruang fail daftar, empat cache arahan L0 dan cache L1 yang boleh dikonfigurasikan/kongsi 96KB struktur ingatan.

    Darabkan semua itu dan anda mendapat GPU dengan 72 SM, 4608 teras CUDA, 576 teras Tensor, 72 teras RT, 288 unit tekstur dan 36 enjin PolyMorph.

    Sumber tersebut diberi makan oleh 12 pengawal memori GDDR6 32-bit, masing-masing dilampirkan pada kluster lapan ROP dan 512KB cache L2 yang menghasilkan bas memori 384-bit agregat, 96 ROP dan cache L2 6MB.

    Menggabungkan Semuanya: GeForce RTX 2080 Ti

    TU102 yang ditemui pada GeForce RTX 2080 Ti bukanlah pemproses yang lengkap. Sama ada Nvidia mahu meninggalkan ruang untuk model kelas Titan atau mendapati hasil GPU berfungsi sepenuhnya tidak memuaskan di atas tong tertentu, RTX 2080 Ti mempunyai dua TPCnya dilumpuhkan, meninggalkan kad dengan teras CUDA 4352, teras Tensor 544, 68 Teras RT, 544 unit tekstur dan 34 enjin PolyMorph.

    Selain itu, salah satu pengawal memori 32-bit TU102 dimatikan, mencipta bas 352-bit agregat yang memindahkan data ke 88 ROP dan 5.5MB cache L2. Nvidia memadankan GPU yang terpincang-pincang secara strategik dengan modul MT61K256M32JE-14:A Micron. Sebelas daripada ini mengisi PCB RTX 2080 Ti, meninggalkan satu tempat kosong. Namun begitu, lebar jalur puncak teori meningkat dengan mendadak berbanding kad generasi sebelumnya disebabkan oleh kadar data GDDR6 yang lebih tinggi: pada 14 Gb/s pada antara muka 352-bit, anda melihat pada 616 GB/s. Sebagai perbandingan, GDDR5X pada 11 Gb/s memegang GeForce GTX 1080 Ti hingga 484 GB/s.

    GeForce RTX 2080 Ti FE
    GeForce GTX 1080 Ti FE

    Seni Bina (GPU)
    Turing (TU102)
    Pascal (GP102)

    Teras CUDA
    4352
    3584

    Pengiraan Puncak FP32
    14.2 TFLOPS
    11.3 TFLOPS

    Teras Tensor
    544
    T/A

    Teras RT
    68
    T/A

    Unit Tekstur
    272
    224

    Kadar Jam Asas
    1350 MHz
    1480 MHz

    Kadar Peningkatan GPU
    1635 MHz
    1582 MHz

    Kapasiti Memori
    11GB GDDR6
    11GB GDDR5X

    Bas Memori
    352-bit
    352-bit

    Lebar Jalur Memori
    616 GB/s
    484 GB/s

    ROP
    88
    88

    L2 Cache
    5.5MB
    2.75MB

    TDP
    260W
    250W

    Kiraan Transistor
    18.6 bilion
    12 bilion

    Saiz Mati
    754 mm²
    471 mm²

    Sokongan SLI
    Ya (x8 NVLink, x2)
    Ya (MIO)

    Sekurang-kurangnya pada kad Edisi Pengasas, frekuensi teras asas 1350 MHz melonjak sehingga ke kadar Galak GPU biasa 1635 MHz, selagi GeForce RTX 2080 Ti berjalan dengan cukup sejuk. Dan kerana Nvidia memetik prestasi pengiraan puncak menggunakan nombor GPU Boost, model atasannya mencapai sehingga 14.2 TFLOPS matematik ketepatan tunggal.

    Spesifikasi rujukan memerlukan kekerapan GPU Boost 1545 MHz dan TDP yang lebih rendah sedikit. Manakala overclock kad Edisi Pengasas mengenakan kuasa papan maksimum sebanyak 260W, pelaksanaan kelas rujukan sepatutnya berkurangan dalam sekitar 250W.

    Kedua-dua konfigurasi mempunyai dua antara muka NVLink untuk sambungan berbilang GPU. Teknologi ini diliputi dengan lebih mendalam lagi, tetapi secara ringkasnya, setiap pautan x8 membolehkan 50 GB/s lebar jalur dua arah untuk menyokong resolusi yang lebih tinggi dan kadar muat semula yang lebih pantas. Pada GeForce RTX 2080 Ti, 100 GB/s jumlah pemprosesan sudah memadai untuk monitor 8K dalam mod Surround.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x