Temui TU102 dan GeForce RTX 2080 Ti
Nvidia memanggil Turing lompatan seni bina terbesarnya dalam lebih 10 tahun. Untuk membuktikannya, syarikat itu mempamerkan ringkasan keupayaan berpandangan ke hadapan yang mempercepatkan prestasi dalam permainan hari ini, memperkenalkan kecerdasan buatan kepada grafik desktop, menjadikan pengesanan sinar masa nyata berdaya maju buat kali pertama, mempercepatkan penstriman video dan menyokong perkakasan VR generasi akan datang.
Tetapi ada satu masalah dengan mengambil pusingan kemenangan sebelum loceng pembukaan berbunyi: jangkaan ditetapkan sangat, sangat tinggi.
Kebanyakan ciri Turing yang paling mencolok belum dapat diuji lagi. Dan walaupun kad GeForce RTX 2080 Ti dan 2080 mula muncul di makmal Perkakasan Tom, pemandu tetap dikawal ketat oleh Nvidia. Sungguh, tiada cara untuk mengetahui prestasi perkara ini merentas suite penanda aras kami. Tetapi kami tahu sedikit tentang seni bina Turing yang mendasari. Kami juga boleh memberitahu anda tentang TU102, TU104 dan TU106—tiga GPU Turing yang pertama—serta produk Edisi Pengasas berdasarkan pemproses tersebut.
Ia amat jelas kepada semua orang bahawa Nvidia akan muncul di sisi lain pelancaran Turing ini dengan kad grafik permainan terpantas yang boleh anda beli. Apa yang masih tidak pasti ialah sama ada harga syarikat yang menaikkan kening, antara $600 hingga $1200, mewajarkan peningkatan sekarang atau menggalakkan pemain untuk menangguhkan sehingga pengesanan sinar memperoleh momentum.
Grand Turing: Temui GPU TU102
Bahagian tengah smorgasbord tertumpu grafik hari ini ialah TU102, GPU 754 milimeter persegi yang terletak di tengah-tengah GeForce RTX 2080 Ti Nvidia. 18.6 bilion transistornya direka pada proses pembuatan FinFET 12nm TSMC, yang kononnya mencerminkan peningkatan ketumpatan sedikit berbanding nod 16nm TSMC sebelumnya. Faundri itu juga mengklasifikasikan teknologi 12nm di bawah payung yang sama seperti 16nm di laman webnya. Kami tidak biasa membuat liputan GPU permainan “besar” Nvidia pada masa yang sama dengan seni bina baharu. Tetapi Nvidia tahu bahawa untuk pengesanan sinar masa nyata untuk menarik minat peminat, ia perlu berjalan pada kadar bingkai yang lancar. Penyerahan TU102 ke tangan pengguna awal adalah kritikal kali ini.
Berbanding dengan GPU berasaskan Pascal terbesar yang digunakan dalam kad grafik desktop, GP102, TU102 Nvidia adalah 60% lebih besar dengan kiraan transistor 55% lebih tinggi. Tetapi ia bukan pemproses paling besar syarikat. Kapal perdana berasaskan Turing dikalahkan oleh GV100, sebuah raksasa transistor 21.1 bilion berukuran 815mm². GPU itu telah diperkenalkan pada 2017 dengan penekanan pada aplikasi pusat data, dan masih terdapat pada $3000 Titan V.
TU102 disasarkan kepada pasaran sasaran yang berbeza daripada GV100, dan seterusnya diperuntukkan dengan senarai sumber untuk dipadankan. Walaupun elemen Turing meminjam daripada kerja Nvidia dalam Volta/GV100, kepingan seni bina yang sama ada tidak memberi manfaat kepada pemain atau tidak kos efektif pada desktop sengaja dilucutkan.
Contohnya, setiap Volta Streaming Multiprocessor (SM) menyertakan 32 teras FP64 untuk matematik berketepatan berkembar yang pantas, menambah sehingga 2688 teras FP64 merentas GV100. Mereka tidak begitu berguna dalam permainan walaupun, dan mereka memakan banyak ruang die, jadi Nvidia menarik kesemuanya kecuali dua daripada setiap Turing SM. Akibatnya, kadar ketepatan berganda TU102 ialah 1/32 daripada prestasi FP32nya, meninggalkan pengiraan FP64 yang mencukupi untuk mengekalkan keserasian dengan perisian yang bergantung padanya. Begitu juga, lapan pengawal memori 512-bit GV100 yang dilampirkan pada empat susunan HBM2 akan menjadi sangat mahal (cuma tanya AMD tentang masalah yang dihadapinya untuk menetapkan harga Radeon yang dilengkapi HBM2 secara kompetitif). Oleh itu, mereka telah digantikan dengan GDDR6 buatan Micron, memudahkan penyelesaian yang lebih murah yang masih mampu memberikan peningkatan lebar jalur yang besar berbanding pendahulu berasaskan Pascal.
Pemproses TU102 yang lengkap terdiri daripada enam Kluster Pemprosesan Grafik (GPC) yang terdiri daripada Enjin Raster dan enam Kluster Pemprosesan Tekstur (TPC). Setiap TPC terdiri daripada satu Enjin PolyMorph (talian paip geometri fungsi tetap) dan dua Multipemproses Penstriman (SM). Sekali lagi, di peringkat SM, kami mendapati 64 teras CUDA, lapan teras Tensor, satu teras RT, empat unit tekstur, 16 unit muat/simpan, 256KB ruang fail daftar, empat cache arahan L0 dan cache L1 yang boleh dikonfigurasikan/kongsi 96KB struktur ingatan.
Darabkan semua itu dan anda mendapat GPU dengan 72 SM, 4608 teras CUDA, 576 teras Tensor, 72 teras RT, 288 unit tekstur dan 36 enjin PolyMorph.
Sumber tersebut diberi makan oleh 12 pengawal memori GDDR6 32-bit, masing-masing dilampirkan pada kluster lapan ROP dan 512KB cache L2 yang menghasilkan bas memori 384-bit agregat, 96 ROP dan cache L2 6MB.
Menggabungkan Semuanya: GeForce RTX 2080 Ti
TU102 yang ditemui pada GeForce RTX 2080 Ti bukanlah pemproses yang lengkap. Sama ada Nvidia mahu meninggalkan ruang untuk model kelas Titan atau mendapati hasil GPU berfungsi sepenuhnya tidak memuaskan di atas tong tertentu, RTX 2080 Ti mempunyai dua TPCnya dilumpuhkan, meninggalkan kad dengan teras CUDA 4352, teras Tensor 544, 68 Teras RT, 544 unit tekstur dan 34 enjin PolyMorph.
Selain itu, salah satu pengawal memori 32-bit TU102 dimatikan, mencipta bas 352-bit agregat yang memindahkan data ke 88 ROP dan 5.5MB cache L2. Nvidia memadankan GPU yang terpincang-pincang secara strategik dengan modul MT61K256M32JE-14:A Micron. Sebelas daripada ini mengisi PCB RTX 2080 Ti, meninggalkan satu tempat kosong. Namun begitu, lebar jalur puncak teori meningkat dengan mendadak berbanding kad generasi sebelumnya disebabkan oleh kadar data GDDR6 yang lebih tinggi: pada 14 Gb/s pada antara muka 352-bit, anda melihat pada 616 GB/s. Sebagai perbandingan, GDDR5X pada 11 Gb/s memegang GeForce GTX 1080 Ti hingga 484 GB/s.
GeForce RTX 2080 Ti FE
GeForce GTX 1080 Ti FE
Seni Bina (GPU)
Turing (TU102)
Pascal (GP102)
Teras CUDA
4352
3584
Pengiraan Puncak FP32
14.2 TFLOPS
11.3 TFLOPS
Teras Tensor
544
T/A
Teras RT
68
T/A
Unit Tekstur
272
224
Kadar Jam Asas
1350 MHz
1480 MHz
Kadar Peningkatan GPU
1635 MHz
1582 MHz
Kapasiti Memori
11GB GDDR6
11GB GDDR5X
Bas Memori
352-bit
352-bit
Lebar Jalur Memori
616 GB/s
484 GB/s
ROP
88
88
L2 Cache
5.5MB
2.75MB
TDP
260W
250W
Kiraan Transistor
18.6 bilion
12 bilion
Saiz Mati
754 mm²
471 mm²
Sokongan SLI
Ya (x8 NVLink, x2)
Ya (MIO)
Sekurang-kurangnya pada kad Edisi Pengasas, frekuensi teras asas 1350 MHz melonjak sehingga ke kadar Galak GPU biasa 1635 MHz, selagi GeForce RTX 2080 Ti berjalan dengan cukup sejuk. Dan kerana Nvidia memetik prestasi pengiraan puncak menggunakan nombor GPU Boost, model atasannya mencapai sehingga 14.2 TFLOPS matematik ketepatan tunggal.
Spesifikasi rujukan memerlukan kekerapan GPU Boost 1545 MHz dan TDP yang lebih rendah sedikit. Manakala overclock kad Edisi Pengasas mengenakan kuasa papan maksimum sebanyak 260W, pelaksanaan kelas rujukan sepatutnya berkurangan dalam sekitar 250W.
Kedua-dua konfigurasi mempunyai dua antara muka NVLink untuk sambungan berbilang GPU. Teknologi ini diliputi dengan lebih mendalam lagi, tetapi secara ringkasnya, setiap pautan x8 membolehkan 50 GB/s lebar jalur dua arah untuk menyokong resolusi yang lebih tinggi dan kadar muat semula yang lebih pantas. Pada GeForce RTX 2080 Ti, 100 GB/s jumlah pemprosesan sudah memadai untuk monitor 8K dalam mod Surround.