GP102 ile tanışın
Editörün Notu: Yedi ve sekizinci sayfalarda güç, ısı ve gürültü ölçümlerini içerecek şekilde makaleyi güncelledik ve bu ölçümleri yansıtmak için sonucumuzda düzenlemeler yaptık (bkz. sayfa 10).
İngiliz Sterlini’ni Japon Yeni’ne karşı takas etme konusunda bir hüneriniz var. Harika bir acı sos tarifiniz var ve dünya çapında dağıtımda. Kayınpederinizin firmasına ortak oldunuz. Durum ne olursa olsun, para konusunda gerçekten endişelenmeyen o elit gruptasınız. Sahil evi, Bentley ve Bulgari sizde. Ve şimdi Nvidia’nın oyun PC’niz için bir grafik kartı var: Titan X. 3584 CUDA çekirdeğine sahip yeni bir GP102 grafik işlemcisi üzerine inşa edilmiştir, 384-bit veri yolunda 12 GB GDDR5X bellek ile desteklenir ve özür dilemeden 1200 $’a sunulur.
Tek bir kıyaslama henüz yayınlanmadan önce Nvidia, birkaç ay içinde Pascal tabanlı üçüncü bir GPU’yu piyasaya sürdüğü için övgü aldı ve amiral gemisinin fiyatını yükselttiği için eleştiri aldı – Core i7-6950X’i benzeri görülmemiş bir 1700 dolardan fazla fiyata tanıttığında Intel’i yakan bir yaklaşım. . Yine de şu var: En iyinin en iyisini satın alan insanlar, sürünen bir lüks vergisinden etkilenmezler. Ve bilgisayarlarıyla gerçekten para kazananlar, gelirlerini hızlandırabilecek donanımlar için neşeyle prim ödüyorlar.
Bütün bunlar Titan X ile geçirdiğimiz zamanı biraz daha az garip kılıyor, diye düşünüyoruz. Ertesi gün değeri dikkate alınmaz. %40 daha fazla CUDA çekirdeği ve %50 bellek bant genişliği artışı için GeForce GTX 1080’nin maliyetinden %70 daha fazla ödersiniz. Daha bir kart almadan önce performansın maliyetle orantılı olmayacağını biliyorduk. Yine de, kriterleri çalıştırmak için sabırsızlanıyorduk. Titan X, maksimum kaliteli oyun için 1080 yetersiz diyen koltuk oyun kurucularını tatmin edecek kadar 4K’da kare hızlarını iyileştiriyor mu? Bunu öğrenmenin tek yolu var.
GP102: GP104 gibi, Daha Büyük Hariç
Nvidia, GeForce GTX 1080 ile bizi GP104 (üst düzey Pascal) işlemciyle tanıştırdı. Özünde, bu GPU, en son GeForce GTX 980’in kalbinde görülen GM204’ü (üst düzey Maxwell) başardı. Ancak Pascal mimarisinin zamanlaması 16nm FinFET üretimi ve daha hızlı GDDR5X bellek ile çakışacak şekilde ayarlandığından, sonuçta ortaya çıkan GTX 1080’yi koymakta sorun yaşamadı. her ikisi de GM200 (ultra üst düzey Maxwell) tarafından desteklenen GTX 980 Ti ve Titan X’e göre %30’dan fazla daha yüksek ortalama kare hızı. Bu, özellikle 15,3 milyar transistörlü GP100’ün (ultra üst düzey Pascal) hesaplama odaklı olduğunu ve muhtemelen masaüstüne yönelik olmadığını bildiğimiz için bir sonraki adımı unutmayı kolaylaştırdı.
Şimdi, ilk kez, Nvidia’nın en üst düzey işlemcisi ve GP104 ile çevrelenmiş bir “tweener” GPU’muz var. Buna GP102 denir ve mimari olarak GP104’e benzer, sadece daha büyüktür. Dört Grafik İşleme Kümesi altı olur. Sırayla, 20 Akış Çok İşlemcisi 30 olur. Ve SM başına 128 FP32 CUDA çekirdeği ile GP102, programlanabilir yapı taşlarının 3840’a kadarını kullanır. GP102 inanılmaz derecede karmaşıktır (12 milyar transistörden oluşur). Verimi artırmanın bir yolu olarak Nvidia, Titan X için işlemcinin iki SM’sini devre dışı bırakarak anakartın CUDA çekirdek sayısını 3584’e indirdi. Ve her SM ayrıca sekiz doku birimi barındırdığından, ikisini kapattığınızda 224 doku birimi etkin kalıyor.
Titan X’in spesifikasyonu, 1531 MHz aralığında tipik GPU Boost frekansları ile 1417 MHz temel saat hızından bahsediyor. Bu, karta GeForce GTX 1080’den yaklaşık %23 daha yüksek olan 10.1+ TFLOPS FP32 oranı verir.
Hiç şüphe yok ki GP104, özellikle 4K’da daha da geniş bir bellek arayüzünden faydalanacaktı. Ancak GP102’nin daha büyük gölgeleme/tekstüre etme potansiyeli kesinlikle bir tür yeniden dengeleme gerektiriyor. Bu nedenle, işlemcinin arka ucu, her biri sekiz ROP’a ve 256 KB L2’ye (GP104’te olduğu gibi) bağlı 12 32 bit bellek denetleyicisi içerecek şekilde büyür ve toplam 96 ROP ve 3 MB paylaşılan önbellek sağlar. Bu, Nvidia’nın GTX 1080’de bulunan aynı 10 Gb/sn GDDR5X’in 12 GB’ı ile doldurduğu 384 bitlik bir toplama yolu ile sonuçlanır.
Kartın teorik bellek bant genişliği 480 GB/sn (1080’in 320 GB/sn’ye kıyasla – %50 artış), ancak Pascal mimarisinin delta renk sıkıştırma iyileştirmeleri dikkate alındıktan sonra etkin verim daha yüksek olmalıdır.
AMD bize bir yıldan fazla bir süre önce HBM’nin birçok faydasını gösterdiğinde neden GDDR5’ten türetilen teknolojinin sürekli kullanımı? GP102’nin tasarım aşamasında, Nvidia’nın HBM2 arzının nasıl sallanacağından emin olmadığını ve bunun yerine GDDR5X tabanlı bir alt sistemle güvenli oynadığını hayal edebiliyoruz. GP100, HBM2 serisindeki tek GPU olmaya devam ediyor.
GPUTitan X (GP102)GeForce GTX 1080 (GP104)Titan X (GM100) SMs CUDA Çekirdekleri Temel Saat GPU Boost Saati GFLOP’lar (Temel Saat) Doku Birimleri Texel Doldurma Hızı Bellek Veri Hızı Bellek Bant Genişliği ROP’lar L2 Önbellek TDP Transistörler Kalıp Boyutu İşlem Düğümü
28
20
24
3584
2560
3072
1417 MHz
1607 MHz
1000 MHz
1531 MHz
1733 MHz
1075 MHz
10,157
8228
6144
224
160
192
342.9 GT/s
277.3 GT/s
192 GT/s
10 Gb/sn
10 Gb/sn
7 Gb/sn
480 GB/sn
320 GB/sn
336,5 GB/sn
96
64
96
3MB
2MB
3MB
250W
180W
250W
12 milyar
7,2 milyar
8 milyar
471 mm²
314 mm²
601 mm²
16nm
16nm
28nm
Nvidia’nın görünüşe göre son dakikada Titan X’i GeForce ailesinden uzaklaştırmayı seçmesi ilginç. geforce.com’daki Titan X açılış sayfası, buna nihai grafik kartı diyor. Nihai oyun grafik kartı değil. Bunun yerine, “Nihai. Dönem.” Tabii ki, büyük boyutlu bir GP104 ile uğraştığımız göz önüne alındığında, Titan X oyun oynamada iyi olmalı.
Ancak şirketin Titan X’i Stanford’da düzenlenen bir AI buluşmasında açıklama kararı, bu sefer derin öğrenmeye odaklandığını gösteriyor. Bu amaçla, FP16 ve FP64 oranları GP104’te (ve buna bağlı olarak GP102’de) feci şekilde yavaşken, her iki işlemci de 4:1’de INT8’i destekliyor ve Titan X’in temel frekansında 40.6 TOPS veriyor.