Poznaj GP102
Uwaga redaktora: Zaktualizowaliśmy artykuł, aby uwzględnić pomiary mocy, ciepła i hałasu na stronach siódmej i ósmej, a także dokonaliśmy zmian w naszym wniosku, aby odzwierciedlić te pomiary (patrz strona 10).
Masz smykałkę do handlu funtem brytyjskim z jenem japońskim. Masz przepis na zabójczy ostry sos, który jest w dystrybucji na całym świecie. Właśnie zostałaś partnerem w firmie swojego teścia. W każdym razie jesteś w tej elitarnej grupie, która tak naprawdę nie przejmuje się pieniędzmi. Masz dom na plaży, Bentley i Bulgari. A teraz Nvidia ma kartę graficzną dla twojego komputera do gier: Titan X. Jest on zbudowany na nowym procesorze graficznym GP102 z 3584 rdzeniami CUDA, wspieranym przez 12 GB pamięci GDDR5X na magistrali 384-bitowej i jest oferowany bez przepraszam za 1200 USD.
Zanim opublikowano jeden test porównawczy, Nvidia otrzymała pochwały za wprowadzenie na rynek trzeciego procesora graficznego opartego na Pascalu w ciągu wielu miesięcy i krytykę za podniesienie ceny swojego flagowego produktu — podejście, które spaliło Intela, gdy wprowadził Core i7-6950X w bezprecedensowej cenie ponad 1700 USD. . Oto jednak rzecz: ludzie, którzy kupują to, co najlepsze z najlepszych, nie są objęci pełzającym podatkiem od luksusu. A ci, którzy faktycznie zarabiają na swoich komputerach, wesoło płacą premie za sprzęt, który może przyspieszyć ich dochody.
Wszystko to sprawia, że nasz czas z Titan X jest trochę mniej niezręczny. Nie ma rozważania o wartości „dzień po”. Płacisz 70% więcej niż koszt GeForce GTX 1080 za 40% więcej rdzeni CUDA i 50% zwiększenie przepustowości pamięci. Jeszcze przed otrzymaniem karty wiedzieliśmy, że wydajność nie będzie się zwiększać wraz z kosztami. Mimo to nie mogliśmy się doczekać, aż uruchomimy testy porównawcze. Czy Titan X poprawia liczbę klatek na sekundę w rozdzielczości 4K na tyle, aby zadowolić rozgrywających na fotelach, którzy szybko uznają 1080 za niewystarczający do grania w najwyższej jakości? Jest tylko jeden sposób, żeby się dowiedzieć.
GP102: to jak GP104, z wyjątkiem większego
Dzięki GeForce GTX 1080, Nvidia przedstawiła nam procesor GP104 (high-end Pascal). W duchu ten procesor graficzny zastąpił GM204 (wysokiej klasy Maxwell), ostatnio widziany w sercu GeForce GTX 980. Ale ponieważ architektura Pascal została zsynchronizowana z produkcją 16 nm FinFET i szybszą pamięcią GDDR5X, wynikowy GTX 1080 nie miał problemów z umieszczeniem o 30% wyższa średnia liczba klatek na sekundę niż w przypadku GTX 980 Ti i Titan X, obydwa napędzane przez GM200 (ultra-high-end Maxwell). To sprawiło, że łatwo było zapomnieć o kolejnym kroku w górę, zwłaszcza że wiedzieliśmy, że 15,3 miliarda tranzystorów GP100 (ultra-high-endowy Pascal) był zorientowany na obliczenia i prawdopodobnie nie był przeznaczony do komputerów stacjonarnych.
Teraz, po raz pierwszy, mamy coś w rodzaju „tweener GPU”, otoczonego najwyższej klasy procesorem Nvidii i GP104. Ten nazywa się GP102 i architektonicznie jest podobny do GP104, tylko większy. Cztery klastry przetwarzania grafiki stają się sześcioma. Z kolei 20 multiprocesorów strumieniowych staje się 30. A dzięki 128 rdzeniom FP32 CUDA na SM, GP102 posiada do 3840 programowalnych bloków konstrukcyjnych. GP102 jest jednak niezwykle złożony (składa się z 12 miliardów tranzystorów). Aby poprawić wydajność, Nvidia wyłącza dwa moduły SM procesora dla Titan X, co zmniejsza liczbę rdzeni CUDA płyty do 3584. A ponieważ każdy SM obsługuje również osiem jednostek tekstur, wyłączenie dwóch z nich pozostawia włączone 224 jednostki tekstur.
Specyfikacja Titan X podaje zegar bazowy 1417 MHz, z typowymi częstotliwościami GPU Boost w zakresie 1531 MHz. Daje to karcie współczynnik FP32 równy 10,1+ TFLOPS, czyli około 23% wyższy niż GeForce GTX 1080.
Bez wątpienia GP104 skorzystałby na jeszcze szerszym interfejsie pamięci, szczególnie w rozdzielczości 4K. Ale większy potencjał cieniowania/teksturowania GP102 zdecydowanie wymaga pewnego rodzaju zrównoważenia. W związku z tym back-end procesora rośnie i obejmuje 12 32-bitowych kontrolerów pamięci, z których każdy jest powiązany z ośmioma ROP i 256 KB L2 (jak w GP104), co daje łącznie 96 ROP i 3 MB współdzielonej pamięci podręcznej. Daje to zagregowaną ścieżkę 384 bitów, którą Nvidia wypełnia 12 GB tej samej pamięci GDDR5X 10 Gb/s, którą można znaleźć w GTX 1080.
Teoretyczna przepustowość pamięci karty wynosi 480 GB/s (w porównaniu do 320 GB/s w przypadku 1080 — wzrost o 50%), chociaż efektywna przepustowość powinna być wyższa po uwzględnieniu poprawy kompresji kolorów delta w architekturze Pascal.
Dlaczego nieustanne korzystanie z technologii wywodzącej się z GDDR5, skoro AMD ponad rok temu pokazało nam wiele zalet HBM? Możemy sobie tylko wyobrazić, że podczas fazy projektowania GP102, Nvidia nie była pewna, jak wykruszy się dostawa HBM2 i zamiast tego grała bezpiecznie z podsystemem opartym na GDDR5X. GP100 pozostaje jedynym GPU w swojej ofercie z HBM2.
GPUTitan X (GP102)GeForce GTX 1080 (GP104)Titan X (GM100) SMs Rdzenie CUDA Zegar bazowy Zegar doładowania GPU GFLOP (zegar bazowy) Jednostki tekstury Pamięć szybkości wypełniania Texel Szybkość transmisji danych Przepustowość pamięci ROP Pamięć podręczna L2 Tranzystory TDP Rozmiar matrycy Węzeł procesowy
28
20
24
3584
2560
3072
1417 MHz
1607 MHz
1000 MHz
1531 MHz
1733 MHz
1075 MHz
10157
8228
6144
224
160
192
342,9 GT/s
277,3 GT/s
192 GT/s
10 Gb/s
10 Gb/s
7 Gb/s
480 GB/s
320 GB/s
336,5 GB/s
96
64
96
3MB
2MB
3MB
250W
180W
250W
12 miliardów
7,2 miliarda
8 miliardów
471 mm²
314 mm²
601 mm²
16nm
16nm
28nm
Interesujące jest to, że Nvidia najwyraźniej w ostatniej chwili zdecydowała się oddalić Titan X od swojej rodziny GeForce. Strona docelowa Titan X na geforce.com nazywa ją najlepszą kartą graficzną. Nie jest to najlepsza karta graficzna do gier. Raczej „Ostateczny. Okres.” Oczywiście, biorąc pod uwagę, że mamy do czynienia z większym GP104, Titan X powinien być dobry w grach.
Jednak decyzja firmy o zaprezentowaniu Titana X na spotkaniu AI organizowanym przez Stanford pokazuje, że tym razem koncentruje się ona na głębokim uczeniu. W tym celu, podczas gdy szybkości FP16 i FP64 są strasznie niskie na GP104 (i co za tym idzie, na GP102), oba procesory obsługują INT8 przy 4:1, dając 40,6 TOPS przy podstawowej częstotliwości Titan X.