Przywitaj się z nowym procesorem graficznym opartym na Pascalu
Dwa miesiące po debiucie architektura Pascal firmy Nvidia powoli zapełnia portfolio kart graficznych firmy do komputerów stacjonarnych od góry do dołu. Najpierw pojawił się GeForce GTX 1080, oferujący ponad 30% wyższą wydajność niż GeForce GTX 980 Ti za mniej pieniędzy. Sprzedawcy internetowi nadal nie mogą ich przechowywać w magazynie (Newegg nie ma ich w chwili pisania tego tekstu). Następnie zostaliśmy przedstawieni GeForce GTX 1070, który również przewyższa 980 Ti za setki dolarów mniej.
Teraz dostaniemy trzecią kartę opartą na Pascalu w GeForce GTX 1060. Ogłosiliśmy już w tym miesiącu, że partnerzy Nvidii będą mieli wersje zaczynające się od 250 USD. Wdrożenie Founders Edition będzie kosztować 300 USD na nvidia.com oraz w sklepach Best Buy, więc nie zdziw się, jeśli nie znajdziesz ich gdzie indziej w Internecie.
GeForce GTX 1060 jest oparty na zupełnie nowym procesorze graficznym o nazwie GP106, który udostępnia wiele z tych samych funkcji, co GP104, ale w bardziej typowej obudowie. Nie pozwól jednak, aby ten termin Cię zniechęcił. 1060 może być kartą o mocy zaledwie 120 W, ale Nvidia twierdzi, że jest dobra dla liczby klatek na sekundę klasy GeForce GTX 980. Dwa lata temu ten poziom wydajności sprzedano za 550 dolarów. Z pewnością przebyliśmy długą drogę.
Poznaj GP106
Nvidia buduje swoją flagową kartę GeForce GTX 1080, korzystając z kompletnego procesora GP104 z włączonymi czterema klastrami przetwarzania grafiki. Daje to kartę z 2560 rdzeniami CUDA i 160 jednostkami tekstur. GTX 1070 skupia się na tym samym GPU z włączonymi trzema GPC, dodając do 1920 rdzeni i 120 jednostek tekstur.
GeForce GTX 1060 skaluje się w podobny sposób, wykorzystując te same elementy architektoniczne. Z naszej prezentacji dotyczącej premiery GeForce GTX 1080:
„Każdy GPC zawiera pięć klastrów przetwarzania wątków/tekstur oraz silnik rastrowy. W dalszej części TPC łączy w sobie jeden multiprocesor strumieniowy i silnik PolyMorph. SM łączy 128 rdzeni CUDA o pojedynczej precyzji, 256 KB pojemności pliku rejestru, 96 KB pamięci współdzielonej, 48 KB pamięci podręcznej L1/tekstury i osiem jednostek tekstur. Tymczasem silnik PolyMorph czwartej generacji zawiera nowy blok logiki, który znajduje się na końcu potoku geometrii i przed jednostką rastrową do obsługi funkcji symultanicznej multiprojekcji Nvidii”.
GPU
GeForce GTX 1060 (GP106)
GeForce GTX 980 (GM204)
SMSy
10
16
Rdzenie CUDA
1280
2048
Zegar bazowy
1506 MHz
1126 MHz
Zegar doładowania GPU
1708 MHz
1216 MHz
GFLOP (zegar bazowy)
3855
4612
Jednostki tekstury
80
128
Szybkość wypełniania Texel
120,5 GT/s
144,1 GT/s
Szybkość transmisji danych w pamięci
8 Gb/s
7 Gb/s
Przepustowość pamięci
192 GB/s
224 GB/s
RPO
48
64
Pamięć podręczna L2
1,5 MB
2MB
TDP
120W
165W
Tranzystory
4,4 miliarda
5,2 miliarda
Rozmiar matrycy
200 mm²
398 mm²
Węzeł procesu
16 mil
28 mil morskich
GP106 jest wyposażony w dwa GPC, więc otrzymujesz łącznie 1280 rdzeni CUDA i 80 jednostek tekstur. Chip korzysta z tych samych zoptymalizowanych taktowań, które pozwalają Nvidii podkręcić taktowanie w GP104, ułatwiając podstawową częstotliwość 1506 MHz i typową ocenę GPU Boost wynoszącą 1708 MHz.
Back-end procesora również jest okrojony. Sześć 32-bitowych kontrolerów pamięci zapewnia zagregowaną, 192-bitową ścieżkę danych. Podobnie jak większy GP104, każdy kontroler jest powiązany z ośmioma ROP i 256 KB L2, co daje do 48 ROP i 1,5 MB pamięci podręcznej. Nvidia umieszcza na płycie 6 GB pamięci GDDR5 o pojemności 8 GT/s, obsługując szczytową przepustowość do 192 GB/s. Chociaż liczba ta jest niższa niż 224 GB/s w GTX 980, pamiętajmy również, że Pascal wykorzystuje nowe bezstratne techniki do wydobycia oszczędności w podsystemie pamięci, skutecznie zwiększając użyteczną przepustowość. Zaadaptowana z naszego pokrycia GTX 1080, „[GP106] kompresja kolorów delta próbuje osiągnąć oszczędności 2:1, a ten tryb jest rzekomo ulepszony, aby można go było częściej używać. Dostępny jest również nowy tryb 4:1, który obejmuje przypadki, gdy różnice w poszczególnych pikselach są bardzo małe i kompresowalne w jeszcze mniejszej przestrzeni.
Oczywiście GP106 jest produkowany przy użyciu tego samego procesu TSMC 16FF+ co GP104. Podczas gdy większy GPU składa się z 7,2 miliarda tranzystorów na matrycy 314 mm², Nvidia pakuje 4,4 miliarda tranzystorów FinFET na 200 mm² dla GP106. Mniej złożony procesor w połączeniu z mniejszą ilością pamięci na prostszym PCA daje TDP 120 W.
Po pierwsze: brak SLI dla wyższego mainstreamu
Zauważ brak złącza SLI na górze? Nvidia rekomenduje GeForce GTX 1070 lub 1080 graczom szukającym większej wydajności niż 1060 (oczywiście) i nie obsługuje SLI w 1060. Pokoleniowo jest to najwyższa karta, jaką możemy sobie przypomnieć bez tej technologii. Jasne, GeForce GTX 750 Ti go nie miał, ale 760 miał. Tak samo zrobił GeForce GTX 950.
Oficjalnie Nvidia internalizuje decyzję. Niewielu jest graczy, którzy łączą w pary procesory graficzne z głównego nurtu, a firma nie chce ograniczać zasobów, więc koncentruje się na optymalizacji SLI na szybszych kartach opartych na Pascalu. Jednak poza tym wyjaśnieniem rozwój gier idzie w innym kierunku z efektami post-processingu i obliczeniowymi, które nie są przyjazne dla alternatywnego renderowania klatek. A dzięki DirectX 12 większa kontrola jest przekazywana niezależnym dostawcom oprogramowania, którzy chcą jak najszybciej udostępnić swoje treści. Oznacza to, że większość pracy, jaką Nvidia wkłada w swoje sterowniki, jest pomijana.
W naszym pakiecie mamy jedną grę, która obsługuje wiele procesorów graficznych za pośrednictwem DirectX 12: Ashes of the Singularity. Po dodaniu drugiej karty GeForce GTX 1060 i kliknięciu jednego pola wyboru widzimy następujące przyspieszenie:
Chociaż nie jest to rodzaj skalowania, do którego jesteśmy przyzwyczajeni w SLI, ~50% nie jest złe. Niestety, nie możemy nawet eksperymentować z grami DirectX 11 i tytułami DX12 bez obsługi wielu wbudowanych adapterów.
Biorąc pod uwagę, że jest to karta ukierunkowana na 1080p, Nvidia może wstecznie włączyć SLI przez PCI Express poprzez aktualizację sterownika i mamy nadzieję, że tak. Niezależnie od tego, jak niewielu graczy może być zainteresowanych parowaniem kart GTX 1060, wciąż istnieje wiele tytułów DX11, które korzystają z konfiguracji multi-GPU. I każdy problem, że GP106 ma przecięcie narzucone przez DX12 problemy ze skalowaniem, dotyczy również kart opartych na GP104. Niech testy wydajności określą, jak atrakcyjne są lub nie są, jak mówimy, 1060 SLI.
Bliższe spojrzenie na GeForce GTX 1060 Founders Edition
Nvidia kontynuuje swoją bardziej awangardową konstrukcję z serii 10 Founders Edition, chociaż GTX 1060 ma prawdopodobnie tańszą implementację w porównaniu do 1070 i 1080.
Nie oznacza to jednak, że nowa karta jest mała. Ma 25,4 cm długości (mierząc od pokrywy gniazda do końca karty), 10,7 cm wysokości (mierząc od góry gniazda płyty głównej do góry karty) i 3,8 cm głębokości. W rzeczywistości głębokość karty wynosi tylko 3,5 cm, ale jej osłona gniazda wystaje o 0,3 cm.
Przy 845 g GeForce GTX 1060 Founders Edition również nie jest szczególnie lekki.
Projekt, wyczucie i złącza
Po raz kolejny Nvidia wykorzystuje mieszankę aluminium i plastiku do osłony karty. Tym razem jest to jednak nieco prostsze. Pokrowiec wraz z wentylatorem można zdjąć w jednym kawałku. Na górze znajduje się podświetlane logo GeForce GTX wraz z sześciopinowym złączem zasilania.
Backend GeForce GTX 1060 odbiega nieco od poprzednich konstrukcji. Karty graficzne z krótkimi PCA często mają wloty powietrza, gdzie chłodnica wystaje poza płytę, obsługując wentylator promieniowy. Zamiast tego 1060 ma normalną pokrywę bez otworu. Niewątpliwie ze względu na koszty nie ma też płyty tylnej.
Rewers karty przedstawia nam znajomy widok.
Panel I/O został skopiowany z Nvidii GeForce GTX 1080 i 1070 bez żadnej zmiany. Jest zdominowany przez trzy złącza DisplayPort, które są kompatybilne z wersją 1.2. Jednak firma informuje nas, że jest również gotowa na wersje 1.3 i 1.4, dopasowując się do kontrolera wyświetlania GPU. Ponadto dostępne jest złącze HDMI 2.0 i złącze dual-link DVI; brak wyjścia analogowego.
Chłodniejsza konstrukcja, płyta i zasilacz
Zwracając naszą uwagę do wewnątrz, zdejmujemy osłonę, aby odsłonić rozwiązanie chłodzące GeForce GTX 1060.
Na górze od razu zauważamy dziwną pozycję złącza zasilania. Znajduje się w części chłodnicy, która wystaje poza właściwy PCA. Wymaga to podłączenia kilku kabli do płyty.
Implementacja nie jest elegancka i uniemożliwia partnerom Nvidii budowanie krótszych 1060. Mimo że karta ma tylko 17,5 cm długości, nie ma miejsca na złącze zasilania.
Odkręć cztery śruby mocujące obudowę chłodnicy i od razu odpadnie. Pod spodem znajduje się masywny miedziany radiator i metalowa rama. Zamknięta konstrukcja żeberek chłodzących przypomina nam GeForce GTX 1070 i powinna zapewnić wystarczającą wydajność, biorąc pod uwagę 120W TDP 1060.
Masywna rama utrzymująca i chłodząca pełni podwójną funkcję, utrzymując wszystko na miejscu i chłodząc obwody regulacji napięcia/moduły pamięci.
Gdy rama zostanie odpięta i zdjęta, należy ją odwrócić i odwrócić. Dzieje się tak dzięki przewodom łączącym osobne złącze zasilania PCIe, które są na stałe przylutowane do płytki. W ten sposób ujawnia się nagi PCA w całej okazałości.
Jak zwykle GPU znajduje się z przodu i na środku. GP106 jest oczywiście nieco mniejszy niż GPU GP104, który znaleźliśmy na kartach GeForce GTX 1080 i 1070 Nvidii. Na tym jednak różnice między płytami się nie kończą.
Weźmy jako przykład moduły pamięci. Tylko sześć z 1060 stanowisk jest wypełnionych przez Samsung K4G80325FB-HC25 GDDR5. Mają pojemność 8 Gb (32 x 256 Mb) każdy i pracują w dowolnym miejscu od 1,305 V do 1,597 V, w zależności od częstotliwości taktowania. Podsumowując, tutaj otrzymujemy specyfikację 1060 o pojemności 6 GB.
Niestety kontroler PWM nie jest udokumentowany. Jest produkowany przez firmę uPI Semiconductor i nosi numer modelu uP9509, co oznacza, że jest prawdopodobnie mniejszym rodzeństwem uP9511P (ten ostatni kontroler jest tym, co znaleźliśmy w połączeniu z procesorem GP104).
Moduły pamięci i jedna z faz GPU są zasilane przez gniazdo PCIe na płycie głównej. Dwie pozostałe fazy GPU i akcesoria karty pobierają energię z sześciopinowego złącza zasilania. Na następnej stronie przyjrzymy się bliżej, co to oznacza pod względem rozkładu obciążenia na szynach.
Jeśli chodzi o regulację napięcia, Nvidia używa tylko jednego dwukanałowego tranzystora MOSFET, E6930, na fazę zarówno dla strony wysokiej, jak i niskiej; oddzielne sterowniki bramek nie są potrzebne. Ten wysoce zintegrowany komponent wyjaśnia puste przestrzenie na planszy.
Trzy fazy GPU są w zupełności wystarczające, a ich rozmieszczenie ma tutaj większy sens niż w Radeonie RX 480 AMD.
Pomijając sześciopinowe złącze zasilania, które najwyraźniej poszło w złą stronę, referencyjny GeForce GTX 1060 od Nvidii wygląda całkiem nieźle. A biorąc pod uwagę stosunkowo niewielką ilość ciepła odpadowego, jego wentylator osiowy również nie jest złym wyborem.