Передайте привіт новому графічному процесору на основі Pascal
Через два місяці після свого дебюту архітектура Nvidia Pascal повільно заповнює портфоліо настільних відеокарт компанії зверху вниз. Спочатку з’явилася GeForce GTX 1080, яка забезпечує на 30% більше продуктивності, ніж GeForce GTX 980 Ti за менші гроші. Інтернет-продавці все ще не можуть тримати їх на складі (Newegg не має їх на момент написання цієї статті). Потім ми познайомилися з GeForce GTX 1070, яка також перевершує 980 Ti на сотні доларів менше.
Тепер ми отримуємо третю плату на основі Pascal у GeForce GTX 1060. Оголошено на початку цього місяця, ми вже знаємо, що партнери Nvidia матимуть версії від 250 доларів. Реалізація Founders Edition буде продаватися за 300 доларів на nvidia.com і в магазинах Best Buy, тому не дивуйтеся, якщо ви не знайдете їх деінде в Інтернеті.
GeForce GTX 1060 заснована на абсолютно новому графічному процесорі під назвою GP106, який надає багато тих же функцій, що і GP104, але в більш популярному пакеті. Однак не дозволяйте цьому терміну відрадити вас. 1060 може бути просто картою на 120 Вт, але Nvidia каже, що це добре для частоти кадрів класу GeForce GTX 980. Два роки тому цей рівень продуктивності продавався за 550 доларів. Ми пройшли довгий шлях, це точно.
Зустрічайте GP106
Nvidia створює свій флагман GeForce GTX 1080, використовуючи повний процесор GP104 з чотирма кластерами графічної обробки. Це дає карту з 2560 ядрами CUDA і 160 блоками текстур. GTX 1070 зосереджено на одному графічному процесорі з трьома увімкненими його GPC, додавши до 1920 ядер і 120 блоків текстур.
GeForce GTX 1060 зменшується аналогічним чином, використовуючи ті самі архітектурні будівельні блоки. З нашого висвітлення запуску GeForce GTX 1080:
«Кожен GPC включає п’ять кластерів обробки потоків/текстур і растровий механізм. У розбитті далі, TPC поєднує один потоковий мультипроцесор і механізм PolyMorph. SM поєднує в собі 128 ядер CUDA одинарної точності, ємність реєстрових файлів 256 КБ, 96 КБ спільної пам’яті, 48 КБ кешу L1/текстур і вісім текстурних блоків. Між тим, движок PolyMorph четвертого покоління включає новий блок логіки, який знаходиться в кінці конвеєра геометрії і попереду блоку растру для роботи з функцією одночасного мультипроекції Nvidia».
графічний процесор
GeForce GTX 1060 (GP106)
GeForce GTX 980 (GM204)
СМС
10
16
Ядра CUDA
1280
2048
Базовий годинник
1506 МГц
1126 МГц
GPU Boost Clock
1708 МГц
1216 МГц
GFLOP (базова частота)
3855
4612
Текстурні блоки
80
128
Швидкість заповнення текселів
120,5 ГТ/с
144,1 ГТ/с
Швидкість даних пам’яті
8 Гбіт/с
7 Гбіт/с
Пропускна здатність пам’яті
192 ГБ/с
224 ГБ/с
ROPs
48
64
Кеш L2
1,5 МБ
2 МБ
TDP
120 Вт
165 Вт
Транзистори
4,4 млрд
5,2 млрд
Розмір матриці
200 мм²
398 мм²
Вузол процесу
16 нм
28 нм
GP106 оснащений двома GPC, тож ви отримаєте в цілому 1280 ядер CUDA і 80 блоків текстур. Чіп користується тими самими оптимізованими таймінгами, які дозволяють Nvidia підвищити тактову частоту на GP104, забезпечуючи базову частоту 1506 МГц і типовий рейтинг GPU Boost 1708 МГц.
Задня частина процесора також зменшена. Шість 32-розрядних контролерів пам’яті забезпечують загальний 192-розрядний шлях даних. Як і більший GP104, кожен контролер пов’язаний з вісьмома ROP і 256 КБ L2, що додає до 48 ROP і 1,5 МБ кешу. Nvidia скидає на плату 6 ГБ 8 GT/s GDDR5, забезпечуючи максимальну пропускну здатність до 192 ГБ/с. Хоча цей показник нижчий, ніж 224 ГБ/с у GTX 980, пам’ятайте також, що Pascal використовує нові методи без втрат для отримання заощаджень у підсистемі пам’яті, ефективно збільшуючи корисну пропускну здатність. Адаптований з нашого покриття GTX 1080, “дельта стиснення кольорів [GP106] намагається досягти економії 2:1, і цей режим нібито вдосконалено, щоб його можна було частіше використовувати. Також є новий режим 4:1, який охоплює випадки, коли різниця на піксель дуже малі та стиснуті в ще менший простір.
Звичайно, GP106 виготовляється з використанням того ж процесу TSMC 16FF+, що й GP104. У той час як більший графічний процесор складається з 7,2 мільярдів транзисторів на кристалі 314 мм², Nvidia упаковує 4,4 мільярда транзисторів FinFET в 200 мм² для GP106. Менш складний процесор у поєднанні з меншою кількістю пам’яті на більш простому PCA призводить до TDP 120 Вт.
Перше: немає SLI для верхнього основного потоку
Помітили відсутність роз’єму SLI вгорі? Nvidia рекомендує GeForce GTX 1070 або 1080 для гравців, які шукають більшу продуктивність, ніж 1060 (звичайно), і не підтримує SLI на 1060. Загалом, це найвища плата, яку ми можемо згадати без цієї технології. Звичайно, у GeForce GTX 750 Ti його не було, але у 760 був. Так само зробила і GeForce GTX 950.
Офіційно Nvidia сприймає це рішення. Не так багато геймерів, які об’єднують основні графічні процесори, і компанія не хоче розподіляти ресурси тонко, тому вона зосереджена на оптимізації SLI на швидших картах на основі Pascal. Крім цього пояснення, розробка ігор йде в іншому напрямку з постобробкою та орієнтованими на обчислення ефектами, які не є дружніми до відтворення альтернативних кадрів. А з DirectX 12 більше контролю передається ISV, які прагнуть отримати свій вміст якомога швидше. Це означає, що велика частина роботи, яку Nvidia вкладає у свої драйвери, обходиться.
У нашому пакеті є одна гра, яка підтримує декілька графічних процесорів через DirectX 12: Ashes of the Singularity. Після додавання другої відеокарти GeForce GTX 1060 і натискання одного прапорця ми бачимо наступне прискорення:
Хоча це не те масштабування, яке ми звикли бачити в SLI, ~50% це непогано. На жаль, ми не можемо навіть експериментувати з іграми DirectX 11 і DX12 без підтримки кількох вбудованих адаптерів.
Враховуючи, що це карта, орієнтована на 1080p, Nvidia може заднім числом увімкнути SLI через PCI Express через оновлення драйвера, і ми сподіваємося, що це зробить. Незалежно від того, наскільки мало геймерів можуть бути зацікавлені в об’єднанні карт GTX 1060, існує багато ігор DX11, які отримують переваги від конфігурацій з багатьма графічними процесорами. І будь-яка проблема, через яку GP106 вирішує проблеми масштабування, пов’язані з DX12, також стосується карт на основі GP104. Ми кажемо, що нехай тести продуктивності визначають, наскільки привабливими є чи ні є SLI’ed 1060.
Більш детальний огляд GeForce GTX 1060 Founders Edition
Nvidia продовжує використовувати більш прозорий дизайн Founders Edition 10-ї серії, хоча GTX 1060 має імовірно менш дорогу реалізацію в порівнянні з 1070 і 1080.
Однак це не означає, що нова картка маленька. Його довжина 25,4 см (виміряна від кришки гнізда до кінця карти), 10,7 см у висоту (виміряна від верхньої частини гнізда материнської плати до верхньої частини карти) і 3,8 см у глибину. Насправді глибина карти всього 3,5 см, а ось кришка слота стирчить на 0,3 см.
При 845 г GeForce GTX 1060 Founders Edition також не дуже легкий.
Дизайн, відчуття та конектори
Знову, Nvidia використовує суміш алюмінію та пластику для кожуха карти. Проте цього разу все трохи простіше. Кришку, включаючи вентилятор, можна зняти цільно. Угорі ми знаходимо підсвічений логотип GeForce GTX, а також шестиконтактний роз’єм живлення.
Задня частина GeForce GTX 1060 трохи відрізняється від попередніх дизайнів. Графічні карти з короткими PCA часто мають повітрозабірники, де кулер виступає за межі плати, обслуговуючи радіальний вентилятор. Натомість 1060 має звичайну кришку без отвору. Безсумнівно, з огляду на вартість, задньої панелі також немає.
Зворотня сторона картки представляє нам знайоме видовище.
Панель вводу-виводу скопійована з Nvidia GeForce GTX 1080 і 1070 без жодної зміни. У ньому переважають три роз’єми DisplayPort, сумісні з версією 1.2. Однак компанія повідомляє нам, що вони також готові до версії 1.3 і 1.4, що відповідає контролеру дисплея графічного процесора. Крім того, є роз’єм HDMI 2.0 і двоканальний роз’єм DVI; аналогового виходу немає.
Конструкція кулера, плата та блок живлення
Звернувши нашу увагу всередину, ми знімаємо кожух, щоб відкрити охолоджуюче рішення GeForce GTX 1060.
Зверху ми відразу помічаємо дивне положення роз’єму живлення. Він розташований у частині кулера, яка виступає за межі фактичного PCA. Для цього до плати потрібно підключити кілька кабелів.
Реалізація не є елегантною, і вона не дозволяє партнерам Nvidia створювати коротші 1060. Незважаючи на те, що карта має довжину лише 17,5 см, на ній немає місця для роз’єму живлення.
Відкрутіть чотири гвинти, що кріплять корпус кулера, і він відразу знімається. Під ним є масивний мідний радіатор і металевий каркас. Закритий дизайн ребра охолодження нагадує нам GeForce GTX 1070, і він повинен забезпечувати достатню продуктивність, враховуючи 120 Вт TDP 1060.
Масивна утримуюча та охолоджувальна рама виконує подвійну функцію, зберігаючи все на місці та охолоджуючи схему регулювання напруги/модулі пам’яті.
Після того, як рама розкріплена і знята, її потрібно перевернути і знову. Це пов’язано з кабелями, що під’єднують окремий роз’єм живлення PCIe, які постійно припаяні до плати. Зробивши це, ви побачите голий PCA у всій його красі.
Як зазвичай, графічний процесор розташований спереду і по центру. GP106, природно, трохи менший, ніж графічний процесор GP104, який ми знайшли на GeForce GTX 1080 і 1070 від Nvidia. Однак на цьому відмінності між платами не закінчуються.
Візьмемо для прикладу модулі пам’яті. Лише шість місць розміщення 1060 оснащені Samsung K4G80325FB-HC25 GDDR5. Вони мають ємність 8 Гб (32 x 256 Мб) кожен і працюють від 1,305 В до 1,597 В, залежно від тактової частоти. Загалом, ось тут ми отримуємо специфікацію 1060 6 ГБ.
На жаль, ШІМ-контролер не задокументовано. Він виготовлений компанією uPI Semiconductor і має номер моделі uP9509, що означає, що це, ймовірно, менший брат uP9511P (останній контролер — це те, що ми знайшли в парі з процесором GP104).
Модулі пам’яті та одна з фаз графічного процесора отримують свою потужність через слот PCIe материнської плати. Дві фази графічного процесора, що залишилися, і аксесуари для карти живляться від шестиконтактного роз’єму живлення. Ми детальніше розглянемо, що це означає з точки зору розподілу навантаження між рейками, на наступній сторінці.
Що стосується регулювання напруги, Nvidia використовує лише один подвійний N-канальний МОП-транзистор, E6930, на фазу як для верхньої, так і для низької сторони; окремі драйвери воріт не потрібні. Цей високоінтегрований компонент пояснює порожні місця на дошці.
Трьох фаз графічного процесора цілком достатньо, і їх розподіл тут має більший сенс, ніж на Radeon RX 480 від AMD.
За винятком шестиконтактного роз’єму живлення, який, здається, кудись повернувся не так, референтна відеокарта Nvidia GeForce GTX 1060 насправді виглядає досить добре. І враховуючи відносно низьку кількість відхідного тепла, його осьовий вентилятор також не є поганим вибором.