Поздоровайтесь с новым графическим процессором на базе Pascal
Спустя два месяца после своего дебюта архитектура Pascal от Nvidia постепенно заполняет портфель графических карт компании для настольных ПК сверху донизу. Первой была GeForce GTX 1080, обеспечивающая на 30 % больше производительности, чем GeForce GTX 980 Ti за меньшие деньги. Интернет-продавцы до сих пор не могут держать их в наличии (у Newegg их нет на момент написания этой статьи). Затем нам представили GeForce GTX 1070, которая также превосходит 980 Ti и стоит на сотни долларов дешевле.
Теперь мы получаем третью плату на базе Pascal в составе GeForce GTX 1060. Объявленная ранее в этом месяце, мы уже знаем, что у партнеров Nvidia будут версии по цене от 250 долларов. Реализация Founders Edition будет продаваться за 300 долларов на nvidia.com и в магазинах Best Buy, поэтому не удивляйтесь, если вы не найдете их в других местах в Интернете.
GeForce GTX 1060 основана на совершенно новом графическом процессоре под названием GP106, который обладает многими из тех же функций, что и GP104, но в более массовом корпусе. Однако пусть этот термин вас не смущает. 1060 может быть всего лишь картой мощностью 120 Вт, но Nvidia говорит, что она хороша для частоты кадров класса GeForce GTX 980. Два года назад такой уровень производительности продавался за 550 долларов. Мы прошли долгий путь, чтобы быть уверенным.
Встречайте GP106
Nvidia создает свою флагманскую видеокарту GeForce GTX 1080, используя полноценный процессор GP104 с включенными четырьмя кластерами обработки графики. В результате получается карта с 2560 ядрами CUDA и 160 текстурными блоками. GTX 1070 использует тот же графический процессор с тремя включенными GPC, что дает до 1920 ядер и 120 текстурных блоков.
GeForce GTX 1060 масштабируется аналогичным образом, используя те же архитектурные строительные блоки. Из нашего обзора запуска GeForce GTX 1080:
«Каждый GPC включает в себя пять кластеров обработки потоков/текстур и растровый движок. В дальнейшем TPC объединяет один потоковый мультипроцессор и механизм PolyMorph. SM сочетает в себе 128 ядер CUDA одинарной точности, емкость регистрового файла 256 КБ, 96 КБ общей памяти, 48 КБ кэша L1/текстуры и восемь текстурных блоков. Между тем, движок PolyMorph четвертого поколения включает в себя новый блок логики, который находится в конце геометрического конвейера и перед растровым блоком для обработки функции одновременной мультипроекции Nvidia».
графический процессор
GeForce GTX 1060 (GP106)
GeForce GTX 980 (GM204)
Смс
10
16
CUDA-ядра
1280
2048
Базовые часы
1506 МГц
1126 МГц
Повышение тактовой частоты графического процессора
1708 МГц
1216 МГц
GFLOPs (базовые часы)
3855
4612
Текстурные блоки
80
128
Скорость заполнения текселей
120,5 ГТ/с
144,1 ГТ/с
Скорость передачи данных в память
8 Гбит/с
7 Гбит/с
Пропускная способность памяти
192 ГБ/с
224 ГБ/с
ROP
48
64
Кэш L2
1,5 МБ
2 МБ
Расчетная мощность
120 Вт
165 Вт
Транзисторы
4,4 миллиарда
5,2 миллиарда
Размер штампа
200 мм²
398 мм²
Узел процесса
16 нм
28 нм
GP106 оснащен двумя GPC, так что в итоге вы получаете 1280 ядер CUDA и 80 текстурных блоков. Чип выигрывает от тех же оптимизированных таймингов, которые позволили Nvidia повысить тактовую частоту на GP104, обеспечив базовую частоту 1506 МГц и типичный рейтинг GPU Boost 1708 МГц.
Внутренняя часть процессора также урезана. Шесть 32-разрядных контроллеров памяти обеспечивают совокупный 192-разрядный путь данных. Как и в более крупном GP104, каждый контроллер связан с восемью ROP и 256 КБ L2, что дает до 48 ROP и 1,5 МБ кэш-памяти. Nvidia размещает на плате 6 ГБ памяти GDDR5 8 ГТ/с, обеспечивая пиковую пропускную способность до 192 ГБ/с. Хотя эта цифра ниже, чем у GTX 980 со скоростью 224 ГБ/с, помните также, что Pascal использует новые технологии без потерь для извлечения экономии в подсистеме памяти, эффективно увеличивая полезную пропускную способность. Адаптировано из нашего обзора GTX 1080: «Дельта-сжатие цвета [GP106] пытается достичь экономии 2: 1, и этот режим якобы улучшен, чтобы его можно было использовать чаще. Также есть новый режим 4: 1, который охватывает случаи, когда различия в пикселях очень малы и сжимаются до еще меньшего размера.
Конечно, GP106 производится с использованием того же процесса TSMC 16FF+, что и GP104. В то время как более крупный графический процессор состоит из 7,2 миллиарда транзисторов на кристалле площадью 314 мм², Nvidia упаковывает 4,4 миллиарда транзисторов FinFET на площади 200 мм² для GP106. Менее сложный процессор в сочетании с меньшим объемом памяти на более простой печатной плате дает TDP 120 Вт.
Во-первых: нет SLI для верхнего мейнстрима
Заметили отсутствие разъема SLI наверху? Nvidia рекомендует GeForce GTX 1070 или 1080 геймерам, которые ищут более высокую производительность, чем 1060 (конечно), и не поддерживает SLI на 1060. Поколение это самая мощная плата, которую мы можем вспомнить без этой технологии. Конечно, у GeForce GTX 750 Ti этого не было, но у 760 он был. То же самое произошло и с GeForce GTX 950.
Официально Nvidia принимает это решение. Не так много геймеров используют обычные графические процессоры в паре, и компания не хочет распылять ресурсы, поэтому сосредоточилась на оптимизации SLI на более быстрых картах на базе Pascal. Однако помимо этого объяснения разработка игр идет в другом направлении с постобработкой и эффектами, ориентированными на вычисления, которые не подходят для рендеринга с альтернативным кадром. А с DirectX 12 больший контроль переходит к независимым поставщикам программного обеспечения, стремящимся выпустить свой контент как можно быстрее. Это означает, что большая часть работы, которую Nvidia вкладывает в свои драйверы, обходится стороной.
В нашем наборе есть одна игра, которая поддерживает несколько графических процессоров через DirectX 12: Ashes of the Singularity. После добавления второй GeForce GTX 1060 и установки одного флажка мы видим следующее ускорение:
Хотя это не то масштабирование, которое мы привыкли видеть от SLI, ~ 50% — это неплохо. К сожалению, мы не можем даже экспериментировать с играми DirectX 11 и DX12 без встроенной поддержки нескольких адаптеров.
Учитывая, что это карта, ориентированная на 1080p, Nvidia может задним числом включить SLI через PCI Express через обновление драйвера, и мы надеемся, что это произойдет. Независимо от того, как мало геймеров может быть заинтересовано в сопряжении карт GTX 1060, все еще существует множество игр DX11, которые выигрывают от конфигураций с несколькими графическими процессорами. И любая проблема, связанная с тем, что GP106 устраняет проблемы масштабирования, связанные с DX12, применима и к картам на базе GP104. Мы говорим: пусть тесты производительности определят, насколько привлекательны SLI-1060 или нет.
Пристальный взгляд на GeForce GTX 1060 Founders Edition
Nvidia продолжает работу над своим более современным дизайном Founders Edition 10-й серии, хотя GTX 1060 имеет предположительно менее дорогую реализацию по сравнению с 1070 и 1080.
Однако это не означает, что новая карта маленькая. Его длина составляет 25,4 см (измеряется от крышки слота до конца карты), 10,7 см в высоту (измеряется от верхней части слота материнской платы до верхней части карты) и 3,8 см в глубину. В действительности глубина карты составляет всего 3,5 см, а крышка слота выступает на 0,3 см.
При весе 845 г GeForce GTX 1060 Founders Edition также не особо легкая.
Дизайн, ощущения и разъемы
Опять же, Nvidia использует смесь алюминия и пластика для кожуха карты. Однако на этот раз все немного проще. Крышку вместе с вентилятором можно снять целиком. Вверху мы видим подсвеченный логотип GeForce GTX, а также шестиконтактный разъем питания.
Серверная часть GeForce GTX 1060 немного отличается от предыдущих разработок. Видеокарты с короткими печатными платами часто имеют воздухозаборники, где кулер выступает за пределы платы, обслуживающий радиальный вентилятор. Вместо этого у 1060 обычная крышка без отверстия. Несомненно, из соображений стоимости также нет задней панели.
Оборотная сторона карты представляет нам знакомое зрелище.
Панель ввода-вывода скопирована с GeForce GTX 1080 и 1070 от Nvidia без единого изменения. В нем преобладают три разъема DisplayPort, совместимые с версией 1.2. Тем не менее, компания сообщает нам, что они также готовы к версиям 1.3 и 1.4, соответствующим контроллеру дисплея графического процессора. Кроме того, есть разъем HDMI 2.0 и двухканальный разъем DVI; аналоговый выход отсутствует.
Дизайн кулера, плата и блок питания
Обратив внимание внутрь, мы снимаем кожух, чтобы открыть систему охлаждения GeForce GTX 1060.
Сверху мы сразу замечаем странное расположение разъема питания. Он расположен в той части кулера, которая выступает за собственно печатную плату. Это требует ряда кабелей для подключения к плате.
Реализация совсем не элегантная, и она не позволяет партнерам Nvidia создавать более короткие 1060-е. Хотя длина карты составляет всего 17,5 см, на ней нет места для разъема питания.
Открутите четыре винта, крепящие корпус кулера, и он тут же снимается. Под ним находится массивный медный радиатор и металлический каркас. Закрытый дизайн ребер охлаждения напоминает нам GeForce GTX 1070, и он должен обеспечивать достаточную производительность, учитывая TDP 1060 в 120 Вт.
Массивная удерживающая и охлаждающая рама выполняет двойную функцию, удерживая все на месте и охлаждая схемы регулирования напряжения/модули памяти.
После того, как рама отстегнута и снята, ее нужно перевернуть вверх и снова. Это связано с кабелями, соединяющими отдельный разъем питания PCIe, которые постоянно припаяны к плате. При этом открывается голая PCA во всей красе.
Как обычно, графический процессор находится спереди и в центре. Естественно, GP106 немного меньше графического процессора GP104, который мы нашли на Nvidia GeForce GTX 1080 и 1070. Однако на этом различия между платами не заканчиваются.
Возьмем в качестве примера модули памяти. Только в шести слотах 1060 установлены Samsung K4G80325FB-HC25 GDDR5. Они имеют емкость 8 Гб (32 x 256 Мб) каждый и работают от 1,305 В до 1,597 В, в зависимости от тактовой частоты. В общем, именно здесь мы получаем спецификацию 1060 на 6 ГБ.
К сожалению, ШИМ-контроллер не задокументирован. Он изготовлен uPI Semiconductor и имеет номер модели uP9509, что означает, что это, вероятно, младший брат uP9511P (последний контроллер — это то, что мы обнаружили в паре с процессором GP104).
Модули памяти и одна из фаз графического процессора получают питание через слот PCIe материнской платы. Две оставшиеся фазы графического процессора и аксессуары карты получают питание от шестиконтактного разъема питания. На следующей странице мы более подробно рассмотрим, что это означает с точки зрения распределения нагрузки по рельсам.
Когда дело доходит до регулирования напряжения, Nvidia использует только один двухканальный полевой МОП-транзистор E6930 на фазу как для высокой, так и для низкой стороны; отдельные драйверы ворот не нужны. Этот высокоинтегрированный компонент объясняет наличие пустых мест на плате.
Трех фаз GPU вполне достаточно, и их распределение здесь имеет больше смысла, чем на AMD Radeon RX 480.
Если не считать шестиконтактного разъема питания, который, кажется, где-то повернул не туда, эталонная видеокарта Nvidia GeForce GTX 1060 на самом деле выглядит неплохо. И, учитывая относительно небольшое количество отработанного тепла, его осевой вентилятор также не является плохим выбором.