Обзор Nvidia GeForce GTX 1660 Ti 6GB: Turing без RTX

Содержание

Наш вердикт

Хотя GeForce GTX 1660 Ti стоит дороже, чем 1060 6 ГБ, которую она заменяет, новейшая плата Nvidia на основе Turing обеспечивает производительность, аналогичную GeForce GTX 1070. Высокая производительность, разумная цена и скромное энергопотребление сочетаются в надежной видеокарте верхнего уровня. .

За

Отличная производительность при разрешении 1920 x 1080
Приемлемая частота кадров при разрешении 2560 x 1440
Сохраняет функции ускорения кодирования/декодирования видео Turing.
Мощность платы 120 Вт выгодно отличается от конкурентов AMD

Против

Отсутствие ядер RT/Tensor означает, что вы не сможете попробовать трассировку лучей или DLSS.

Тьюринг без RTX

Обновление от 21 ноября 2019 г.: с момента запуска GTX 1660 Ti в феврале 2019 г. ландшафт графических процессоров резко изменился: появился ряд «супер» карт, основанных на той же архитектуре Turing, но обеспечивающих более высокую производительность и более низкие цены, чем первоначальный состав компании Turing. Наиболее актуальной для потенциальных покупателей GTX 1660 Ti является GeForce GTX 1660 Super, которая обеспечивает производительность, аналогичную 1660 Ti, по более низкой стартовой цене в 229 долларов. На момент написания этой статьи это примерно на 30 долларов меньше, чем у самой дешевой GTX 1660 Ti.

Nvidia GeForce GTX 1660 Ti построена на базе TU116 — совершенно нового графического процессора, который включает в себя улучшенные шейдеры Turing, унифицированную архитектуру кэша, поддержку адаптивного шейдинга и полный набор функций ускорения кодирования/декодирования видео. Графический процессор соединен с памятью GDDR6, как и в более дорогих моделях GeForce RTX 20-й серии. Но это недостаточно быстро, чтобы оправдать использование ядер RT для ускоренной трассировки лучей или ядер Tensor для логических выводов в играх. В результате TU116 представляет собой более компактный чип со списком спецификаций, подчеркивающим лучшие сегодняшние игры.

Nvidia заявляет, что GeForce GTX 1660 Ti будет стоить от 280 долларов и полностью заменит GeForce GTX 1060 6 ГБ. Хотя эта базовая цена на 30 долларов (или 12 процентов) выше, чем у модели 1060 6 ГБ на базе Pascal, которая начала свой путь в 2016 году, компания утверждает, что GeForce GTX 1660 Ti в 1,5 раза быстрее — и при той же номинальной мощности платы 120 Вт. Не меньше.

Улучшенная производительность на доллар — это не то, чего мы до сих пор видели в поколении Тьюринга. Может ли Nvidia изменить это с помощью графического процессора, более специально созданного для производительности в разрешении 1920 x 1080?

Встречайте TU116: Turing Sans RT и тензорные ядра

Мы видели, как Nvidia запускает четыре отдельных графических процессора, сопровождая нас вниз по иерархии Тьюринга. С каждым из них компания сокращает ресурсы, чтобы ориентироваться на более низкие цены. Но мы знаем, что он пытается поддерживать баланс на этом пути, сводя к минимуму узкие места, которые без необходимости лишают младшие процессоры их пиковой производительности.

GeForce RTX 2060 оснащена 44 процентами ядер CUDA и текстурных блоков 2080 Ti, 54 процентами ROP и пропускной способности памяти и 50 процентами кэш-памяти L2. Перед запуском 2060 года мы подозревали, что такие предметы роскоши, как ядра RT и Tensor, больше не будут иметь смысла на этих уровнях. Но серия исправлений для Battlefield V — единственной доступной на тот момент игры с поддержкой трассировки лучей — позволила добиться значительного прироста производительности, доказав, что фирменные функции Тьюринга по-прежнему можно использовать при воспроизводимой частоте кадров.

Оказывается, мы ошиблись на один уровень. Nvidia считает TU116 границей, где мощность затенения падает достаточно низко, чтобы помешать перспективным возможностям Turing служить большой цели. После удаления ядер RT и Tensor у нас остался чип площадью 284 мм², состоящий из 6,6 миллиардов транзисторов, изготовленных с использованием 12-нм техпроцесса TSMC FinFET. Но, несмотря на меньшие по размеру транзисторы, TU116 по-прежнему на 42% больше, чем предшествовавший ему процессор GP106.

Некоторый рост связан с более сложными шейдерами Тьюринга. Как и более дорогие карты GeForce RTX 20-й серии, GeForce GTX 1660 Ti поддерживает одновременное выполнение арифметических инструкций FP32, составляющих большинство рабочих нагрузок шейдеров, и операций INT32 (для адресации/выборки данных, минимальных/максимальных значений с плавающей запятой, сравнения и т. д.). .). Когда вы слышите о том, что ядра Turing достигают более высокой производительности, чем Pascal, при заданной тактовой частоте, эта возможность в значительной степени объясняет, почему.

Потоковые мультипроцессоры Turing состоят из меньшего количества ядер CUDA, чем у Pascal, но конструкция частично компенсирует это за счет распределения большего количества SM по каждому графическому процессору. В более новой архитектуре каждому набору из 16 ядер CUDA назначается один планировщик (2x Pascal), а также один блок диспетчеризации на 16 ядер CUDA (аналогично Pascal). Четыре из этих 16-ядерных групп составляют SM вместе с 96 КБ кэш-памяти, которая может быть сконфигурирована как 64 КБ L1/32 КБ общей памяти или наоборот, и четыре текстурных блока. Поскольку Turing удваивает планировщики, ему нужно всего лишь выдавать инструкции ядрам CUDA каждый второй такт, чтобы они оставались заполненными. В промежутке между ними можно выдать другую инструкцию любому другому устройству, включая ядра INT32.

В частности, в TU116 Nvidia заявляет, что заменяет тензорные ядра Turing 128 выделенными ядрами FP16 на SM, что позволяет GeForce GTX 1660 Ti выполнять операции с половинной точностью в 2 раза быстрее, чем FP32. Однако другие графические процессоры на основе Turing также могут похвастаться удвоенной скоростью FP16, поэтому неясно, чем GeForce GTX 1660 Ti уникальна в своем семействе. Судя по приведенной ниже диаграмме, более очевидно, что 1660 Ti обеспечивает значительное улучшение пропускной способности с половинной точностью по сравнению с GeForce GTX 1060 и ее чипом GP106 на основе Pascal.

Но когда мы запускаем модуль научного анализа Сандры, который проверяет умножение общих матриц, мы видим, насколько большую пропускную способность FP16 достигают тензорные ядра TU106 по сравнению с TU116. GeForce GTX 1060, которая лишь символически поддерживала FP16, вообще практически не отображается на графике.

В дополнение к шейдерам архитектуры Turing и унифицированному кэшу TU116 также поддерживает пару алгоритмов, называемых Content Adaptive Shading и Motion Adaptive Shading, вместе называемых Variable Rate Shading. Мы рассмотрели эту технологию в статье Nvidia Turing Architecture Explore: Inside GeForce RTX 2080. В этой статье также были представлены возможности ускоренного кодирования и декодирования видео Turing, которые также переносятся на GeForce GTX 1660 Ti.

Собираем все вместе…

Nvidia упаковывает 24 SM в TU116, разделяя их между тремя кластерами обработки графики. С 64 ядрами FP32 на SM это 1536 ядер CUDA и 96 текстурных блоков на весь GPU. Партнеры по плате, несомненно, будут нацелены на диапазон частот, чтобы заполнить разрыв между GTX 1660 Ti и RTX 2060. Однако официальная базовая тактовая частота составляет 1500 МГц со спецификацией GPU Boost 1770 МГц. Наш образец EVGA GeForce GTX 1660 Ti XC Black Gaming достиг максимальной частоты около 1845 МГц в трех прогонах Metro: Last Light, в то время как другие карты, которые мы видели, легко превышают 2000 МГц. Таким образом, на бумаге GeForce GTX 1660 Ti предлагает до 5,4 терафлопс производительности FP32 и 10,9 терафлопс пропускной способности FP16.

Шесть 32-разрядных контроллеров памяти дают TU116 совокупную 192-разрядную шину, заполненную модулями GDDR6 со скоростью 12 Гбит/с (Micron MT61K256M32JE-12:A), обеспечивающими скорость до 288 ГБ/с. Это на 50% больше пропускной способности памяти, чем у GeForce GTX 1060, что помогает GeForce GTX 1660 Ti сохранять свое преимущество в производительности при разрешении 2560 x 1440 с включенным сглаживанием.

Каждый контроллер памяти связан с восемью ROP и 256-килобайтным фрагментом кэш-памяти L2. Всего TU116 предоставляет 48 ROP и 1,5 МБ L2. По количеству ROP GeForce GTX 1660 Ti выгодно отличается от RTX 2060, которая также использует 48 выходов рендеринга. Но его фрагменты кэша L2 в два раза меньше.

Несмотря на более крупный кристалл, на 50% большее количество транзисторов и более агрессивную тактовую частоту GPU Boost, GeForce GTX 1660 Ti рассчитана на те же 120 Вт, что и GeForce GTX 1060. К сожалению, ни одна из видеокарт не поддерживает работу с несколькими GPU. Nvidia продолжает настаивать на том, что SLI предназначена для повышения абсолютной производительности, а не для того, чтобы дать геймерам возможность сопоставить конфигурации с одним GPU.

EVGA GeForce GTX 1660 Ti XC Black GamingGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FE Архитектура (GPU) Ядра CUDA Пик FP32 Вычислительные тензорные ядра Ядра RT Текстурные блоки Базовая тактовая частота Скорость ускорения GPU Емкость шины памяти Пропускная способность шины памяти ROPs Кэш L2 TDP Количество транзисторов Поддержка SLI размера кристалла

Тьюринг (TU116)
Тьюринг (TU106)
Паскаль (GP106)
Паскаль (GP104)

1536
1920 г.
1280
1920 г.

5,4 терафлопс
6,45 тлфопс
4,4 терафлопс
6,5 терафлопс

Н/Д
240
Н/Д
Н/Д

Н/Д
30
Н/Д
Н/Д

96
120
80
120

1500 МГц
1365 МГц
1506 МГц
1506 МГц

1770 МГц
1680 МГц
1708 МГц
1683 МГц

6 ГБ GDDR6
6 ГБ GDDR6
6 ГБ GDDR5
8 ГБ GDDR5

192-битный
192-битный
192-битный
256-битный

288 ГБ/с
336 ГБ/с
192 ГБ/с
256 ГБ/с

48
48
48
64

1,5 МБ
3 МБ
1,5 МБ
2 МБ

120 Вт
160 Вт
120 Вт
150 Вт

6,6 миллиарда
10,8 миллиарда
4,4 миллиарда
7,2 миллиарда

284 мм²
445 мм²
200 мм²
314 мм²

Нет
Нет
Нет
Да (МИО)

GeForce GTX 1660 Ti XC Black Gaming от EVGA

GeForce GTX 1060 Founders Edition также была картой мощностью 120 Вт и работала с одним шестиконтактным вспомогательным разъемом. С другой стороны, GeForce GTX 1660 Ti XC Black Gaming от EVGA использует восьмиконтактный вход, что дает ему немного дополнительного запаса. Как мы увидим в нашем тестировании питания для каждой шины, во время нашего стресс-теста карта потребляет 3 А тока через свой слот PCIe — остальное поступает от ее восьмиконтактного разъема.

EVGA использует четыре фазы питания для TU116. Фазы графического процессора управляются более старым ON Semiconductor NCP81276 на задней стороне печатной платы, который подключен к четверке ON Semiconductor NCP302155.

Эти четыре компонента объединяют полевые МОП-транзисторы верхнего и нижнего плеча, драйвер и диод начальной загрузки. Это те же детали, что и в GeForce RTX 2070 Founders Edition, способные выдерживать средний ток до 55 А.

Знакомый двухфазный uP1666Q от Ubiq Semiconductor управляет схемой регулирования напряжения памяти с помощью двух двойных N-канальных МОП-транзисторов QM3816N6.

Возможно, более интересным, чем довольно простой блок питания GeForce GTX 1660 Ti XC Black Gaming, является тот факт, что на печатной плате EVGA есть свободные площадки для дополнительных двух фаз GPU. Также есть пара мест для еще двух модулей памяти GDDR6. Nvidia сделала нечто подобное с GeForce GTX 1060, оставив пару пустых мест на своей карте Founders Edition, которые так и не были заполнены. Это мера экономии времени и средств, которая позволяет компании использовать одну печатную плату для нескольких продуктов.

Металлическая пластина находится поверх печатной платы, зажав термопрокладки между встроенными драйверами/MOSFET, модулями памяти GDDR6 и токоизмерительным резистором. Дополнительные термопрокладки в верхней части пластины удерживают тепло в сборе основного радиатора, который установлен вокруг графического процессора в четырех точках и привинчен к задней стороне печатной платы.

Само тепловое решение состоит из довольно тонкой медной прокладки, которая непосредственно контактирует с TU116. К его верхней части припаяны три сплющенные трубки, а к тепловым трубкам, в свою очередь, припаян массив алюминиевых ребер. Относительно толстый стек ребер усугубляется кожухом, в котором находится один 85-мм вентилятор, что добавляет еще большей глубины. В общем, GeForce GTX 1660 Ti XC Black Gaming от EVGA занимает три слота расширения на вашей материнской плате.

В итоге EVGA меняет толщину на длину. GeForce GTX 1660 Ti XC Black Gaming может иметь глубину 2 дюйма, но всего около 7,5 дюйма (~ 190 мм) в длину и 4 ⅜ дюйма (111 мм) в высоту. Кроме того, по сравнению с мощными картами Founders Edition, которые мы рассматривали, общий вес 1 фунт 7 унций. (656 г) кажется совершенно легким.

Спереди GeForce GTX 1660 Ti XC Black Gaming имеет один двухканальный разъем DVI, порт HDMI и интерфейс DisplayPort. Разъем VirtualLink на основе USB Type-C, который до сих пор можно было увидеть на любой другой карте класса Turing, исчез, что является признаком того, что мы опускаемся до уровня производительности, не способствующего плавному игровому процессу виртуальной реальности (даже на лучших гарнитурах виртуальной реальности). Партнеры Board, решившие добавить VirtualLink в свои проекты, могут сделать это по своему усмотрению; EVGA просто не реализовала это на этой модели.

Как мы тестировали GeForce GTX 1660 Ti XC Black Gaming от EVGA

Очевидно, что GeForce GTX 1660 Ti является более популярной, чем другие рассмотренные нами платы на базе Turing. Таким образом, наша графическая рабочая станция на базе материнской платы MSI Z170 Gaming M7 и процессора Intel Core i7-7700K с тактовой частотой 4,2 ГГц вполне уместна. Процессор дополнен комплектом памяти G.Skill F4-3000C15Q-16GRR. SSD Crucial MX200 здесь, а также Intel DC P3700 емкостью 1,6 ТБ, загруженный играми.

Что касается конкурентов, 1660 Ti в основном идет против GeForce GTX 1070, хотя мы также включаем 1070 Ti. Конечно, сравнения с GeForce GTX 1060 неизбежны. Все эти карты включены в нашу линейку вместе с GeForce RTX 2060 и GeForce RTX 2070. Что касается AMD, нас больше всего интересует Radeon RX 590, хотя Radeon RX Vega 64 и Radeon RX Vega 56 представляют интерес. дополнения тоже.

Наш набор тестов включает Ashes of the Singularity: Escalation, Battlefield V, Destiny 2, Far Cry 5, Forza Horizon 4, Grand Theft Auto V, Metro: Last Light Redux, Shadow of the Tomb Raider, Tom Clancy’s The Division, Tom Clancy’s Ghost. Recon Wildlands, The Witcher 3 и Wolfenstein II: The New Colossus.

Методология тестирования, которую мы используем, взята из PresentMon: Performance In DirectX, OpenGL и Vulkan. Короче говоря, эти игры оцениваются с использованием комбинации OCAT и нашего собственного графического интерфейса для PresentMon с ведением журнала через GPU-Z.

Мы используем драйвер версии 418.91 для тестирования GeForce GTX 1660 Ti и собираем версию 417.54 для всего остального. Карты AMD используют Crimson Adrenalin 2019 Edition 18.12.3.

Обзор Nvidia GeForce GTX 1660 Ti 6GB: Turing без RTX

Наш вердикт

За

Против

Тьюринг без RTX

Встречайте TU116: Turing Sans RT и тензорные ядра

Собираем все вместе…

GeForce GTX 1660 Ti XC Black Gaming от EVGA

Как мы тестировали GeForce GTX 1660 Ti XC Black Gaming от EVGA

Related Posts

System Builder Marathon Q4 2015: LAN Box PC за 895 долларов

System Builder Marathon Q2 2015: игровой мини-ПК за $1600

Обзор блока питания EVGA SuperNOVA 1000 P6

Распаковка PlayStation 5 и практический опыт