Перейти к содержимому

Обзор Nvidia GeForce GTX 1660: натиск Тьюринга продолжается

    1646061603

    Наш вердикт

    Основанная на том же процессоре TU116, что и GeForce GTX 1660 Ti, Nvidia GeForce GTX 1660 теряет два потоковых мультипроцессора и заменяет память GDDR6 на более медленную GDDR5. В результате он остается отличным выбором для игр с разрешением 1920×1080, но не рекомендуется для 2560×1440. Просто обязательно сравните магазин, прежде чем совершать покупку. Горячие предложения по картам Radeon RX 580 могут заслуживать внимания, несмотря на их более низкую производительность.

    За

    Отличная производительность 1080p
    Привлекательная цена при точке входа $220
    Разумное энергопотребление 120 Вт помогает снизить тепловыделение и шум

    Против

    Не идеально подходит для игр 1440p
    Аналогичный профиль мощности, как у более быстрой GeForce GTX 1660 Ti

    Обзор Nvidia GeForce GTX 1660

    Это был лишь вопрос времени, когда Nvidia взяла первоначальный графический процессор TU116 в своей GeForce GTX 1660 Ti и немного урезала его, чтобы создать более дешевую производную. Неудивительно, что новая GeForce GTX 1660 очень похожа на старшую модель, поскольку в ней отсутствуют характерные для архитектуры Turing ядра RT и Tensor. Вместо этого он направляет внутренние ресурсы на ускорение современных растеризованных игр.

    Nvidia даже не сильно урезала ресурсы TU116 при создании GeForce GTX 1660: пара потоковых мультипроцессоров вырезана вместе со 128 ядрами CUDA и восемью текстурными блоками. Но в остальном GPU вполне совершенен. Самая большая потеря этой карты — отсутствие памяти GDDR6. При замене GDDR5 на 8 Гбит/с пропускная способность падает с 288 Гбайт/с у 1660 Ti до 192 Гбайт/с.

    Nvidia Geforce GTX 1660 (Nvidia) на Amazon за 605,32 доллара США.

    Естественно, GeForce GTX 1660 в первую очередь предназначена для игр с разрешением FHD, где 6 Гб более медленной памяти не повредят производительности так сильно, как при более высоких разрешениях. Сможет ли плата за $220/£200 поддерживать достаточно высокую частоту кадров, чтобы противостоять AMD Radeon RX 590 с большим количеством GDDR5 на более широкой шине?

    Резюме TU116: Тьюринг без RT и тензорных ядер

    Графический процессор, лежащий в основе GeForce GTX 1660, получил конкретное название TU116-300-A1. Это близкий родственник GeForce GTX 1660 Ti TU116-400-A1, урезанный с 24 потоковых мультипроцессоров до 22. Очевидно, что мы все еще имеем дело с процессором, лишенным перспективных ядер RT и Tensor от Nvidia, площадью 284 мм² и состоящим из 6,6 ядер. миллиардов транзисторов, произведенных с использованием 12-нанометрового техпроцесса TSMC FinFET.

    Несмотря на меньшие по размеру транзисторы, TU116 на 42% больше, чем предшествовавший ему процессор GP106. Часть этого роста связана с более сложными шейдерами архитектуры Тьюринга. Как и более дорогие карты серии GeForce RTX 20, GeForce GTX 1660 поддерживает одновременное выполнение арифметических инструкций FP32, составляющих большинство рабочих нагрузок шейдеров, и операций INT32 (для адресации/выборки данных, минимальных/максимальных значений с плавающей запятой, сравнения и т. д.). ). Когда вы слышите о том, что ядра Turing достигают более высокой производительности, чем Pascal, при заданной тактовой частоте, эта возможность в значительной степени объясняет, почему.

    Потоковые мультипроцессоры Turing состоят из меньшего количества ядер CUDA, чем у Pascal, но конструкция частично компенсирует это за счет распределения большего количества SM по каждому графическому процессору. В более новой архитектуре каждому набору из 16 ядер CUDA назначается один планировщик (2x Pascal), а также один блок диспетчеризации на 16 ядер CUDA (аналогично Pascal). Четыре из этих 16-ядерных групп составляют SM вместе с 96 КБ кэш-памяти, которая может быть сконфигурирована как 64 КБ L1/32 КБ общей памяти или наоборот, и четыре текстурных модуля. Поскольку Turing удваивает планировщики, ему нужно всего лишь выдавать инструкции ядрам CUDA каждый второй такт, чтобы они оставались заполненными. В промежутке между ними можно выдать другую инструкцию любому другому устройству, включая ядра INT32.

    В TU116 Nvidia заменяет ядра Turing Tensor на 128 выделенных ядер FP16 на SM, что позволяет GeForce GTX 1660 выполнять операции с половинной точностью в 2 раза быстрее, чем FP32. Другие графические процессоры на основе Turing также могут похвастаться удвоенной скоростью FP16 благодаря своим тензорным ядрам, поэтому конфигурация TU116 служит для поддержания этого стандарта за счет аппаратного обеспечения, специально предназначенного для этого графического процессора. Следующая диаграмма представляет собой обновленную версию диаграммы, опубликованной в нашем обзоре GeForce GTX 1660 Ti, которая иллюстрирует значительное улучшение пропускной способности TU116 с половинной точностью по сравнению с GeForce GTX 1060 и ее чипом GP106 на базе Pascal.

    Когда мы запустили модуль научного анализа Сандры, который проверяет умножение общих матриц, мы увидели, насколько большую пропускную способность FP16 достигают тензорные ядра TU106 по сравнению с TU116. GeForce GTX 1060, которая лишь символически поддерживала FP16, вообще практически не отображается на графике.

    Помимо шейдеров и унифицированного кэша архитектуры Turing, TU116 также поддерживает пару алгоритмов, называемых Content Adaptive Shading и Motion Adaptive Shading, вместе называемых Variable Rate Shading. Мы рассмотрели эту технологию в статье Nvidia Turing Architecture Explore: Inside GeForce RTX 2080. В этой статье также были представлены возможности ускоренного кодирования и декодирования видео Turing, которые также переносятся на GeForce GTX 1660.

    Собираем все вместе…

    Nvidia упаковывает 24 SM в TU116, разделяя их между тремя кластерами обработки графики. С 64 ядрами FP32 на SM это 1536 ядер CUDA и 96 текстурных блоков на весь GPU. Потеряв два SM, GeForce GTX 1660 получает 1408 активных ядер CUDA и 88 используемых текстурных блоков.

    Партнеры Правления, несомненно, будут ориентироваться на диапазон частот, чтобы дифференцировать свои карты. Однако официальная базовая тактовая частота составляет 1530 МГц со спецификацией GPU Boost 1785 МГц. Оба эти числа немного выше, чем у GeForce GTX 1660 Ti, хотя они не могут полностью компенсировать отсутствующие SM.

    Наш образец Gigabyte GeForce GTX 1660 OC 6G поддерживал стабильную частоту 1935 МГц в течение трех прогонов Metro: Last Light, работая примерно на 90 МГц быстрее, чем 1660 Ti, который мы рассматривали несколько недель назад. Таким образом, на бумаге GeForce GTX 1660 предлагает до 5 терафлопс производительности FP32 и 10 терафлопс пропускной способности FP16.

    Шесть 32-разрядных контроллеров памяти дают TU116 совокупную 192-разрядную шину, заполненную модулями GDDR5 8 Гбит/с, обеспечивающими скорость до 192 Гбайт/с. Это сравнимо с GeForce GTX 1060 6 ГБ и на 33% меньше по сравнению с GeForce GTX 1660 Ti. В сочетании с потерей двух SM переход с памяти GDDR6 на память GDDR5 объясняет более низкую производительность GeForce GTX 1660 по сравнению с 1660 Ti.

    Каждый контроллер памяти связан с восемью ROP и 256-килобайтным фрагментом кэш-памяти L2. Всего TU116 предоставляет 48 ROP и 1,5 МБ L2. По количеству ROP GeForce GTX 1660 выгодно отличается от RTX 2060, которая также использует 48 выходов рендеринга. Но слайсы кэша L2 TU116 в два раза меньше по сравнению с TU106.

    Учитывая сходство с GeForce GTX 1660 Ti, неудивительно, что GeForce GTX 1660 рассчитана на те же 120 Вт. К сожалению, ни одна из видеокарт не поддерживает работу с несколькими GPU. Nvidia продолжает настаивать на том, что SLI предназначена для повышения абсолютной производительности, а не для того, чтобы дать геймерам возможность сопоставить конфигурации с одним GPU.

    Gigabyte GeForce GTX 1660 OC 6GGeForce GTX 1660 TiGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FE Архитектура (GPU) Ядра CUDA Пик FP32 Вычислительные тензорные ядра Ядра RT Блоки текстур Базовая тактовая частота GPU Boost Rate Rate Емкость шины памяти Пропускная способность памяти ROPs Кэш L2 TDP Transistor Подсчет размеров кристаллов Поддержка SLI

    Тьюринг (TU116)
    Тьюринг (TU116)
    Тьюринг (TU106)
    Паскаль (GP106)
    Паскаль (GP104)

    1408
    1536
    1920 г.
    1280
    1920 г.

    5 терафлопс
    5,4 терафлопс
    6,45 тлфопс
    4,4 терафлопс
    6,5 терафлопс

    Н/Д
    Н/Д
    240
    Н/Д
    Н/Д

    Н/Д
    Н/Д
    30
    Н/Д
    Н/Д

    88
    96
    120
    80
    120

    1530 МГц
    1500 МГц
    1365 МГц
    1506 МГц
    1506 МГц

    1785 МГц
    1770 МГц
    1680 МГц
    1708 МГц
    1683 МГц

    6 ГБ GDDR5
    6 ГБ GDDR6
    6 ГБ GDDR6
    6 ГБ GDDR5
    8 ГБ GDDR5

    192-битный
    192-битный
    192-битный
    192-битный
    256-битный

    192 ГБ/с
    288 ГБ/с
    336 ГБ/с
    192 ГБ/с
    256 ГБ/с

    48
    48
    48
    48
    64

    1,5 МБ
    1,5 МБ
    3 МБ
    1,5 МБ
    2 МБ

    120 Вт
    120 Вт
    160 Вт
    120 Вт
    150 Вт

    6,6 миллиарда
    6,6 миллиарда
    10,8 миллиарда
    4,4 миллиарда
    7,2 миллиарда

    284 мм²
    284 мм²
    445 мм²
    200 мм²
    314 мм²

    Нет
    Нет
    Нет
    Нет
    Да (МИО)

    0 0 голоса
    Rating post
    Подписаться
    Уведомить о
    guest
    0 comments
    Межтекстовые Отзывы
    Посмотреть все комментарии
    0
    Оставьте комментарий! Напишите, что думаете по поводу статьи.x