Перейти к содержимому

Обзор Nvidia GeForce GTX 590 3 ГБ: ответный огонь с 1024 ядрами CUDA

    1651451462

    GeForce GTX 590: тепло

    Сегодня самый сокровенный секрет технологий официально оказывается в центре внимания. По горячим следам AMD Radeon HD 6990 4 ГБ, представленной три недели назад, Nvidia продолжает выпуск своей GeForce GTX 590 3 ГБ. По словам Nvidia, она могла представить эту карту более месяца назад. Однако мы знаем, что компания продолжала пересматривать свои планы относительно нового флагмана вплоть до марта. В результате получилась плата, специально предназначенная для того, чтобы подчеркнуть элегантность сразу после того, как Radeon HD 6990 оглушила нас абразивной акустикой.

    Стремление к бесшумности может показаться ироничным, учитывая, что графические процессоры на базе архитектуры Nvidia Fermi, как известно, горячие и энергоемкие. Думать, что компания сможет разместить две видеокарты на одной печатной плате и не превзойти двухъядерную карту AMD на базе Cayman, почти смехотворно. И тем не менее, именно это, по словам Nvidia, она и сделала.

    Однако признается, что попасть туда было непросто. Компромиссы были сделаны. Например, Nvidia использует ту же конструкцию вентилятора с креплением посередине, за которую мы упрекали AMD. Он снизил тактовые частоты своих графических процессоров, чтобы контролировать температуру. И карта по-прежнему потребляет больше энергии, чем любой графический продукт, который мы когда-либо тестировали.

    Но тихо. Безумно тихо. Самая тихая плата с двумя графическими процессорами, которую я когда-либо тестировал, со времен ATI Rage Fury Maxx (как она для тех дней?). Миссия выполнена на этом фронте. Однако остается вопрос: была ли Nvidia вынуждена отказаться от фермы только для того, чтобы показать AMD, что горячие карты не должны сильно шуметь?

    Под капотом: два GF110, оба неразрезанные

    В моих обсуждениях с Nvidia компания ясно дала понять, что хочет использовать два процессора GF110 и не хочет их ломать. Необрезанные GF110, как вы, вероятно, уже знаете из книги GeForce GTX 580 и GF110: как Nvidia задумала играть, используют четыре кластера обработки графики, каждый с четырьмя потоковыми мультипроцессорами. В каждом SM вы найдете 32 ядра CUDA, всего 512 ядер на GPU. Каждый SM также предлагает четыре блока текстурирования, что дает 64 блока на весь чип. Конечно, на каждый SM также приходится один движок Polymorph, хотя, как мы видели в прошлом, подход Nvidia к распараллеливанию геометрии не всегда хорошо масштабируется.

    Серверная часть графического процессора имеет шесть разделов ROP, каждый из которых способен выводить восемь 32-битных целых пикселей за раз, что в сумме дает до 48 пикселей за такт. Совокупная 384-битная шина памяти делится на секстет 64-битных интерфейсов, и вы найдете 256 МБ памяти GDDR5 на всех шести остановках. Это добавляет до 1,5 ГБ памяти на каждый графический процессор, и именно так вы получаете 3 ГБ GeForce GTX 590.

    Nvidia связывает процессоры GTX 590 GF110 вместе с помощью собственного моста NF200, который использует один 16-канальный интерфейс PCI Express 2.0 и мультиплексирует его в два 16-канальных пути — по одному для каждого графического процессора.

    GeForce GTX 590GeForce GTX 580Radeon HD 6990Radeon HD 6970Radeon HD 6950 Производственный процесс Размер кристалла Транзисторы Двигатель Тактовая частота Потоковые процессоры / Ядра CUDA Вычислительная производительность Текстурные блоки Скорость заполнения текстуры ROP Скорость заполнения пикселей Буфер памяти кадров Память тактовой частоты Пропускная способность памяти Максимальная мощность платы

    40 нм TSMC
    40 нм TSMC
    40 нм TSMC
    40 нм TSMC
    40 нм TSMC

    2 х 520 мм²
    520 мм²
    2 х 389 мм²
    389 мм²
    389 мм²

    2 х 3 миллиарда
    3 миллиарда
    2 х 2,64 миллиарда
    2,64 миллиарда
    2,64 миллиарда

    607 МГц
    772 МГц
    830 МГц
    880 МГц
    800 МГц

    1024
    512
    3072
    1536
    1408

    2,49 терафлопс
    1,58 терафлопс
    5,1 терафлопс
    2,7 терафлопс
    2,25 терафлопс

    128
    64
    192
    96
    88

    77,7 Гтекс/с
    49,4 Гтекс/с
    159,4 Гтекс/с
    84,5 Гтекс/с
    70,4 Гтекс/с

    96
    48
    64
    32
    32

    58,3 Гпикс/с
    37,1 Гпикс/с
    53,1 Гпикс/с
    28,2 Гпикс/с
    25,6 Гпикс/с

    2 х 1,5 ГБ GDDR5
    1,5 ГБ GDDR5
    2 х 2 ГБ GDDR5
    2 ГБ GDDR5
    2 ГБ GDDR5

    853 МГц
    1002 МГц
    1250 МГц
    1375 МГц
    1250 МГц

    2 x 163,9 ГБ/с (384 бита)
    192 ГБ/с (384 бита)
    2 x 160 ГБ/с (256 бит)
    176 ГБ/с (256 бит)
    160 ГБ/с (256 бит)

    365 Вт
    244 Вт
    375 Вт
    250 Вт
    200 Вт

    Что изменилось от плохо принятой GeForce GTX 480 на базе GF100 до GF110? Из моего обзора GeForce GTX 580:

    «Сам графический процессор во многом такой же. Это не переход от GF100 к GF104, когда шейдерные мультипроцессоры переориентируются на повышение производительности в обычных ценовых категориях (читай: больше мощности текстурирования). Акцент здесь остается на вычислении мышц. На самом деле изменений в характеристиках всего два: полноскоростная фильтрация FP16 и улучшенная эффективность Z-cull.

    GF110 может выполнять фильтрацию текстур FP16 за один такт (аналогично GF104), в то время как GF100 требовал два цикла. В приложениях с ограниченным текстурированием это ускорение может привести к повышению производительности. Улучшения отбраковки дают GF110 преимущество в играх, которые часто перерисовываются, помогая максимизировать доступную пропускную способность памяти. Nvidia утверждает, что в почасовом исчислении эти улучшения имеют влияние до 14% (или около того)».

    Помимо этого, мы все еще говорим о двух кусках кремния, изготовленных на узле 40 нм TSMC и состоящих примерно из 3 миллиардов транзисторов каждый. Имея площадь 520 квадратных миллиметров, GF110 значительно больше, чем процессор AMD Cayman, площадь которого составляет 389 мм² и который состоит из 2,64 миллиарда транзисторов.

    Теперь здорово получить все эти ресурсы (в два раза) на GeForce GTX 590. Однако, в то время как GeForce GTX 580 использует тактовую частоту графики 772 МГц и тактовую частоту памяти 1002 МГц, графические процессоры на GTX 590 замедляют работу до 607 МГц и 853 МГц соответственно.

    В результате производительность этой карты далеко не соответствует ожиданиям от двух самых быстрых флагманов Nvidia с одним GPU. Впрочем, это может быть и хорошо. В конце концов, AMD выпустила Radeon HD 6970 в качестве конкурента GeForce GTX 570; 580 сидел в своей собственной лиге. Таким образом, хотя AMD Radeon HD 6990 очень близка к тому, чтобы удвоить производительность самых быстрых одночиповых карт компании, GeForce GTX 590 не нужно делать то же самое, чтобы быть конкурентоспособной по цене в 700 долларов, уже установленной AMD и Nvidia. планирует соответствовать.

    Мы уже знаем, что пришлось сделать AMD, чтобы создать «самую быструю видеокарту в мире». Теперь, как Nvidia противостоит?

    0 0 голоса
    Rating post
    Подписаться
    Уведомить о
    guest
    0 comments
    Межтекстовые Отзывы
    Посмотреть все комментарии
    0
    Оставьте комментарий! Напишите, что думаете по поводу статьи.x