Перейти до вмісту

Огляд AMD Radeon RX 480 8 ГБ

    1650103202

    Зустрічайте Polaris 10

    Шість місяців тому AMD почала дражнити про функції, які запропонують її графічні процесори наступного покоління, починаючи з контролера дисплея, оновленого для підтримки HDMI 2.0b і DisplayPort 1.3 HBR3, FreeSync через HDMI і конвеєра з підтримкою HDR. Протягом наступних тижнів з’явилися й інші елементи, що вказують на запуск, який включатиме два різних графічних процесора, навмисно створені, щоб повернути частку ринку на популярному ринку настільних комп’ютерів, і представити мобільне рішення, що пропонує продуктивність консольного класу в тонких і легких форм-факторах.

    Остання конструкція включає в себе 16 обчислювальних блоків AMD, узгоджених із 128-бітною шиною пам’яті та прискоренням кодування/декодування відео 4K. Це ще попереду. Radeon RX 480, який ми маємо сьогодні, заснований на більшому дизайні Polaris 10. Але він не великий у тому сенсі, що процесор Nvidia GP100 з 15,3 мільярдами транзисторів є великим. Скоріше, графічний процесор достатньо складний, щоб керувати сучасними гарнітурами віртуальної реальності найвищого класу, що поміщає його принаймні в лігу Radeon R9 290 від AMD і GeForce GTX 970 від Nvidia.

    Продуктивність середнього класу сама по собі не збиває шкарпеток нікого, особливо через місяць після того, як GP104 перевизначив високоякісні. Але, оцінюючи Radeon RX 480 набагато нижче за аналогічні швидкі плати та обмежуючи споживання енергії до 150 Вт, AMD сподівається зробити VR доступною для більшої кількості геймерів (якби компанії, що продають HMD за 600 і 800 доларів США, підіграли цьому).

    Ми очікуємо дві версії Radeon RX 480: модель за 200 доларів з 4 ГБ вбудованої пам’яті GDDR5, що працює зі швидкістю 7 Гбіт/с, і версія за 240 доларів з 8 ГБ 8 Гбіт/с GDDR5. Природно, у нас під рукою є 8 ГБ.

    Всередині Polaris 10

    Polaris 10 складається з 5,7 мільярдів транзисторів на кристалі 230 мм². Порівняйте це з 6,2 мільярдами транзисторів на Гаваях на кристалі 438 мм². Як ви побачите на наших сторінках тесту, RX 480 зазвичай знаходиться десь між R9 290 і 390 … з меншою кількістю транзисторів і приблизно 55% бюджету енергії. Багато з цього, природно, пов’язано з 14-нм процесом FinFET від GlobalFoundries, який AMD вважає за принципову перевагу в продуктивності та потужності порівняно з планарними транзисторами 28-нм вузла. На будь-якому рівні потужності FinFET забезпечує вищі тактові частоти. На обраній частоті 14-нм пристрій споживає менше енергії. Що стосується Polaris, AMD вибирає обидва місця, щоб підвищити тактову частоту та зменшити споживання. Ось як він здатний перевершити більш багаті на ресурси графічні процесори, такі як Hawaii, при стелі 150 Вт (хоча наші вимірювання показують, що RX 480 трохи змінює свій TDP).

    Незважаючи на нову кодову назву, Polaris 10 базується на реалізації четвертого покоління архітектури AMD Graphics Core Next. Маючи це на увазі, більшість ентузіастів, які вже знайомі з GCN, збираються впізнати будівельні блоки дизайну Polaris, що зробить наше покрокове розгляд дизайну досить простим.

    Технічні характеристики

    AMD Radeon RX 480

    AMD Radeon R9 390

    AMD Radeon R9 290

    Єдиний графічний командний процесор, як і раніше, відповідає за розсилку графічних черг до шейдерних двигунів. Асинхронні обчислювальні механізми також мають завдання обробляти черги обчислень. Тільки зараз AMD каже, що її логіка обробки команд складається з чотирьох ACE замість восьми, з двома блоками Hardware Scheduler для пріоритетних черг, управління тимчасовими/просторовими ресурсами та розвантаження завдань планування драйверів режиму ядра ЦП. Це не окремі або нові блоки самі по собі, а скоріше додатковий режим, в якому можуть працювати існуючі конвеєри. Дейв Наласко, старший технологічний менеджер з графіки в AMD, допомагає прояснити їх призначення:

    “HWS (Hardware Workgroup/Wavefront Schedulers) – це, по суті, конвеєри ACE, які налаштовані без диспетчерських контролерів. Їх завдання полягає в тому, щоб розвантажити центральний процесор, обробляючи планування черг користувача/драйвера на доступних апаратних слотах черги. Це процесори, які програмуються мікрокодом. які можуть реалізувати різноманітні політики планування. Ми використовували їх для впровадження функцій черги швидкого реагування та резервування CU в Polaris, і ми змогли перенести ці зміни на продукти GCN третього покоління за допомогою оновлень драйверів».

    Черги швидкого реагування дозволяють розробникам визначати пріоритети певних завдань, що виконуються асинхронно, не випереджаючи повністю інші процеси. Якщо ви пропустили публікацію в блозі Дейва про цю функцію, ви можете перевірити її тут. Коротше кажучи, гнучкість — це те, що AMD хоче довести до кінця. Його архітектура дозволяє використовувати кілька підходів до покращення використання та мінімізації затримок, що є надзвичайно важливими в таких програмах, як VR.

    Обчислювальні одиниці, які ми так добре знаємо, складаються з 64 шейдерів, що відповідають стандарту IEEE 754-2008, розділених між чотирма векторними одиницями, скалярною одиницею та 16 одиницями завантаження/зберігання текстур вибірки. Кожен CU також містить чотири блоки текстур, 16 КБ кешу L1, 64 КБ локального спільного використання даних і регістровий простір для векторних і скалярних одиниць. AMD стверджує, що внесла ряд налаштувань для підвищення ефективності CU, включаючи додавання вбудованої підтримки FP16 (і Int16), налаштований доступ до кешу та кращу попередню вибірку інструкцій. Загалом ці зміни дають на 15% більше продуктивності на CU, ніж графічний процесор Hawaii Radeon R9 290, який заснований на архітектурі GCN другого покоління.

    Дев’ять CU організовано в шейдерний движок, а Polaris 10 може похвалитися чотирма такими SE, що відповідає тому, що ми знаємо як максимум архітектури. Математика (64 шейдери * дев’ять CU * чотири SE) додає до 2304 потокових процесорів і 144 блоки текстур.

    Кожен Shader Engine пов’язаний з Geometry Engine, який, як стверджує AMD, покращує, додаючи примітивний прискорювач відкидання для перекидання будь-якого примітиву, який не буде растеризовано до пікселя перед перетворенням сканування, таким чином збільшуючи пропускну здатність. Це автоматична функція етапу попередньої растеризації графічного конвеєра, яка є абсолютно новою для Polaris. Існує також кеш індексів для екземплярів геометрії, хоча ми не впевнені, наскільки він великий або наскільки значний його вплив при використанні екземпляра.

    Як і на Гаваях, Polaris 10 може використовувати до чотирьох примітивів за такт. Але в той час як найшвидші графічні процесори на Гаваях/Гренаді працюють на частоті до 1050 МГц (у випадку R9 390X), AMD підвищує Radeon RX 480 до базової тактової частоти 1120 МГц і рейтингу «підвищення» 1266 МГц, компенсуючи деякі з них. він втрачає ресурси на кристалі, використовуючи вищі частоти. У той час як Radeon R9 290X пропонував 5,6 TFLOPS продуктивності одинарної точності з плаваючою комою, RX 480 досягає до 5,8 TFLOPS, використовуючи цю специфікацію «підвищення».

    Наскільки реалістичним є число 1266 МГц? На Гаваях була справжня велика проблема з підтримкою тактової частоти AMD, коли стало гаряче, і ми хотіли переконатися, що така поведінка не вплине на Polaris. Використовуючи Metro: вбудований тест Last Light Redux зациклився 10 разів, ми записали частоти за допомогою GPU-Z і отримали наступний графік:

    Між найнижчою та найвищою точками на цій лінійній діаграмі є рівно 148 МГц. Підлога – 1118 МГц, стеля – 1265 МГц. Ми б сказали, що AMD майже точно підвищить свою базу та підвищить рейтинги, навіть якщо те, що відбувається між ними, підлягає постійним коригуванням. Принаймні в середньому 1208 МГц ближче до верхньої, ніж до нижньої.

    Hawaii і Fiji SE мають по чотири сервера візуалізації кожен, здатний до 16 пікселів за такт (або 64 через GPU). Polaris 10 скорочує цю цифру навпіл. Два сервера візуалізації на SE, кожен із чотирма ROP, всього 32 пікселі за такт. Це значне скорочення порівняно з Radeon R9 290 на Гаваях, який AMD має перевершити з його RX 480. Що ще більше ускладнює проблему, Polaris 10 використовує 256-бітну шину пам’яті — набагато вужче, ніж сукупний 512-бітний шлях на Гаваях. Версія Radeon RX 480 об’ємом 4 ГБ буде включати 7 Гбіт/с GDDR5, що забезпечить пропускну здатність 224 ГБ/с, тоді як модель на 8 ГБ, яку ми тестуємо сьогодні, використовує пам’ять 8 Гбіт/с, збільшуючи пропускну здатність до 256 ГБ/с. Тим не менш, це набагато менше, ніж у R9 290 з 320 ГБ/с.

    Частина дефіциту компенсується покращеним стисненням дельта-колір, що зменшує кількість інформації, що передається по шині. AMD тепер підтримує співвідношення без втрат 2/4/8:1, подібно до архітектури Nvidia Pascal. Polaris 10 також отримує переваги від більшої 2 МБ кеш-пам’яті L2, вперше побаченої на Фіджі. Це може допомогти повернутися до поїздок до GDDR5, ще більше зменшуючи залежність графічного процесора від широкої шини та високої швидкості передачі даних.

    Тим не менш, висунення задньої частини графічного процесора має впливати на продуктивність, оскільки збільшується роздільна здатність і використання згладжування. Цікаво, як Polaris порівнюється з Гавайськими островами, оскільки робоче навантаження посилюється, ми запустили Grand Theft Auto V на скромному 1920×1080 з налаштуваннями дуже високої деталізації, а потім почали нарощувати згладжування.

    Звичайно, ви можете побачити, як Radeon RX 480 втрачає середню частоту кадрів набагато швидше, ніж R9 390, оскільки MSAA перемикається з Off на 2x до 4x. З вимкненим AA 480 досягає 97,3 FPS, а 390 – 90,4. Але в кінці кінців, AMD Radeon RX 480 впав до 57,5 ​​кадрів в секунду, тоді як 390 в середньому 62,9.

    0 0 голосів
    Rating post
    Підписатися
    Сповістити про
    guest
    0 comments
    Вбудовані Відгуки
    Переглянути всі коментарі
    0
    Ми любимо ваші думки, будь ласка, прокоментуйте.x