Перейти до вмісту

OpenCL в дії: програми постобробки, прискорені

    1652144343

    Що насправді обіцяють гетерогенні обчислення?

    Ніхто не готовий оголошувати, що вік процесорів закінчився. Зрештою, такі компанії, як Xilinx, досі продають програмовані логічні пристрої, що стосуються конкретної програми, які набагато менш функціонально інтегровані та багатоцільові, ніж сучасні центральні процесори. Іноді простіше – ефективніше. Цілком імовірно, що спеціалізовані процесори продовжуватимуть користуватися успіхом у певних сегментах ринків, особливо там, де головною проблемою є висока продуктивність. Однак ми очікуємо, що гетерогенні обчислення, які містять багато типів обчислювальних ресурсів на одному інтегрованому пристрої, будуть продовжувати ставати все більш популярними у все більш різноманітному діапазоні основних середовищ. І як виробничі пристрої, ці пристрої також стануть складнішими.

    Логічним завершенням гетерогенних обчислень є система на чіпі (SoC), в якій усі (або принаймні багато) основні схемні системи інтегровані в один пакет. Як приклад, чіпи AMD Geode (на даний момент забезпечують проект One Laptop Per Child) розвинулися на основі дизайнів SoC 1990-х років. Хоча багатьом продуктам SoC все ще не вистачає потужності для сучасного стандартного настільного ПК, як AMD, так і Intel продають архітектури, які поєднують ядра ЦП, графічні ресурси та управління пам’яттю. Ці прискорені процесори (APU), як їх називає AMD, відповідають і навіть перевищують рівень продуктивності, який очікується від типових робочих станцій, орієнтованих на продуктивність. Зокрема, вони доповнюють знайомі конструкції процесора багатьма АЛУ, які зазвичай використовуються для прискорення 3D-графіки. Однак ці програмовані ресурси не обов’язково використовувати для ігор.

    Історично вбудовані графічні рішення були включені логікою в північному мосту чіпсета. Через серйозні вузькі місця та затримки в певний момент просто стало важче збільшити продуктивність, використовуючи компоненти платформи, розташовані так далеко один від одного. В результаті ми побачили, що функціональність переміщується на північ до ЦП, створюючи нове покоління продуктів, здатних не тільки запропонувати значно кращу продуктивність в іграх, але й вирішувати більш загальні завдання, які використовують гібридну природу SoC з ЦП. і функціональність графічного процесора. 

    Для AMD це знаменує собою довгоочікувану кульмінацію ініціативи компанії Fusion, яка, ймовірно, була рушійною силою придбання AMD ATI Technologies у 2006 році. AMD побачила потенціал своїх процесорів і графічної технології ATI, щоб витіснити чисті процесори на частці ринку, що постійно зростає, і компанія була сповнена рішучості бути в авангарді цього переходу. Intel, звичайно, використовує власну власну графічну технологію, але з іншою метою. Звичайно, його акцент був більше зосереджений на ядрах обробки і менше на графічних технологіях.

    На початку 2011 року з’явилося перше сімейство APU серії C і E AMD, виготовлених за технологією 40 нм. Використання інтеграції дозволило використовувати моделі на 9 і 18 Вт з низьким енергоспоживанням, які увійшли в ультрапортативні ноутбуки. Сьогодні ми маємо сімейство APU серії A на базі Llano. Використання 32-нм технології виробництва дає змогу створити достатню кількість ресурсів для створення справжньої архітектури класу настільних комп’ютерів за вигідною ціною.

    Хоча тут є різноманітні специфікації, можливо, найбільшою відмінністю серед моделей, перерахованих нижче, є відповідні графічні движки. A8 використовує конфігурацію, яку AMD називає Radeon HD 6550D. Він складається з 400 потокових процесорів, ядер Radeon або шейдерів, залежно від назви, яке вам подобається. A6 переходить до Radeon HD 6530 з 320 потоковими процесорами. А A4 масштабується до Radeon HD 6410D із 160 потоковими процесорами.

    Ми вже випробували процесори та APU за ціною менше 200 доларів США через ряд наших улюблених тестів ігор, тож ми знаємо, як новітні мікросхеми злітають чи тонуть у сучасних іграх. Тепер ми хочемо розглянути деякі з інших способів, яким ентузіасти можуть скористатися перевагами обчислювальних ресурсів, однак, використовуючи робочі навантаження, які обкладають звичайні ядра ЦП і програмовані процесори, які є в продуктах, орієнтованих на графіку.

    У цій першій частині серії з дев’яти частин ми розглядаємо постобробку відео під мікроскопом. Раніше це була модель, що забирала багато часу, навіть з багатоядерним процесором під капотом. Оскільки це переважно паралельне робоче навантаження, його прискорення за допомогою багатьох ядер графічного процесора стало чудовим способом підвищити продуктивність і підвищити продуктивність.

    Ми заручилися підтримкою AMD у складанні цієї серії, тому ми збираємося зосередитися на апаратному забезпеченні компанії, щоб створити кілька досить простих порівнянь. Як сам процесор працює в програмному забезпеченні з підтримкою OpenCL? Як щодо одного з власних APU на базі Llano? Потім ми порівняємо дешевші APU і дорожчі CPU з парою різних дискретних карт, щоб відобразити, як продуктивність збільшується і зменшується в кожній конфігурації.

    0 0 голосів
    Rating post
    Підписатися
    Сповістити про
    guest
    0 comments
    Вбудовані Відгуки
    Переглянути всі коментарі
    0
    Ми любимо ваші думки, будь ласка, прокоментуйте.x