Перейти к содержимому

OpenCL в действии: приложения для постобработки, ускоренные

    1652144343

    Что на самом деле обещают гетерогенные вычисления?

    Никто не готов объявить век процессоров оконченным. В конце концов, такие компании, как Xilinx, по-прежнему продают программируемые логические устройства для конкретных приложений, которые гораздо менее функционально интегрированы и универсальны, чем современные центральные процессоры. Иногда, чем проще, тем эффективнее. Вполне вероятно, что специализированные процессоры будут по-прежнему пользоваться успехом в определенных сегментах рынка, особенно там, где главной задачей является высокая производительность. Тем не менее, мы ожидаем, что во все более разнообразном диапазоне основных сред гетерогенные вычисления, когда многие типы вычислительных ресурсов упакованы в одно интегрированное устройство, будут продолжать становиться все более популярными. И как производственные устройства, эти устройства также станут более сложными.

    Логическим завершением гетерогенных вычислений является система на кристалле (SoC), в которой все (или, по крайней мере, многие) системы с основными схемами интегрированы в один пакет. Например, чипы AMD Geode (в настоящее время используемые в проекте One Laptop Per Child) произошли от разработок SoC 1990-х годов. В то время как многим продуктам SoC по-прежнему не хватает мощности для питания современного массового настольного ПК, и AMD, и Intel продают архитектуры, которые сочетают в себе ядра ЦП, графические ресурсы и управление памятью. Эти ускоренные процессоры (APU), как их называет AMD, соответствуют и даже превосходят уровни производительности, ожидаемые от типичных рабочих станций, ориентированных на производительность. В частности, они дополняют знакомые конструкции процессоров множеством ALU, обычно используемых для ускорения 3D-графики. Однако эти программируемые ресурсы не обязательно использовать для игр.

    Исторически сложилось так, что встроенные графические решения включались в работу логикой северного моста чипсета. Из-за серьезных узких мест и задержек в какой-то момент просто стало сложнее масштабировать производительность, используя компоненты платформы, расположенные так далеко друг от друга. В результате мы увидели, что функциональность мигрирует на север в центральный процессор, создавая новое поколение продуктов, способных не только предложить значительно более высокую игровую производительность, но и решать более общие задачи, которые используют гибридную природу SoC с процессором. и функциональность графического процессора. 

    Для AMD это стало долгожданной кульминацией инициативы компании Fusion, которая, предположительно, стала движущей силой приобретения AMD в 2006 году ATI Technologies. AMD увидела потенциал своих процессоров и графических технологий ATI для вытеснения чистых процессоров на постоянно растущей доле рынка, и компания была полна решимости быть в авангарде этого перехода. Intel, конечно, использует собственную графическую технологию, но с другой целью. Решительно, его акцент был больше сосредоточен на вычислительных ядрах, а не на графических технологиях.

    В начале 2011 года появилось первое семейство APU AMD серий C и E, изготовленных по 40-нм техпроцессу. Использование интеграции позволило использовать маломощные модели мощностью 9 и 18 Вт, которые вошли в состав ультрапортативных ноутбуков. Сегодня у нас есть семейство APU A-серии на базе Llano. Использование 32-нанометрового техпроцесса позволяет втиснуть достаточно ресурсов для создания настоящей архитектуры класса настольных компьютеров по доступной цене.

    Хотя здесь задействовано множество спецификаций, возможно, самым большим отличием среди моделей, перечисленных ниже, являются их соответствующие графические движки. В A8 используется конфигурация, которую AMD называет Radeon HD 6550D. Он состоит из 400 потоковых процессоров, ядер Radeon или шейдеров, как вам угодно. A6 переходит на Radeon HD 6530 с 320 потоковыми процессорами. А A4 возвращается к Radeon HD 6410D со 160 потоковыми процессорами.

    Мы уже протестировали процессоры и гибридные процессоры стоимостью менее 200 долларов в ряде наших любимых игровых тестов, поэтому мы знаем, как последние чипы взлетают или падают в современных играх. Теперь мы хотим взглянуть на некоторые другие способы, которыми энтузиасты могут воспользоваться преимуществами вычислительных ресурсов, используя рабочие нагрузки, которые нагружают обычные ядра ЦП и программируемые процессоры, используемые в продуктах, ориентированных на графику.

    В этой первой части серии, состоящей из девяти частей, мы рассматриваем постобработку видео под микроскопом. В свое время это было бы трудоемкой моделью использования, даже с многоядерным процессором под капотом. Поскольку это в значительной степени параллельная рабочая нагрузка, ее ускорение с помощью множества ядер графического процессора стало отличным способом повышения производительности и производительности.

    Мы заручились помощью AMD в составлении этой серии, поэтому сосредоточимся на аппаратном обеспечении компании, чтобы провести несколько довольно простых сравнений. Как ЦП сам по себе работает в программном обеспечении с поддержкой OpenCL? Как насчет одного из APU на базе Llano? Затем мы сопоставим более дешевые гибридные процессоры и более дорогие процессоры с парой различных дискретных карт, чтобы проследить, как производительность увеличивается и уменьшается в каждой конфигурации.

    0 0 голоса
    Rating post
    Подписаться
    Уведомить о
    guest
    0 comments
    Межтекстовые Отзывы
    Посмотреть все комментарии
    0
    Оставьте комментарий! Напишите, что думаете по поводу статьи.x