Skip to content

OpenCL 实战:后处理应用程序,加速

    1652144343

    异构计算的真正承诺是什么?

    没有人准备好宣布 CPU 的时代已经结束。毕竟,像赛灵思这样的公司仍然在销售专用可编程逻辑器件,这些器件的功能集成度和多功能性远低于现代中央处理器。有时,更简单更有效。专用处理器可能会继续在某些市场领域取得成功,尤其是在性能是最受关注的领域。然而,在越来越多样化的主流环境中,我们预计异构计算(将多种类型的计算资源打包到单个集成设备上)将继续变得更加流行。作为制造设备,这些设备也会变得更加复杂。

    异构计算的逻辑终结是片上系统 (SoC),其中所有(或至少许多)主要电路系统都集成到一个封装中。例如,AMD 的 Geode 芯片(目前为每个孩子一台笔记本电脑项目提供动力)是从 1990 年代的 SoC 设计发展而来的。尽管许多 SoC 产品仍然缺乏为现代主流台式 PC 提供动力的能力,但 AMD 和 Intel 都销售结合了 CPU 内核、图形资源和内存控制的架构。这些加速处理单元 (APU),正如 AMD 所称,达到甚至超过了典型的以生产力为导向的工作站的预期性能水平。最值得注意的是,它们通过许多通常用于加速 3D 图形的 ALU 来补充熟悉的处理器设计。不过,这些可编程资源不必用于游戏。

    从历史上看,板载图形解决方案是由芯片组北桥中的逻辑实现的。由于严重的瓶颈和延迟,在某个时候,使用彼此相距很远的平台组件来扩展性能变得更加困难。因此,我们看到功能向北迁移到 CPU 中,创造了一种新型产品,不仅能够提供显着更好的游戏性能,而且能够处理更多通用任务,利用 SoC 与 CPU 的混合特性和 GPU 功能。 

    对于 AMD 来说,这标志着该公司 Fusion 计划的长期追求的高潮,这可能是 AMD 2006 年收购 ATI Technologies 的驱动力。AMD 看到了其 CPU 和 ATI 的图形技术在市场份额不断增加中取代纯 CPU 的潜力,该公司决心成为这一转变的先锋。当然,英特尔采用了自己的内部图形技术,但目的不同。毫无疑问,它的重点更多地集中在处理核心上,而不是图形技术上。

    2011 年初见证了第一个 AMD C 系列和 E 系列 APU 的问世,采用 40 nm 工艺制造。集成的使用使低功耗 9 瓦和 18 瓦型号能够进入超便携笔记本电脑。今天,我们拥有基于 Llano 的 A 系列 APU 系列。使用 32 纳米制造工艺可以以价值导向的价格为真正的桌面级架构注入足够的资源。

    虽然这里有多种规格,但下面列出的模型之间最大的区别可能是它们各自的图形引擎。A8 采用 AMD 称为 Radeon HD 6550D 的配置。它由 400 个流处理器、Radeon 内核或着色器组成,无论您喜欢使用哪个名称。A6 降为 Radeon HD 6530,拥有 320 个流处理器。A4 可以缩减为具有 160 个流处理器的 Radeon HD 6410D。

    我们已经通过一些我们最喜欢的游戏基准测试运行了低于 200 美元的 CPU 和 APU,因此我们知道最新的芯片如何在现代游戏中飙升或下降。现在,我们想看看发烧友可以利用计算资源的其他一些方式,不过,它们使用的工作负载会对传统 CPU 内核和面向图形的产品中的可编程处理器造成负担。

    在这个由九部分组成的系列的最初部分中,我们将视频后处理置于显微镜下。在过去,这将是一种耗时的使用模式,即使在引擎盖下使用多核 CPU 也是如此。但是,由于它是一个很大程度上并行的工作负载,因此使用图形处理器的许多内核对其进行加速已成为提高生产力和提高性能的好方法。

    我们寻求 AMD 的帮助来整理这个系列,所以我们将专注于公司的硬件,以创建一些非常基本的比较。CPU 如何在支持 OpenCL 的软件中单独工作?一个单独的基于 Llano 的 APU 怎么样?然后,我们会将更便宜的 APU 和更昂贵的 CPU 与几个不同的独立卡进行匹配,以绘制在每种配置中性能如何上下扩展的图表。

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x