Skip to content

Xeon Phi:英特尔在 TACC 超级计算机中的 Larrabee 衍生卡

    1651711743

    介绍英特尔至强融核

    英特尔的目标是到 2020 年能够实现 exaFLOP 级性能的超级计算机。为了正确看待这一点,我们在 1990 年代中期研究了具有 teraFLOPS 能力的系统。而当今最快的超级计算机达到数十 petaFLOPS。与 1 petaFLOPS 机器相比,实现 1 exaFLOPS 需要 1000 倍的加速。这是一个惊人的大数字。

    毫无疑问,要到达那里需要加速器,正如英特尔所说的那样。AMD 和 Nvidia 满足于将当今最快的超级计算机所使用的浮点性能的突然飙升归功于他们的 GPU。但各方都会同意,这个空间的未来并不完全属于 Xeons 或 Opterons。相反,大多数分析师期望从那些大型 CPU 到更小、更专业的内核的混合计算资源。

    今天,为了迎合两家 GPU 供应商在这一领域已经拥有的领先优势,并解决对计算性能的飙升需求,英特尔正在推出其至强融核协处理器 5110P 并宣布推出至强融核协处理器 3100 系列,该系列将于2013 年发布。

    从本质上讲,至强融核采用 60 个(至少在宣布的 5110P SKU 中)x86 内核和 512 位矢量单元,运行频率超过 1 GHz,并在双插槽上产生超过 1 teraFLOPS 的双精度性能带有定制 Linux 发行版的 PCI Express 卡。同样的 Xeon Phi 5110P 包括 8 GB 的 GDDR5 内存,尽管英特尔计划为 3100 系列卡配备 6 GB 的内存。可以肯定的是,这些内核并非旨在解决您使用第三代 Core 甚至 Atom 处理器处理的通用工作负载。相反,它们在并行任务中表现出色,能够利用这些内核产生更大的效果。 

    为什么您需要像 Phi 这样的加速卡?天气建模、医学成像、能源探索、模拟、财务分析、内容创建和制造都是目前利用 AMD 和 Nvidia 硬件的计算能力的领域。英特尔只是试图对不需要在 CUDA 或 OpenCL 中编码的产品做同样的事情。相反,ISV 可以使用 C、C++ 和 Fortran 对 Phi 进行优化,并在代码中添加特定的内容以适应和利用加速器。

    当然,到达这里并非易事,许多发烧友都会认出 Larrabee 业务部门的名称,这个名称可以追溯到 2005 年。04 年,英特尔在看到时钟频率无法实现之后,开始了一项多年的项目。由于材料(工艺)和功率限制,可无限扩展。Larrabee 历经数年的酝酿,在其发展过程中为我们提供了一系列充满希望和令人尴尬的头条新闻。

    英特尔时间表上的里程碑都引起了极大的兴趣,因为该公司宣传了与竞争对手不同的许多集成内核的概念。当然,当得知 Larrabee 的性能将低于 AMD 和 Nvidia 现有的图形处理器时,英特尔取消了推出自己的显卡的计划,转而专注于架构的高性能计算能力。正如我们将看到的,硬件的预生产示例已经是 Top500 项目的一部分。 

    作为 Xeon Phi 发布的一部分,英特尔让媒体成员飞入德克萨斯高级计算中心,参观采用 Xeon Phi 的 Stampede 超级计算机。当然,我们在旅途中偷偷拍了几张世界上最快的计算系统之一的照片。但在我们能够了解英特尔的高性能计算方法之前,我们需要了解 Larrabee。所以,让我们及时退后一步。

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x