Skip to content

Nvidia GeForce RTX 2080 Ti Founders Edition 评测:泰坦 V 杀手

    1646058004

    我们的判决

    Nvidia 的 GeForce RTX 2080 Ti 是我们测试过的第一款显卡,它能够在 4K 下提供流畅的帧速率,并最大限度地提高细节设置。它的光环功能尚未在任何游戏中使用,但随着这些功能的上线,图灵架构有望更加闪耀。

    为了

    4K 的流畅性能和顶级质量设置
    改进的散热解决方案性能有助于维持更高的 GPU Boost 时钟
    采用具有前瞻性的技术,通过光线追踪和 AI 支持加速下一代游戏

    反对

    对于大多数游戏玩家来说,1200 美元的价格标签是遥不可及的
    双轴流风扇设计将热量排放回您的机箱

    GeForce RTX 2080 Ti 创始人版

    GeForce RTX 2080 Ti 速度很快。没有人会反对这一点。最困扰游戏玩家的是它的价格标签。Founders Edition 主板的成本为 1200 美元,比 2017 年推出的旗舰 GeForce GTX 1080 Ti Nvidia 高 71%。也许令人失望的是,GeForce RTX 2080 Ti 在我们的 13 款 4K 游戏套件中平均比其前身快 26%。

    但是,如果我们告诉你它也击败了 Nvidia 的 Titan V 怎么办?在战地 1 中,GeForce RTX 2080 Ti 的速度提高了 20%。在 Forza Motorsport 7 中,2080 Ti 享有 22% 的优势。根据两张卡的规格,我们没想到会有如此戏剧性的结局。尽管基于 GV100 的 3000 美元 Titan V 是为深度学习而非游戏而制造的,但这些结果确实将 GeForce RTX 2080 Ti 的 1200 美元价格置于背景之中。因此,如果您负担得起,RTX 2080 Ti 是最好的显卡之一。

    对于越来越多的 4K 显示器发烧友群体而言,更重要的是,GeForce RTX 2080 Ti 在不牺牲细节设置的情况下为您提供 3840×2160 的可玩性能。是的,我们关闭了征税抗锯齿模式以进行 4K 测试。然而,我们的基准测试反映了每款游戏中超过 60 FPS 的高分辨率、高质量 PC 游戏。

    这是我们多年来一直期待的时刻。如果您调低细节,GeForce GTX 980 Ti 可以在 4K 下播放。尽管 GeForce GTX 1080 让我们更接近于游戏的必杀技,但它显然不是在最高质量 4K 下实现流畅性能所需的令人惊叹的东西。然后,GeForce GTX 1080 Ti 诱使我们最终宣布成为 4K 冠军。但我们很高兴我们推迟了。GeForce RTX 2080 Ti 最终使这些 Ultra 设置在 3840×2160 下可行。

    TU102:游戏野兽的素质

    GeForce RTX 2080 Ti 如何做到这一点?好吧,如果你错过了我们对显卡内部工作原理的全面分析,请查看 Nvidia 的图灵架构探索:GeForce RTX 2080 内部。不过,总而言之,今天的主题是基于 TU102,一个 754 平方毫米的 GPU,由 186 亿组成采用台积电 12nm FinFET 制造工艺制造的晶体管。它加载了比我们测试过的任何东西都更高效的渲染资源。

    一个完整的 TU102 处理器包括六个图形处理集群 (GPC),由一个光栅引擎和六个纹理处理集群 (TPC) 组成。每个 TPC 由一个 PolyMorph 引擎(固定功能几何流水线)和两个流式多处理器 (SM) 组成。在 SM 级别,我们发现 64 个 CUDA 内核、8 个 Tensor 内核、1 个 RT 内核、4 个纹理单元、16 个加载/存储单元、256KB 的寄存器文件空间、4 个 L0 指令缓存和 96KB 可配置的 L1 缓存/共享内存结构.

    将所有这些相乘,您将得到一个具有 72 个 SM、4608 个 CUDA 内核、576 个 Tensor 内核、72 个 RT 内核、288 个纹理单元和 36 个 PolyMorph 引擎的 GPU。这些资源由 12 个 32 位 GDDR6 内存控制器提供,每个都连接到一个 8 ROP 集群和 512KB 的二级缓存,从而产生一个聚合的 384 位内存总线、96 个 ROP 和一个 6MB 二级缓存。每个 SM 还包含一对支持 FP64 的 CUDA 内核,产生的双精度速率是 TU102 的 FP32 性能的 1/32。

    GeForce RTX 2080 Ti FEGeForce RTX 2080 FEGeForce GTX 1080 Ti FEGeForce GTX 1080 FE 架构 (GPU) CUDA 核心峰值 FP32 计算张量核心 RT 核心 纹理单位 基本时钟频率 GPU 提升率 内存容量 内存总线 内存带宽 ROPs L2 高速缓存 TDP 晶体管数量 芯片尺寸SLI 支持

    图灵 (TU102)
    图灵 (TU104)
    帕斯卡 (GP102)
    帕斯卡 (GP104)

    4352
    2944
    3584
    2560

    14.2 TFLOPS
    10.6 TFLOPS
    11.3 TFLOPS
    8.9 TFLOPS

    544
    368
    不适用
    不适用

    68
    46
    不适用
    不适用

    272
    184
    224
    160

    1350兆赫
    1515兆赫
    1480兆赫
    1607兆赫

    1635兆赫
    1800兆赫
    1582兆赫
    1733兆赫

    11GB GDDR6
    8GB GDDR6
    11GB GDDR5X
    8GB GDDR5X

    352 位
    256 位
    352 位
    256 位

    616 GB/秒
    448 GB/秒
    484 GB/秒
    320 GB/秒

    88
    64
    88
    64

    5.5MB
    4MB
    2.75MB
    2MB

    260W
    225W
    250W
    180W

    186亿
    136亿
    120亿
    72亿

    754 平方毫米
    545 平方毫米
    471 平方毫米
    314 平方毫米

    是(x8 NVLink,x2)
    是(x8 NVLink)
    是 (MIO)
    是 (MIO)

    将它们放在一起:GeForce RTX 2080 Ti

    不过,GeForce RTX 2080 Ti 上的 TU102 并不是一个完整的处理器。无论 Nvidia 是想为 Titan 级模型留出空间,还是发现功能齐全的 GPU 的产量在某个 bin 之上不能令人满意,RTX 2080 Ti 都禁用了两个 TPC,使该卡具有 4352 个 CUDA 核心、544 个 Tensor 核心、68 个RT 核心、544 个纹理单元和 34 个 PolyMorph 引擎。

    TU102 的一个 32 位内存控制器也被关闭,创建了一个聚合的 352 位总线,将数据移动到 88 个 ROP 和 5.5MB 的 L2 缓存。Nvidia 将其战略性受限的 GPU 与美光的 MT61K256M32JE-14:A 模块相匹配。其中 11 个安装在 RTX 2080 Ti 的 PCB 上,剩下一个空置。尽管如此,由于 GDDR6 更高的数据速率,理论峰值带宽与上一代卡相比急剧上升。在 352 位接口上 14 Gb/s 时,您看到的是 616 GB/s。相比之下,11 Gb/s 的 GDDR5X 将 GeForce GTX 1080 Ti 保持在 484 GB/s。

    在 Founders Edition 卡上,只要 GeForce RTX 2080 Ti 运行得足够冷,1350 MHz 的基本核心频率就会一路跃升至 1635 MHz 的典型 GPU 加速率。由于 Nvidia 引用了使用 GPU Boost 数字的峰值计算性能,其高端模型实现了高达 14.2 TFLOPS 的单精度数学运算。

    该频率相对于 Nvidia 的参考规格超频。因此,Founders Edition 型号的 260W TDP 额定值略高。理论上,一个 PCIe 插槽、一个八针电源连接器和一个六针电源连接器能够满足这样的限制。然而,Nvidia 改为使用两个补充的八针连接器,为其 GeForce RTX 2080 Ti Founders Edition 提供了超频的潜在空间。

    从 PCIe 连接器回到 GeForce RTX 2080 Ti 的电源,我们为 GDDR6 内存和相应的 PWM 控制器计算了三个相位。据英伟达称,总共还剩下 13 个阶段。但这不可能是对的,不是吗?即使有六个倍相电路,也会有一个相位剩余用作负载平衡器。数字只是不加起来。

    实际上,看起来五相由八针连接器供电并加倍。每相有两个控制回路,5*2=10个稳压电路。GPU 左侧的其余三个相位由主板的 PCIe 插槽供电,而不是加倍。这给了我们 Nvidia 的幸运数字 13(以及智能负载分配方案)。当然,实现所有这些都需要正确的组件……

    GPU电源

    此设计的前端和中心是 uPI 的 uP9512 八相降压控制器,专为支持下一代 GPU 而设计。根据 uPI,“uP9512 提供可编程输出电压和有源电压定位功能,可根据负载电流调整输出电压,因此它针对负载电流瞬态进行了最佳定位。”

    uP9512 支持带有 PWMVID 的 Nvidia 的 Open Voltage Regulator Type 4i+ 技术。该输入经过缓冲和滤波以产生非常准确的参考电压。然后将输出电压精确控制到参考输入。集成的 SMBus 接口提供了足够的灵活性来优化性能和效率,同时还促进了与适当软件的通信。

    所有 13 个电压调节电路都配备了带有集成 PowerTrench MOSFET 和驱动器 IC 的 ON Semiconductor FDMF3170 智能功率级模块。

    像往常一样,线圈依赖于封装的铁氧体磁芯,但这次它们是矩形的,以便为电压调节器电路腾出空间。

    内存电源

    美光的 MT61K256M32JE-14:A 内存 IC 由来自第二个 uP9512 的三相供电。同样的 FDMF3170 智能功率级模块再次出现。470mH 线圈提供的电感比 GPU 电源相位上的线圈更大,但它们在物理尺寸方面完全相同。

    输入滤波通过三个 1μH 线圈进行,其中三个连接线中的每一个都有一个匹配的分流器。这是一个非常低的电阻,其电压降被并行测量并传递到遥测。通过这些电路,Nvidia 能够以相当精确的方式限制电路板功率。

    不幸的是,对于喜欢冗余的人来说,这张卡只配备了一个 BIOS。

    我们如何测试 GeForce RTX 2080 Ti

    毫无疑问,Nvidia 最新和最伟大的产品将出现在 AMD 和英特尔现在提供的众多高端平台之一中。不过,我们的图形站仍然采用 MSI Z170 Gaming M7 主板和 4.2 GHz 的 Intel Core i7-7700K CPU。该处理器由 G.Skill 的 F4-3000C15Q-16GRR 内存套件补充。Crucial 英睿达的 MX200 固态硬盘仍然存在,还有一个 1.4TB 的英特尔 DC P3700 加载了游戏。

    就竞争而言,GeForce RTX 2080 Ti 仅能与 3000 美元的 Titan V 相媲美。这次我们将该卡与 GeForce GTX 1080 Ti、Titan X、GeForce GTX 1080、GeForce GTX 1070 Ti 一起添加到我们的测试池中,以及来自 Nvidia 的 GeForce GTX 1070。AMD 以 Radeon RX Vega 64 和 56 为代表。所有显卡都是 Founders Edition 或参考型号。我们确实有一些来自 Nvidia 和 AMD 的内部合作伙伴板,并计划将它们用于第三方审查。

    我们的基准选择现在包括《奇点灰烬:升级》、《战地 1》、《文明 VI》、《命运 2》、《毁灭战士》、《孤岛惊魂 5》、《极限竞速 7》、《侠盗猎车手 5》、《地铁:最后的曙光》、《古墓丽影:崛起》、《汤姆克兰西》全境封锁、汤姆克兰西的幽灵行动荒地、巫师 3 和魔兽世界:争霸艾泽拉斯。我们正在努力添加 Monster Hunter: World、Shadow of the Tomb Raider、Wolfenstein II 和其他几个,但由于 Nvidia 为其基于图灵的卡的最终驱动程序的时间非常有限,不得不放弃这些计划。

    我们使用的测试方法来自 PresentMon: Performance In DirectX, OpenGL, And Vulkan。简而言之,所有这些游戏都使用 OCAT 和我们自己的 PresentMon 内部 GUI 的组合进行评估,并通过 AIDA64 进行记录。

    您在今天的文章中看到的所有数字都是新鲜的,使用更新的驱动程序。对于 Nvidia,我们为 GeForce RTX 2080 Ti 和 2080 使用 build 411.51。其他显卡使用 build 398.82 进行了测试。Titan V 的结果用 411.51 进行了抽查,以确保性能没有改变。AMD 的显卡使用 Crimson Adrenalin Edition 18.8.1,这是测试时的最新版本。

    Tags:
    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x