コンテンツへスキップ

更新:Nvidia Titan XPascal12GBレビュー

    1650133802

    GP102に会う

    編集者注:7ページと8ページに電力、熱、およびノイズの測定値が含まれるように記事を更新し、それらの測定値を反映するように結論を編集しました(10ページを参照)。

    英ポンドと日本円を取引するコツがあります。あなたはキラーホットソースのレシピを持っていて、それは世界中に配布されています。あなたはちょうどあなたの義父の会社でパートナーを作りました。いずれにせよ、あなたはお金について本当に心配しないそのエリートグループにいます。ビーチハウス、ベントレー、ブルガリがあります。そして今、NvidiaはゲーミングPC用のグラフィックカードであるTitanXを持っています。これは3584CUDAコアを搭載した新しいGP102グラフィックプロセッサ上に構築され、384ビットバス上の12GBのGDDR5Xメモリに支えられ、1200ドルで申し分のない価格で提供されます。

    単一のベンチマークが公開される前に、Nvidiaは3番目のPascalベースのGPUを数か月で発売したことで賞賛され、その主力製品の価格を引き上げたという批判を受けました。これは、Corei7-6950Xを前例のない1700ドル以上で導入したときにIntelを燃やしたアプローチです。 。ただし、ここに問題があります。最高のものを購入する人々は、忍び寄る奢侈税の影響を受けません。そして、実際にPCでお金を稼ぐ人は、収入を加速できるハードウェアに喜んでプレミアムを支払います。

    そのすべてが、TitanXでの時間を少し厄介なものにしていると私たちは考えています。朝の価値の考慮はありません。CUDAコアを40%増やし、メモリ帯域幅を50%増やすために、GeForce GTX 1080のコストよりも70%多く支払うことになります。カードを受け取る前から、パフォーマンスはコストに比例しないことを知っていました。それでも、ベンチマークを実行するのが待ちきれませんでした。Titan Xは4Kでフレームレートを改善し、最高品質のゲームには不十分な1080と呼ぶアームチェアのクォーターバックをすばやく満たすことができますか?見つける方法は1つだけです。

    GP102:GP104に似ていますが、大きい点が異なります

    NvidiaはGeForceGTX1080を使用して、GP104(ハイエンドPascal)プロセッサを紹介しました。精神的には、そのGPUはGeForce GTX 980の心臓部で最後に見られたGM204(ハイエンドMaxwell)を継承しました。しかし、Pascalアーキテクチャは16nm FinFET製造とより高速なGDDR5Xメモリと一致するようにタイミングが調整されていたため、結果として得られたGTX1080は問題なく配置できました。どちらもGM200(超ハイエンドMaxwell)を搭載したGTX 980TiおよびTitanXよりも平均フレームレートが30%以上低くなっています。これにより、次のステップを忘れがちになりました。特に、153億トランジスタのGP100(超ハイエンドPascal)はコンピューティング指向であり、おそらくデスクトップ向けではないことがわかっていたためです。

    今、初めて、NvidiaのハイエンドプロセッサとGP104に囲まれた一種のトゥイーンGPUがあります。これはGP102と呼ばれ、アーキテクチャ的にはGP104に似ていますが、大きいだけです。4つのグラフィックス処理クラスターが6つになります。次に、20個のストリーミングマルチプロセッサが30個になります。SMあたり128個のFP32 CUDAコアを備えた、GP102は最大3840個のプログラム可能なビルディングブロックを使用します。GP102は非常に複雑です(120億個のトランジスタで構成されています)。歩留まりを向上させる手段として、NvidiaはプロセッサのSMのうち2つをTitan Xに対して無効にし、ボードのCUDAコアカウントを3584に減らします。また、各SMは8つのテクスチャユニットもホストするため、そのうちの2つをオフにすると224のテクスチャユニットが有効になります。

    Titan Xの仕様は、1531MHzの範囲の一般的なGPUブースト周波数を備えた1417MHzのベースクロックを引用しています。これにより、カードのFP32レートは10.1+ TFLOPSになり、GeForce GTX 1080よりも約23%高くなります。

    間違いなく、GP104は、特に4Kで、さらに広いメモリインターフェイスの恩恵を受けていたでしょう。しかし、GP102のより大きなシェーディング/テクスチャリングの可能性は、確かにある種のリバランスを必要とします。そのため、プロセッサのバックエンドは12個の32ビットメモリコントローラを含むようになり、それぞれが8個のROPと256KBのL2(GP104と同様)にバインドされ、合計96個のROPと3MBの共有キャッシュが生成されます。これにより、384ビットの集約パスが生成されます。Nvidiaには、GTX1080と同じ10Gb /sGDDR5Xが12GB含まれています。

    カードの理論上のメモリ帯域幅は480GB/ s(1080の320 GB / sに対して50%の増加)ですが、Pascalアーキテクチャのデルタカラー圧縮の改善を考慮すると、実効スループットは高くなるはずです。

    AMDが1年以上前にHBMの多くの利点を示したのに、なぜGDDR5から派生したテクノロジーを継続して使用するのでしょうか。GP102の設計段階で、NvidiaはHBM2の供給がどのように振る舞うかわからず、代わりにGDDR5Xベースのサブシステムで安全にプレイしたことを想像することしかできません。GP100は、HBM2とのラインナップで唯一のGPUです。

    GPUTitan X(GP102)GeForce GTX 1080(GP104)Titan X(GM100)SM CUDAコアベースクロックGPUブーストクロックGFLOP(ベースクロック)テクスチャユニットテクセルフィルレートメモリデータレートメモリ帯域幅ROPL2キャッシュTDPトランジスタダイサイズプロセスノード

    28
    20
    24

    3584
    2560
    3072

    1417 MHz
    1607 MHz
    1000 MHz

    1531 MHz
    1733 MHz
    1075 MHz

    10,157
    8228
    6144

    224
    160
    192

    342.9 GT / s
    277.3 GT / s
    192 GT / s

    10 Gb / s
    10 Gb / s
    7 Gb / s

    480GB/秒
    320GB/秒
    336.5 GB / s

    96
    64
    96

    3MB
    2MB
    3MB

    250W
    180W
    250W

    120億
    72億
    80億

    471mm²
    314mm²
    601mm²

    16nm
    16nm
    28nm

    Nvidiaが、明らかに最後の最後に、GeForceファミリーからTitanXを遠ざけることを選択したのは興味深いことです。geforce.comのTitanXランディングページは、これを究極のグラフィックカードと呼んでいます。究極のゲーム用グラフィックカードではありません。むしろ、「究極。限目。” もちろん、私たちが大型のGP104を扱っていることを考えると、TitanXはゲームが得意なはずです。

    しかし、スタンフォード大学が主催するAIミートアップでTitan Xを発表するという同社の決定は、今回はディープラーニングに焦点を合わせていることを示しています。そのために、FP16とFP64のレートはGP104(さらにはGP102)ではひどく遅いですが、両方のプロセッサは4:1でINT8をサポートし、TitanXの基本周波数で40.6TOPSを生成します。

    タグ:
    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x