コンテンツへスキップ

Nvidia GeForce GTX 1660レビュー:Turingの猛攻撃は続く

    1646061603

    私たちの評決

    GeForce GTX 1660 Tiと同じTU116プロセッサに基づいて、NvidiaのGeForce GTX 1660は2つのストリーミングマルチプロセッサを失い、GDDR6メモリを低速のGDDR5に交換します。結果として、1920×1080でのゲームには依然として優れた選択肢ですが、2560×1440では推奨されません。ご購入前に必ず比較ショップをご利用ください。Radeon RX 580カードのホットディールは、パフォーマンスが低いにもかかわらず、一見の価値があるかもしれません。

    にとって

    優れた1080pパフォーマンス
    220ドルのエントリポイントで魅力的な価格
    適度な120Wの消費電力は、熱とノイズを低く抑えるのに役立ちます

    に対して

    1440pゲームには理想的ではありません
    より高速なGeForceGTX 1660Tiと同様の電力プロファイル

    Nvidia GeForce GTX1660レビュー

    NvidiaがGeForceGTX 1660 Tiで手付かずのTU116グラフィックプロセッサを採用し、それを少し切り分けて低コストの派生物を作成するのは時間の問題でした。新しいGeForceGTX 1660は、当然のことながら、TuringアーキテクチャのシグネチャーRTおよびTensorコアがないという点でハイエンドモデルと非常によく似ています。代わりに、今日のラスタライズされたゲームを加速するためのオンダイリソースを目指しています。

    Nvidiaは、GeForce GTX 1660の作成において、TU116のリソースプールを大幅に削減していません。128個のCUDAコアと8個のテクスチャユニットを備えたストリーミングマルチプロセッサのペアが削除されています。しかし、それ以外の点ではGPUは完全です。このカードの最大の損失は、GDDR6メモリの不足です。代わりに8Gb / s GDDR5に交換することで、帯域幅は1660Tiの288GB / sからわずか192GB / sに低下します。

    Nvidia Geforce GTX 1660(Nvidia)、Amazonで$ 605.32

    当然のことながら、GeForce GTX 1660は主にFHDゲームを対象としており、6 GBの低速メモリは、高解像度の場合ほどパフォーマンスに悪影響を与えません。しかし、220ドル/ 200ポンドのボードは、より広いバスでより多くのGDDR5を搭載したAMDのRadeon RX 590を回避するのに十分な速度でフレームレートを維持できますか?

    TU116要約:RTコアとテンソルコアを使用しないチューリング

    GeForce GTX 1660の中心にあるGPUは、具体的にはTU116-300-A1という名前です。これは、GeForce GTX 1660 TiのTU116-400-A1の近縁であり、24のストリーミングマルチプロセッサから22にトリミングされています。明らかに、Nvidiaの将来を見据えたRTおよびTensorコアがなく、測定値が284mm²で6.6で構成されるプロセッサを扱っています。 TSMCの12nmFinFETプロセスを使用して製造された10億個のトランジスタ。

    トランジスタが小さいにもかかわらず、TU116はそれ以前のGP106プロセッサよりも42パーセント大きくなっています。その成長の一部は、Turingアーキテクチャのより洗練されたシェーダーに起因しています。ハイエンドのGeForceRTX 20シリーズカードと同様に、GeForce GTX 1660は、ほとんどのシェーダーワークロードを構成するFP32算術命令の同時実行と、INT32操作(データのアドレス指定/フェッチ、浮動小数点の最小/最大、比較など)をサポートします。 )。チューリングコアが特定のクロックレートでPascalよりも優れたパフォーマンスを達成していると聞いた場合、この機能が主な理由を説明しています。

    チューリングのストリーミングマルチプロセッサは、パスカルよりも少ないCUDAコアで構成されていますが、設計は、各GPU全体により多くのSMを分散することによって部分的に補償します。新しいアーキテクチャでは、16個のCUDAコア(2x Pascal)の各セットに1つのスケジューラーが割り当てられ、16個のCUDAコア(Pascalと同じ)ごとに1つのディスパッチユニットが割り当てられます。これらの16コアグループのうち4つは、SM、64KB L1 / 32KB共有メモリまたはその逆として構成できる96KBのキャッシュ、および4つのテクスチャユニットで構成されます。Turingはスケジューラーを2倍にするため、1クロックサイクルおきにCUDAコアに命令を発行するだけで、それらをフルに保つことができます。その間に、INT32コアを含む他のユニットに別の命令を自由に発行できます。

    TU116では、NvidiaはチューリングのTensorコアをSMごとに128個の専用FP16コアに置き換えます。これにより、GeForce GTX1660はFP32の2倍の速度で半精度演算を処理できます。他のTuringベースのGPUは、Tensorコアを介してダブルレートのFP16も備えているため、TU116の構成は、このGPU専用に配置されたハードウェアを通じてその標準を維持するのに役立ちます。次のグラフは、GeForce GTX 1660 Tiレビューで公開されたものの更新バージョンであり、GeForce GTX1060およびそのPascalベースのGP106チップと比較したTU116の半精度スループットの大幅な向上を示しています。

    一般的な行列の乗算をテストするSandraのScientificAnalysisモジュールを実行すると、TU116と比較してTU106のTensorコアがFP16スループットをどれだけ達成できるかがわかります。シンボリックにFP16のみをサポートしていたGeForceGTX 1060は、チャートにほとんど登録されていません。

    Turingアーキテクチャのシェーダーと統合キャッシュに加えて、TU116は、コンテンツアダプティブシェーディングとモーションアダプティブシェーディングと呼ばれるアルゴリズムのペアもサポートしています。これらはまとめて可変レートシェーディングと呼ばれます。このテクノロジーについては、NvidiaのTuring Architecture Explored:Inside the GeForce RTX 2080で取り上げました。このストーリーでは、GeForce GTX1660にも引き継がれるTuringの高速ビデオエンコードおよびデコード機能も紹介されました。

    すべてを一緒に入れて…

    Nvidiaは24個のSMをTU116にパックし、3つのグラフィックスプロセッシングクラスターに分割します。SMあたり64個のFP32コアを使用すると、GPU全体で1,536個のCUDAコアと96個のテクスチャユニットになります。2つのSMを失うと、GeForce GTX1660は1,408のアクティブなCUDAコアと88の使用可能なテクスチャユニットになります。

    ボードパートナーは間違いなく、カードを差別化するためにさまざまな周波数をターゲットにします。ただし、公式の基本クロックレートは1,530 MHzで、GPUBoost仕様は1,785MHzです。これらの数値は両方とも、GeForce GTX 1660 Tiのクロックよりもわずかに高くなっていますが、欠落しているSMを完全に補うことはできません。

    私たちのギガバイトGeForceGTX 1660 OC 6Gサンプルは、Metro:Last Lightの3回の実行を通じて、安定した1,935 MHzを維持し、数週間前にレビューした1660Tiよりも約90MHz高速で動作しました。紙面では、GeForce GTX 1660は、最大5TFLOPSのFP32パフォーマンスと10TFLOPSのFP16スループットを提供します。

    6つの32ビットメモリコントローラーは、TU116に集約192ビットバスを提供します。このバスには、最大192 GB / sをプッシュする8Gb / sGDDR5モジュールが搭載されています。これはGeForceGTX 1060 6GBに匹敵し、GeForce GTX 1660 Tiと比較して33%削減されます。2つのSMの損失と相まって、GDDR6からGDDR5メモリへのドロップは、GeForce GTX1660の1660Tiと比較したパフォーマンスの低下を説明しています。

    各メモリコントローラーは、8つのROPと256KBのL2キャッシュスライスに関連付けられています。合計で、TU116は48のROPと1.5MBのL2を公開します。GeForce GTX 1660のROPカウントは、48のレンダリング出力を利用するRTX2060と比べても遜色ありません。ただし、TU116のL2キャッシュスライスは、TU106の半分の大きさです。

    GeForce GTX 1660 Tiとの類似点を考えると、GeForce GTX1660の定格が同じ120Wであることは当然のことです。残念ながら、どちらのグラフィックカードにもマルチGPUサポートは含まれていません。Nvidiaは、ゲーマーにシングルGPU構成に一致させる方法を提供するのではなく、SLIがより高い絶対パフォーマンスを推進することを目的としているという説明を引き続き推し進めています。

    ギガバイトGeForceGTX 1660 OC 6GGeForce GTX 1660 TiGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FEアーキテクチャ(GPU)CUDAコアピークFP32コンピューティングテンソルコアRTコアテクスチャユニットベースクロックレートGPUブーストレートメモリ容量メモリバスメモリ帯域幅ROPL2キャッシュTDPトランジスタカウントダイサイズSLIサポート

    チューリング(TU116)
    チューリング(TU116)
    チューリング(TU106)
    パスカル(GP106)
    パスカル(GP104)

    1408
    1536
    1920年
    1280
    1920年

    5 TFLOPS
    5.4TFLOPS
    6.45 TLFOPS
    4.4TFLOPS
    6.5 TFLOPS

    該当なし
    該当なし
    240
    該当なし
    該当なし

    該当なし
    該当なし
    30
    該当なし
    該当なし

    88
    96
    120
    80
    120

    1530 MHz
    1500 MHz
    1365 MHz
    1506 MHz
    1506 MHz

    1785 MHz
    1770 MHz
    1680 MHz
    1708 MHz
    1683 MHz

    6GB GDDR5
    6GB GDDR6
    6GB GDDR6
    6GB GDDR5
    8GB GDDR5

    192ビット
    192ビット
    192ビット
    192ビット
    256ビット

    192 GB / s
    288 GB / s
    336GB /秒
    192 GB / s
    256 GB / s

    48
    48
    48
    48
    64

    1.5MB
    1.5MB
    3MB
    1.5MB
    2MB

    120W
    120W
    160W
    120W
    150W

    66億
    66億
    108億
    44億
    72億

    284mm²
    284mm²
    445mm²
    200mm²
    314mm²

    番号
    番号
    番号
    番号
    はい(MIO)

    タグ:
    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x