私たちの評決
GeForce GTX 1660 Tiと同じTU116プロセッサに基づいて、NvidiaのGeForce GTX 1660は2つのストリーミングマルチプロセッサを失い、GDDR6メモリを低速のGDDR5に交換します。結果として、1920×1080でのゲームには依然として優れた選択肢ですが、2560×1440では推奨されません。ご購入前に必ず比較ショップをご利用ください。Radeon RX 580カードのホットディールは、パフォーマンスが低いにもかかわらず、一見の価値があるかもしれません。
にとって
優れた1080pパフォーマンス
220ドルのエントリポイントで魅力的な価格
適度な120Wの消費電力は、熱とノイズを低く抑えるのに役立ちます
に対して
1440pゲームには理想的ではありません
より高速なGeForceGTX 1660Tiと同様の電力プロファイル
Nvidia GeForce GTX1660レビュー
NvidiaがGeForceGTX 1660 Tiで手付かずのTU116グラフィックプロセッサを採用し、それを少し切り分けて低コストの派生物を作成するのは時間の問題でした。新しいGeForceGTX 1660は、当然のことながら、TuringアーキテクチャのシグネチャーRTおよびTensorコアがないという点でハイエンドモデルと非常によく似ています。代わりに、今日のラスタライズされたゲームを加速するためのオンダイリソースを目指しています。
Nvidiaは、GeForce GTX 1660の作成において、TU116のリソースプールを大幅に削減していません。128個のCUDAコアと8個のテクスチャユニットを備えたストリーミングマルチプロセッサのペアが削除されています。しかし、それ以外の点ではGPUは完全です。このカードの最大の損失は、GDDR6メモリの不足です。代わりに8Gb / s GDDR5に交換することで、帯域幅は1660Tiの288GB / sからわずか192GB / sに低下します。
Nvidia Geforce GTX 1660(Nvidia)、Amazonで$ 605.32
当然のことながら、GeForce GTX 1660は主にFHDゲームを対象としており、6 GBの低速メモリは、高解像度の場合ほどパフォーマンスに悪影響を与えません。しかし、220ドル/ 200ポンドのボードは、より広いバスでより多くのGDDR5を搭載したAMDのRadeon RX 590を回避するのに十分な速度でフレームレートを維持できますか?
TU116要約:RTコアとテンソルコアを使用しないチューリング
GeForce GTX 1660の中心にあるGPUは、具体的にはTU116-300-A1という名前です。これは、GeForce GTX 1660 TiのTU116-400-A1の近縁であり、24のストリーミングマルチプロセッサから22にトリミングされています。明らかに、Nvidiaの将来を見据えたRTおよびTensorコアがなく、測定値が284mm²で6.6で構成されるプロセッサを扱っています。 TSMCの12nmFinFETプロセスを使用して製造された10億個のトランジスタ。
トランジスタが小さいにもかかわらず、TU116はそれ以前のGP106プロセッサよりも42パーセント大きくなっています。その成長の一部は、Turingアーキテクチャのより洗練されたシェーダーに起因しています。ハイエンドのGeForceRTX 20シリーズカードと同様に、GeForce GTX 1660は、ほとんどのシェーダーワークロードを構成するFP32算術命令の同時実行と、INT32操作(データのアドレス指定/フェッチ、浮動小数点の最小/最大、比較など)をサポートします。 )。チューリングコアが特定のクロックレートでPascalよりも優れたパフォーマンスを達成していると聞いた場合、この機能が主な理由を説明しています。
チューリングのストリーミングマルチプロセッサは、パスカルよりも少ないCUDAコアで構成されていますが、設計は、各GPU全体により多くのSMを分散することによって部分的に補償します。新しいアーキテクチャでは、16個のCUDAコア(2x Pascal)の各セットに1つのスケジューラーが割り当てられ、16個のCUDAコア(Pascalと同じ)ごとに1つのディスパッチユニットが割り当てられます。これらの16コアグループのうち4つは、SM、64KB L1 / 32KB共有メモリまたはその逆として構成できる96KBのキャッシュ、および4つのテクスチャユニットで構成されます。Turingはスケジューラーを2倍にするため、1クロックサイクルおきにCUDAコアに命令を発行するだけで、それらをフルに保つことができます。その間に、INT32コアを含む他のユニットに別の命令を自由に発行できます。
TU116では、NvidiaはチューリングのTensorコアをSMごとに128個の専用FP16コアに置き換えます。これにより、GeForce GTX1660はFP32の2倍の速度で半精度演算を処理できます。他のTuringベースのGPUは、Tensorコアを介してダブルレートのFP16も備えているため、TU116の構成は、このGPU専用に配置されたハードウェアを通じてその標準を維持するのに役立ちます。次のグラフは、GeForce GTX 1660 Tiレビューで公開されたものの更新バージョンであり、GeForce GTX1060およびそのPascalベースのGP106チップと比較したTU116の半精度スループットの大幅な向上を示しています。
一般的な行列の乗算をテストするSandraのScientificAnalysisモジュールを実行すると、TU116と比較してTU106のTensorコアがFP16スループットをどれだけ達成できるかがわかります。シンボリックにFP16のみをサポートしていたGeForceGTX 1060は、チャートにほとんど登録されていません。
Turingアーキテクチャのシェーダーと統合キャッシュに加えて、TU116は、コンテンツアダプティブシェーディングとモーションアダプティブシェーディングと呼ばれるアルゴリズムのペアもサポートしています。これらはまとめて可変レートシェーディングと呼ばれます。このテクノロジーについては、NvidiaのTuring Architecture Explored:Inside the GeForce RTX 2080で取り上げました。このストーリーでは、GeForce GTX1660にも引き継がれるTuringの高速ビデオエンコードおよびデコード機能も紹介されました。
すべてを一緒に入れて…
Nvidiaは24個のSMをTU116にパックし、3つのグラフィックスプロセッシングクラスターに分割します。SMあたり64個のFP32コアを使用すると、GPU全体で1,536個のCUDAコアと96個のテクスチャユニットになります。2つのSMを失うと、GeForce GTX1660は1,408のアクティブなCUDAコアと88の使用可能なテクスチャユニットになります。
ボードパートナーは間違いなく、カードを差別化するためにさまざまな周波数をターゲットにします。ただし、公式の基本クロックレートは1,530 MHzで、GPUBoost仕様は1,785MHzです。これらの数値は両方とも、GeForce GTX 1660 Tiのクロックよりもわずかに高くなっていますが、欠落しているSMを完全に補うことはできません。
私たちのギガバイトGeForceGTX 1660 OC 6Gサンプルは、Metro:Last Lightの3回の実行を通じて、安定した1,935 MHzを維持し、数週間前にレビューした1660Tiよりも約90MHz高速で動作しました。紙面では、GeForce GTX 1660は、最大5TFLOPSのFP32パフォーマンスと10TFLOPSのFP16スループットを提供します。
6つの32ビットメモリコントローラーは、TU116に集約192ビットバスを提供します。このバスには、最大192 GB / sをプッシュする8Gb / sGDDR5モジュールが搭載されています。これはGeForceGTX 1060 6GBに匹敵し、GeForce GTX 1660 Tiと比較して33%削減されます。2つのSMの損失と相まって、GDDR6からGDDR5メモリへのドロップは、GeForce GTX1660の1660Tiと比較したパフォーマンスの低下を説明しています。
各メモリコントローラーは、8つのROPと256KBのL2キャッシュスライスに関連付けられています。合計で、TU116は48のROPと1.5MBのL2を公開します。GeForce GTX 1660のROPカウントは、48のレンダリング出力を利用するRTX2060と比べても遜色ありません。ただし、TU116のL2キャッシュスライスは、TU106の半分の大きさです。
GeForce GTX 1660 Tiとの類似点を考えると、GeForce GTX1660の定格が同じ120Wであることは当然のことです。残念ながら、どちらのグラフィックカードにもマルチGPUサポートは含まれていません。Nvidiaは、ゲーマーにシングルGPU構成に一致させる方法を提供するのではなく、SLIがより高い絶対パフォーマンスを推進することを目的としているという説明を引き続き推し進めています。
ギガバイトGeForceGTX 1660 OC 6GGeForce GTX 1660 TiGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FEアーキテクチャ(GPU)CUDAコアピークFP32コンピューティングテンソルコアRTコアテクスチャユニットベースクロックレートGPUブーストレートメモリ容量メモリバスメモリ帯域幅ROPL2キャッシュTDPトランジスタカウントダイサイズSLIサポート
チューリング(TU116)
チューリング(TU116)
チューリング(TU106)
パスカル(GP106)
パスカル(GP104)
1408
1536
1920年
1280
1920年
5 TFLOPS
5.4TFLOPS
6.45 TLFOPS
4.4TFLOPS
6.5 TFLOPS
該当なし
該当なし
240
該当なし
該当なし
該当なし
該当なし
30
該当なし
該当なし
88
96
120
80
120
1530 MHz
1500 MHz
1365 MHz
1506 MHz
1506 MHz
1785 MHz
1770 MHz
1680 MHz
1708 MHz
1683 MHz
6GB GDDR5
6GB GDDR6
6GB GDDR6
6GB GDDR5
8GB GDDR5
192ビット
192ビット
192ビット
192ビット
256ビット
192 GB / s
288 GB / s
336GB /秒
192 GB / s
256 GB / s
48
48
48
48
64
1.5MB
1.5MB
3MB
1.5MB
2MB
120W
120W
160W
120W
150W
66億
66億
108億
44億
72億
284mm²
284mm²
445mm²
200mm²
314mm²
番号
番号
番号
番号
はい(MIO)