コンテンツへスキップ

Nvidia GeForce GTX 1660 Ti 6GBレビュー:RTXなしのチューリング

    1649727002

    私たちの評決

    GeForce GTX 1660Tiは10606GBを超えるコストがかかりますが、Nvidiaの最新のTuringベースのボードは、GeForce GTX 1070と同様のパフォーマンスを提供します。高性能、リーズナブルな価格、適度な電力消費が、堅実な上位主流のグラフィックスカードにまとめられています。 。

    にとって

    1920×1080で優れたパフォーマンス
    2560×1440での許容フレームレート
    Turingのビデオエンコード/デコードアクセラレーション機能を保持
    120Wのボード電力はAMDの競合製品と比べて遜色ありません

    に対して

    RT / Tensorコアがないということは、レイトレーシングやDLSSを試すことができないことを意味します

    RTXなしのチューリング

    2019年11月21日更新:2019年2月のGTX 1660 Tiの発売以来、GPUの状況は劇的に変化し、同じTuringアーキテクチャに基づく「スーパー」カードのスワスがありますが、より高いパフォーマンスと低価格の両方を推進しています。同社の最初のチューリングラインナップ。GTX 1660 Tiの潜在的な購入者に最も関連するのは、GeForce GTX 1660 Superです。これは、1660 Tiと同様のパフォーマンスを、229ドルという低い開始価格で提供します。この記事を書いている時点では、これは最低価格のGTX1660Tiよりも約30ドル安い価格です。

    Nvidia GeForce GTX 1660 Tiは、TU116上に構築されています。これは、Turingの改良されたシェーダー、統合されたキャッシュアーキテクチャ、アダプティブシェーディングのサポート、およびビデオのエンコード/デコードアクセラレーション機能の完全な補完を組み込んだまったく新しいグラフィックプロセッサです。GPUは、ハイエンドのGeForce RTX 20シリーズモデルと同様に、GDDR6メモリとペアになっています。しかし、レイトレーシングを高速化するためのRTコアや、ゲームでの推論のためのTensorコアへの取り組みを正当化するのに十分な速さではありません。その結果、TU116は、今日のトップタイトルを強調する仕様のリストを備えたよりスリムなチップです。

    Nvidiaによると、GeForce GTX 1660 Tiは280ドルからで、GeForce GTX10606GBに完全に取って代わります。その基本価格は、Pascalベースの1060 6GBが2016年に旅を始めた場所よりも30ドル(または12パーセント)高いですが、同社はGeForce GTX 1660 Tiが最大1.5倍高速であり、同じ120Wのボード電力定格であると主張しています。劣らず。

    ドルあたりのパフォーマンスの向上は、これまでのTuring世代からはあまり見られませんでした。Nvidiaは、1920 x 1080でのパフォーマンスのために特別に設計されたGPUでそれを好転させることができますか?

    TU116に会う:TuringSansRTとTensorコア

    NvidiaがTuring階層を下って私たちを護衛するときに、4つの別々のGPUを起動するのを見てきました。それぞれについて、会社はより低い価格帯をターゲットにするためにリソースを剥ぎ取ります。ただし、途中でバランスを維持し、ローエンドプロセッサのピークパフォーマンスを不必要に奪うボトルネックを最小限に抑えようとしていることはわかっています。

    GeForce RTX 2060には、2080 TiのCUDAコアとテクスチャユニットの44%、ROPとメモリ帯域幅の54%、L2キャッシュの50%が搭載されています。2060が発売される前は、RTやTensorコアのような贅沢はこれらのレベルではもはや意味がないと考えていました。しかし、バトルフィールドVの一連のパッチ(当時利用可能な1つのレイトレーシング対応ゲーム)により、パフォーマンスが大幅に向上し、Turingのシグネチャー機能を再生可能なフレームレートで引き続き利用できることが証明されました。

    ティアが1つずれていたことがわかりました。Nvidiaは、TU116を、シェーディングの馬力が十分に低くなり、Turingの将来を見据えた機能が多くの目的を果たせなくなる境界と見なしています。RTコアとTensorコアを取り除いた後、TSMCの12nmFinFETプロセスを使用して製造された66億個のトランジスタで構成される284mm²のチップが残ります。しかし、トランジスタが小さいにもかかわらず、TU116はそれ以前のGP106プロセッサよりも42%大きくなっています。

    成長の一部は、チューリングのより洗練されたシェーダーに起因しています。ハイエンドのGeForceRTX20シリーズカードと同様に、GeForce GTX 1660 Tiは、ほとんどのシェーダーワークロードを構成するFP32算術命令の同時実行と、INT32操作(データのアドレス指定/フェッチ、浮動小数点の最小/最大、比較など)をサポートします。 。)。Turingコアが特定のクロックレートでPascalよりも優れたパフォーマンスを達成していると聞いた場合、この機能が主な理由を説明しています。

    Turingのストリーミングマルチプロセッサは、Pascalよりも少ないCUDAコアで構成されていますが、設計は、各GPU全体により多くのSMを分散することによって部分的に補償します。新しいアーキテクチャでは、16個のCUDAコア(2x Pascal)の各セットに1つのスケジューラーが割り当てられ、16個のCUDAコア(Pascalと同じ)ごとに1つのディスパッチユニットが割り当てられます。これらの16コアグループのうち4つは、SM、64KB L1 / 32KB共有メモリまたはその逆として構成できる96KBのキャッシュ、および4つのテクスチャユニットで構成されます。Turingはスケジューラーを2倍にするため、CUDAコアに1クロックサイクルおきに命令を発行するだけで、それらをフルに保つことができます。その間に、INT32コアを含む他のユニットに別の命令を自由に発行できます。

    特にTU116では、Nvidiaは、TuringのTensorコアをSMごとに128個の専用FP16コアに置き換え、GeForce GTX1660TiがFP32の2倍の速度で半精度演算を処理できるようにすると述べています。ただし、他のTuringベースのGPUもダブルレートのFP16を搭載しているため、GeForce GTX1660Tiがそのファミリ内でどのようにユニークであるかは不明です。以下のチャートに基づくと、より明白なのは、1660 Tiが、GeForce GTX 1060およびそのPascalベースのGP106チップと比較して、半精度スループットを大幅に改善していることです。

    しかし、一般的なマトリックスの乗算をテストするサンドラの科学分析モジュールを実行すると、TU116と比較してTU106のテンソルコアがどれだけ多くのFP16スループットを達成するかがわかります。シンボリックにFP16のみをサポートしていたGeForceGTX1060は、チャートにほとんど登録されていません。

    Turingアーキテクチャのシェーダーと統合キャッシュに加えて、TU116は、コンテンツアダプティブシェーディングとモーションアダプティブシェーディングと呼ばれるアルゴリズムのペアもサポートしています。これらはまとめて可変レートシェーディングと呼ばれます。このテクノロジーについては、NvidiaのTuring Architecture Explored:Inside the GeForce RTX 2080で取り上げました。このストーリーでは、GeForce GTX1660Tiにも引き継がれるTuringの高速ビデオエンコードおよびデコード機能も紹介されました。

    すべてを一緒に入れて…

    Nvidiaは24個のSMをTU116にパックし、3つのグラフィックスプロセッシングクラスターに分割します。SMあたり64個のFP32コアを使用すると、GPU全体で1,536個のCUDAコアと96個のテクスチャユニットになります。ボードパートナーは間違いなく、GTX 1660TiとRTX2060の間のギャップを埋めるために周波数の範囲をターゲットにします。ただし、公式の基本クロックレートは1,500 MHzで、GPUBoost仕様は1,770MHzです。私たちのEVGAGeForceGTX 1660 Ti XC Black Gamingサンプルは、Metro:Last Lightの3回の実行で、約1,845 MHzを超えましたが、他のカードは2,000MHzをすぐに超えています。紙面では、GeForce GTX 1660 Tiは、最大5.4TFLOPSのFP32パフォーマンスと10.9TFLOPSのFP16スループットを提供します。

    6つの32ビットメモリコントローラーは、TU116に集約192ビットバスを提供します。このバスには、最大288 GB/sをプッシュする12Gb/ s GDDR6モジュール(Micron MT61K256M32JE-12:A)が搭載されています。これは、GeForce GTX 1060よりも50%広いメモリ帯域幅であり、アンチエイリアシングを有効にして、GeForce GTX1660Tiが2560×1440でパフォーマンス上の利点を維持するのに役立ちます。

    各メモリコントローラーは、8つのROPと256KBのL2キャッシュスライスに関連付けられています。合計で、TU116は48のROPと1.5MBのL2を公開します。GeForce GTX 1660 TiのROPカウントは、48のレンダリング出力を利用するRTX2060と比べて遜色ありません。ただし、そのL2キャッシュスライスは半分の大きさです。

    ダイが大きく、トランジスタ数が50%多く、GPU Boostクロックレートがより積極的であるにもかかわらず、GeForce GTX1660Tiの定格はGeForceGTX1060と同じ120Wです。残念ながら、どちらのグラフィックスカードにもマルチGPUサポートは含まれていません。Nvidiaは、ゲーマーにシングルGPU構成に一致させる方法を提供するのではなく、SLIがより高い絶対パフォーマンスを推進することを目的としているという説明を引き続き推し進めています。

    EVGA GeForce GTX 1660TiXCブラックGamingGeForceRTX2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FEアーキテクチャ(GPU)CUDAコアピークFP32コンピューティングテンソルコアRTコアテクスチャユニットベースクロックレートGPUブーストレートメモリ容量メモリバスメモリ帯域幅ROPL2キャッシュTDPトランジスタカウントダイサイズSLIサポート

    チューリング(TU116)
    チューリング(TU106)
    パスカル(GP106)
    パスカル(GP104)

    1536
    1920年
    1280
    1920年

    5.4TFLOPS
    6.45 TLFOPS
    4.4TFLOPS
    6.5 TFLOPS

    該当なし
    240
    該当なし
    該当なし

    該当なし
    30
    該当なし
    該当なし

    96
    120
    80
    120

    1500 MHz
    1365 MHz
    1506 MHz
    1506 MHz

    1770 MHz
    1680 MHz
    1708 MHz
    1683 MHz

    6GB GDDR6
    6GB GDDR6
    6GB GDDR5
    8GB GDDR5

    192ビット
    192ビット
    192ビット
    256ビット

    288 GB / s
    336GB/秒
    192 GB / s
    256GB/秒

    48
    48
    48
    64

    1.5MB
    3MB
    1.5MB
    2MB

    120W
    160W
    120W
    150W

    66億
    108億
    44億
    72億

    284mm²
    445mm²
    200mm²
    314mm²

    いいえ
    いいえ
    いいえ
    はい(MIO)

    EVGAのGeForceGTX1660TiXCブラックゲーミング

    GeForce GTX 1060 Founders Editionも120Wカードであり、6ピンの補助コネクタが1つ付いていしみました。一方、EVGAのGeForce GTX 1660 Ti XC Black Gamingは、8ピン入力を採用しているため、かなりの余裕があります。レールごとの電力テストでわかるように、カードはストレステスト中にPCIeスロットに3Aの電流を流します。残りは8ピンコネクタから供給されます。

    EVGAはTU116に4つの電力フェーズを利用します。GPUのフェーズは、PCBの背面にある古いON Semiconductor NCP81276によって制御されます。これは、ONSemiconductorNCP302155のカルテットに接続されています。

    これらの4つのコンポーネントは、ハイサイドおよびローサイドMOSFET、ドライバ、およびブートストラップダイオードを統合します。これらは、GeForce RTX 2070 Founders Editionで使用されているものと同じ部品であり、最大55Aの平均電流が可能です。

    Ubiq Semiconductorの使い慣れたデュアルフェーズuP1666Qは、2つのQM3816N6デュアルNチャネルMOSFETを介してメモリの電圧調整回路を制御します。

    GeForce GTX 1660 Ti XC Black Gamingの非常にシンプルな電源よりも興味深いのは、おそらく、EVGAのPCBに追加の2つのGPUフェーズ用の空のパッドがあるという事実です。さらに2つのGDDR6メモリモジュール用の2つの配置もあります。NvidiaはGeForceGTX1060と同様のことを行い、FoundersEditionカードに入力されなかった空白のスポットをいくつか残しました。これは時間とコストを節約する手段であり、会社は1つのPCBを複数の製品に使用できます。

    金属プレートがPCBの上部に配置され、統合されたドライバ/ MOSFET、GDDR6メモリモジュール、および電流検出抵抗の間にサーマルパッドを挟みます。プレート上部のサーマルパッドが増えると、熱がメインシンクアセンブリに移動し続けます。メインシンクアセンブリは、GPUの周囲の4点に取り付けられ、PCBの裏側からねじ込まれています。

    サーマルソリューション自体は、TU116と直接接触するかなり薄い銅パッドで構成されています。平らにされた3本のパイプがその上部にはんだ付けされ、次に一連のアルミニウムフィンがヒートパイプにはんだ付けされます。比較的厚いフィンスタックは、単一の85mmファンを収容し、さらに深さを追加するシュラウドによって誇張されています。とにかく、EVGAのGeForce GTX 1660 Ti XC Black Gamingは、マザーボード上の3つの拡張スロットを使い果たします。

    EVGAは、厚さを長さと交換することになります。GeForce GTX 1660 Ti XC Black Gamingの奥行きは2インチですが、長さは約7.5インチ(〜190mm)、高さは4⅜インチ(111mm)です。さらに、私たちがレビューしてきた頑丈なファウンダーズエディションのカードと比較すると、総重量は1ポンド7オンスです。(656g)なんとも軽い感じ。

    前面では、GeForce GTX 1660 Ti XC Black Gamingは、1つのデュアルリンクDVIコネクタ、HDMIポート、およびDisplayPortインターフェイスを公開しています。これまでに他のすべてのTuringクラスカードに見られたUSBType-CベースのVirtualLinkコネクタはなくなりました。これは、スムーズなVRゲームプレイを実現できないパフォーマンスレベルに低下していることを示しています(最高のVRヘッドセットでも)。デザインにVirtualLinkを追加することを選択したボードパートナーは、自由に追加できます。EVGAは単にこのモデルにそれを実装していませんでした。

    EVGAのGeForceGTX1660TiXCブラックゲーミングのテスト方法

    明らかに、GeForce GTX 1660 Tiは、私たちがレビューした他のTuringベースのボードよりも主流です。そのため、MSI Z170GamingM7マザーボードと4.2GHzのIntelCorei7-7700KCPUをベースにしたグラフィックワークステーションが適切です。プロセッサは、G.SkillのF4-3000C15Q-16GRRメモリキットによって補完されます。CrucialのMX200SSDがここにあり、ゲームがロードされた1.6TBのIntelDCP3700が加わっています。

    競争に関する限り、1660TiはほとんどGeForceGTX 1070に対抗しますが、1070Tiも含まれます。もちろん、GeForceGTX1060との比較は避けられません。これらのカードはすべて、GeForceRTX2060およびGeForceRTX2070とともにラインナップに含まれています。AMD側では、Radeon RXVega64およびRadeonRXVega 56が興味深いものですが、主にRadeonRX590に関心があります。追加も。

    私たちのベンチマークセレクションには、Ashes of the Singularity:Escalation、Battlefield V、Destiny 2、Far Cry 5、Forza Horizo​​n 4、Grand Theft Auto V、Metro:Last Light Redux、Shadow of the Tomb Raider、Tom Clancy’s The Division、Tom Clancy’s Ghost Recon Wildlands、The Witcher 3、Wolfenstein II:TheNewColossus。

    私たちが使用しているテスト方法は、PresentMon:Performance In DirectX、OpenGL、およびVulkanからのものです。つまり、これらのゲームは、OCATとPresentMon用の独自の社内GUIの組み合わせを使用して評価され、GPU-Zを介してロギングされます。

    ドライバーバージョン418.91を使用してGeForceGTX1660 Tiをテストし、その他すべてのビルド417.54を使用しています。AMDのカードはCrimsonAdrenalin2019Edition18.12.3を利用しています。

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x