新しいPascalベースのGPUに挨拶する
デビューから2か月後、NvidiaのPascalアーキテクチャは、同社のデスクトップグラフィックカードポートフォリオを上から下へとゆっくりと埋めていきます。最初に登場したのはGeForceGTX1080で、GeForce GTX 980 Tiよりも30%以上高いパフォーマンスを低コストで提供します。オンラインベンダーはまだそれらを在庫に保つことができません(Neweggはこの記事の執筆時点では何も持っていません)。次に、GeForce GTX 1070を紹介しました。これも、数百ドルも安い価格で980Tiを上回っています。
現在、GeForce GTX 1060で3番目のPascalベースのボードを入手しています。今月初めに発表されたNvidiaのパートナーは、250ドルからのバージョンを用意する予定です。Founders Editionの実装は、nvidia.comおよびBest Buyストアで300ドルで販売されるため、オンラインの他の場所で見つからなくても驚かないでください。
GeForce GTX 1060は、GP104と同じ機能の多くを公開するGP106と呼ばれる新しいGPUに基づいていますが、より主流のパッケージになっています。ただし、その用語であなたを思いとどまらせないでください。1060は単なる120Wカードかもしれませんが、Nvidiaは、GeForceGTX980クラスのフレームレートに適していると述べています。2年前、そのレベルのパフォーマンスは550ドルで販売されました。確かに、私たちは長い道のりを歩んできました。
GP106に会う
Nvidiaは、4つのグラフィックスプロセッシングクラスターが有効になっている完全なGP104プロセッサを使用して、主力製品であるGeForceGTX1080を構築しています。これにより、2560CUDAコアと160テクスチャユニットを備えたカードが生成されます。GTX 1070は、3つのGPCがオンになっている同じGPUを中心としており、最大1920コアと120テクスチャユニットを追加します。
GeForce GTX 1060は、同じアーキテクチャのビルディングブロックを使用して同様にスケールダウンします。GeForce GTX 1080の発売カバレッジから:
「各GPCには、5つのスレッド/テクスチャ処理クラスターとラスターエンジンが含まれています。さらに分解すると、TPCは1つのストリーミングマルチプロセッサとPolyMorphエンジンを組み合わせたものです。SMは、128個の単精度CUDAコア、256KBのレジスタファイル容量、96KBの共有メモリ、48KBのL1 /テクスチャキャッシュ、および8個のテクスチャユニットを組み合わせたものです。一方、第4世代のPolyMorphエンジンには、ジオメトリパイプラインの最後で、Nvidiaの同時マルチプロジェクション機能を処理するためのラスターユニットの前にある新しいロジックブロックが含まれています。」
GPU
GeForce GTX 1060(GP106)
GeForce GTX 980(GM204)
SMS
10
16
CUDAコア
1280
2048
ベースクロック
1506 MHz
1126 MHz
GPUブーストクロック
1708 MHz
1216 MHz
GFLOP(ベースクロック)
3855
4612
テクスチャユニット
80
128
テセル充填率
120.5 GT / s
144.1 GT / s
メモリデータレート
8 Gb / s
7 Gb / s
メモリ帯域幅
192 GB / s
224GB/秒
ROP
48
64
L2キャッシュ
1.5MB
2MB
TDP
120W
165W
トランジスタ
44億
52億
ダイサイズ
200mm²
398mm²
プロセスノード
16 nm
28 nm
GP106には2つのGPCが搭載されているため、合計で1280のCUDAコアと80のテクスチャユニットになります。このチップは、NvidiaがGP104でクロックレートを上げるのと同じ最適化されたタイミングの恩恵を受け、1506MHzの基本周波数と1708MHzの一般的なGPUブースト定格を促進します。
プロセッサのバックエンドも削減されます。6つの32ビットメモリコントローラーは、192ビットの集約データパスを提供します。より大きなGP104と同様に、各コントローラーは8つのROPと256KBのL2に関連付けられ、最大48のROPと1.5MBのキャッシュを追加します。Nvidiaは6GBの8GT/ s GDDR5をボードにドロップし、最大192 GB/sのピークスループットを提供します。この数値はGTX980の224GB/ sよりも低くなりますが、Pascalは新しいロスレス技術を採用してメモリサブシステムの節約を引き出し、使用可能な帯域幅を効果的に増やしていることも忘れないでください。GTX 1080のカバレッジから採用された、「[GP106]のデルタカラー圧縮は2:1の節約を実現しようとします。このモードは、より頻繁に使用できるように拡張されているとされています。また、ピクセルごとの違いがある場合をカバーする新しい4:1モードもあります。非常に小さく、さらに少ないスペースに圧縮できます。最後に、
もちろん、GP106はGP104と同じTSMC16FF+プロセスを使用して製造されています。より大きなGPUは314mm²のダイ上の72億個のトランジスタで構成されていますが、NvidiaはGP106用に44億個のFinFETトランジスタを200mm²に詰め込んでいます。より複雑でないプロセッサと、より単純なPCAのより少ないメモリを組み合わせると、120WTDPになります。
最初:上位主流にはSLIはありません
上部にSLIコネクタがないことに気づきましたか?Nvidiaは、GeForce GTX 1070または1080を、1060が提供する以上のパフォーマンスを求めるゲーマーに推奨します(もちろん)。1060ではSLIをサポートしていません。世代を超えて、これはテクノロジーなしでリコールできる最高級のボードです。確かに、GeForce GTX 750 Tiにはありませんでしたが、760にはありました。GeForceGTX950もそうだった。
公式には、Nvidiaが決定を内部化します。主流のGPUをペアリングするゲーマーは多くなく、同社はリソースを薄く分散させたくないため、より高速なPascalベースのカードでSLIを最適化することに重点を置いています。ただし、その説明を超えて、ゲーム開発は、代替フレームレンダリングに適さない後処理および計算指向の効果で別の方向に進んでいます。また、DirectX 12を使用すると、より多くの制御がISVにシフトされ、コンテンツをできるだけ早く公開したいと考えています。これは、Nvidiaがドライバーに注ぐ作業の多くが回避されることを意味します。
私たちのスイートには、DirectX 12を介して複数のGPUをサポートする1つのゲームがあります:Ashes oftheSingularity。2つ目のGeForceGTX1060を追加し、1つのチェックボックスをクリックすると、次の速度向上が見られます。
これは、SLIで見慣れている種類のスケーリングではありませんが、約50%は悪くありません。残念ながら、組み込みの複数のアダプターのサポートがなければ、DirectX11ゲームやDX12タイトルを試すことさえできません。
これが1080pに焦点を合わせたカードであることを考えると、Nvidiaはドライバーの更新を通じてPCIExpressを介したSLIを遡及的に有効にすることができます。GTX 1060カードのペアリングに関心を持つゲーマーがどれほど少ないかにかかわらず、マルチGPU構成の恩恵を受けるDX11タイトルはまだたくさんあります。また、GP106がDX12によって課せられたスケーリングの問題を切り抜ける問題は、GP104ベースのカードにも当てはまります。パフォーマンスベンチマークで、SLIされた1060年代がどれほど魅力的かどうかを判断しましょう。
GeForceGTX1060ファウンダーズエディションの詳細
Nvidiaは、エッジの効いた10シリーズFounders Editionの設計を継続していますが、GTX 1060は、1070および1080と比較しておそらく安価な実装を採用しています。
しかし、それは新しいカードが小さいという意味ではありません。長さは25.4cm(スロットカバーからカードの端まで測定)、高さは10.7 cm(マザーボードスロットの上部からカードの上部まで測定)、奥行きは3.8cmです。実際には、カードの奥行きはわずか3.5 cmですが、スロットカバーは0.3cm突き出ています。
845gのGeForceGTX1060 Founders Editionも、特に軽量ではありません。
デザイン、感触、コネクタ
繰り返しになりますが、Nvidiaはカードのシュラウドにアルミニウムとプラスチックの混合物を使用しています。ただし、今回は少し簡単です。ファンを含むカバーは、1つの部品で取り外すことができます。上部には、照らされたGeForce GTXロゴと、6ピンの電源コネクタがあります。
GeForce GTX 1060のバックエンドは、以前の設計とは少し異なります。PCAが短いグラフィックカードには、クーラーがボードから突き出ている空気取り入れ口があり、ラジアルファンにサービスを提供していることがよくあります。代わりに、1060には開口部のない通常のカバーがあります。間違いなくコストの懸念から、バックプレートもありません。
カードの裏側は見慣れた光景を見せてくれます。
I / Oパネルは、NvidiaのGeForceGTX1080および1070から1回の変更なしでコピーされます。これは、バージョン1.2と互換性のある3つのDisplayPortコネクタによって支配されています。ただし、同社によれば、GPUのディスプレイコントローラーと一致するバージョン1.3および1.4も準備ができているとのことです。さらに、HDMI2.0コネクタとデュアルリンクDVIコネクタがあります。アナログ出力は利用できません。
クーラー設計、ボードおよび電源
注意を内側に向けて、シュラウドを取り外してGeForceGTX1060の冷却ソリューションを公開します。
一番上に、電源コネクタの奇妙な位置にすぐに気づきます。これは、実際のPCAを超えて突き出ているクーラーの一部にあります。これには、ボードに接続するために多数のケーブルが必要です。
実装は決してエレガントではなく、Nvidiaのパートナーがより短い1060を構築することを防ぎます。カードの長さはわずか17.5cmですが、電源コネクタを収納するスペースがありません。
クーラー本体を固定している4本のネジを外すとすぐに外れます。その下には巨大な銅製のヒートシンクと金属製のフレームがあります。閉じた冷却フィンの設計は、GeForce GTX 1070を思い起こさせ、1060の120WTDPを考えると十分なパフォーマンスを提供するはずです。
大規模な保持および冷却フレームは、すべてを所定の位置に保持し、電圧調整回路/メモリモジュールを冷却することにより、2つの役割を果たします。
フレームを緩めて外したら、上下にひっくり返す必要があります。これは、ボードに恒久的にはんだ付けされている個別のPCIe電源コネクタを接続するケーブルが原因です。これを行うと、その栄光のすべてで裸のPCAが明らかになります。
いつものように、GPUは前面と中央に配置されます。GP106は、当然、NvidiaのGeForce GTX1080および1070で見つかったGP104GPUよりもかなり小さいです。ただし、ボード間の違いはそれだけではありません。
例としてメモリモジュールを取り上げます。1060の定置のうち6つだけにSamsungK4G80325FB-HC25GDDR5が搭載されています。それらはそれぞれ8Gb(32 x 256Mb)の容量を持ち、クロックレートに応じて1.305Vから1.597Vの範囲で動作します。とにかく、これが1060の6GB仕様を取得する場所です。
残念ながら、PWMコントローラーは文書化されていません。これはuPISemiconductorによって作成され、モデル番号uP9509が付けられています。これは、おそらくuP9511Pの小さい兄弟であることを意味します(後者のコントローラーは、GP104プロセッサーとペアになっていることがわかりました)。
メモリモジュールとGPUフェーズの1つは、マザーボードのPCIeスロットを介して電力を供給します。残りの2つのGPUフェーズとカードのアクセサリは、6ピンの電源コネクタから電力を引き出します。次のページで、レール全体の負荷分散の観点からこれが何を意味するかを詳しく見ていきます。
電圧レギュレーションに関しては、Nvidiaはハイサイドとローサイドの両方でフェーズごとに1つのデュアルNチャネルMOSFET、E6930のみを使用します。個別のゲートドライバーは必要ありません。この高度に統合されたコンポーネントは、ボード上の空きスペースを説明します。
GPUの3つのフェーズは完全に十分であり、それらの分散は、AMDのRadeonRX480よりもここで意味があります。
どこかで間違った方向に曲がったように見える6ピン電源コネクタを除けば、NvidiaのリファレンスGeForceGTX1060は実際にはかなり見栄えがします。また、廃熱の量が比較的少ないことを考えると、その軸流ファンも悪い選択ではありません。