새로운 파스칼 기반 GPU를 만나보세요
데뷔 2개월 후, Nvidia의 Pascal 아키텍처는 회사의 데스크탑 그래픽 카드 포트폴리오를 위에서 아래로 천천히 채우고 있습니다. 먼저 GeForce GTX 1080이 출시되어 더 적은 비용으로 GeForce GTX 980 Ti보다 30% 이상의 성능을 제공합니다. 온라인 공급업체는 여전히 재고를 유지할 수 없습니다(Newegg는 이 글을 쓰는 시점에서 재고가 없습니다). 그런 다음 우리는 GeForce GTX 1070을 소개받았습니다. GeForce GTX 1070은 수백 달러 더 적은 비용으로 980 Ti를 능가합니다.
이제 GeForce GTX 1060에 세 번째 Pascal 기반 보드가 제공됩니다. 이번 달 초에 발표된 바와 같이 Nvidia의 파트너가 250달러부터 시작하는 버전을 갖게 될 것이라는 사실을 이미 알고 있습니다. Founders Edition 구현은 nvidia.com 및 Best Buy 매장에서 300달러에 판매되므로 온라인에서 찾을 수 없다고 놀라지 마십시오.
GeForce GTX 1060은 GP106이라는 새로운 GPU를 기반으로 하며, GP104와 동일한 기능을 많이 제공하지만 더 주류 패키지입니다. 그러나 그 용어가 당신을 설득하지 못하게하십시오. 1060은 단순한 120W 카드일 수 있지만 Nvidia는 GeForce GTX 980급 프레임 속도에 좋다고 합니다. 2년 전만 해도 이 수준의 성능이 550달러에 팔렸습니다. 우리는 먼 길을 왔습니다.
GP106 만나기
Nvidia는 4개의 그래픽 처리 클러스터가 활성화된 완전한 GP104 프로세서를 사용하여 주력 GeForce GTX 1080을 구축합니다. 이렇게 하면 2560개의 CUDA 코어와 160개의 텍스처 유닛이 있는 카드가 생성됩니다. GTX 1070은 3개의 GPC가 켜진 동일한 GPU를 중심으로 최대 1920개의 코어와 120개의 텍스처 유닛을 추가합니다.
GeForce GTX 1060은 동일한 아키텍처 빌딩 블록을 사용하여 유사하게 축소됩니다. GeForce GTX 1080 출시 범위에서:
“각 GPC에는 5개의 스레드/텍스처 처리 클러스터와 래스터 엔진이 포함되어 있습니다. 더 세분화하면 TPC는 하나의 스트리밍 멀티프로세서와 PolyMorph 엔진을 결합합니다. SM은 128개의 단정밀도 CUDA 코어, 256KB 레지스터 파일 용량, 96KB 공유 메모리, 48KB L1/텍스처 캐시 및 8개의 텍스처 유닛을 결합합니다. 한편, 4세대 PolyMorph 엔진에는 Nvidia의 동시 다중 투영 기능을 처리하기 위해 지오메트리 파이프라인의 끝과 래스터 장치 앞에 있는 새로운 로직 블록이 포함되어 있습니다.”
GPU
지포스 GTX 1060(GP106)
지포스 GTX 980(GM204)
SMS
10
16
쿠다 코어
1280
2048
기본 시계
1506MHz
1126MHz
GPU 부스트 클럭
1708MHz
1216MHz
GFLOP(기본 클록)
3855
4612
텍스처 단위
80
128
텍셀 필 레이트
120.5GT/s
144.1GT/s
메모리 데이터 속도
8Gb/s
7Gb/s
메모리 대역폭
192GB/초
224GB/s
ROP
48
64
L2 캐시
1.5MB
2MB
TDP
120W
165W
트랜지스터
44억
52억
다이 크기
200mm²
398mm²
프로세스 노드
16nm
28nm
GP106에는 2개의 GPC가 장착되어 있으므로 총 1280개의 CUDA 코어와 80개의 텍스처 유닛을 갖게 됩니다. 이 칩은 Nvidia가 GP104에서 클럭 속도를 높일 수 있도록 하는 동일한 최적화된 타이밍의 이점을 활용하여 1506MHz의 기본 주파수와 1708MHz의 일반적인 GPU 부스트 등급을 촉진합니다.
프로세서의 백엔드도 잘립니다. 6개의 32비트 메모리 컨트롤러는 총 192비트 데이터 경로를 제공합니다. 더 큰 GP104와 마찬가지로 각 컨트롤러는 8개의 ROP와 256KB의 L2와 연결되어 최대 48개의 ROP와 1.5MB의 캐시를 추가합니다. Nvidia는 6GB의 8GT/s GDDR5를 보드에 탑재하여 최대 192GB/s의 처리량을 제공합니다. 그 수치는 GTX 980의 224GB/s보다 낮지만 Pascal은 새로운 무손실 기술을 사용하여 메모리 하위 시스템에서 절감 효과를 추출하여 사용 가능한 대역폭을 효과적으로 증가시킵니다. GTX 1080 적용 범위에서 채택, “[GP106의] 델타 색상 압축은 2:1 절약을 달성하려고 하며 이 모드는 더 자주 사용할 수 있도록 향상되었다고 합니다. 또한 픽셀당 차이가 발생하는 경우를 다루는 새로운 4:1 모드가 있습니다. 매우 작고 훨씬 더 작은 공간으로 압축할 수 있습니다.
물론 GP106은 GP104와 동일한 TSMC 16FF+ 공정을 사용하여 제조됩니다. 더 큰 GPU가 314mm² 다이에 72억 개의 트랜지스터로 구성된 반면, Nvidia는 GP106용 200mm²에 44억 개의 FinFET 트랜지스터를 포장합니다. 더 간단한 PCA에서 더 적은 메모리와 결합된 덜 복잡한 프로세서는 120W TDP를 생성합니다.
첫 번째: 상위 주류를 위한 SLI 없음
상단에 SLI 커넥터가 없는 것을 확인하시겠습니까? Nvidia는 1060이 제공하는 것보다 더 높은 성능을 원하는 게이머에게 GeForce GTX 1070 또는 1080을 권장하며(물론) 1060에서 SLI를 지원하지 않습니다. 세대적으로 이것은 우리가 기술 없이 기억할 수 있는 최고급 보드입니다. 물론 GeForce GTX 750 Ti에는 없었지만 760에는 있었습니다. 지포스 GTX 950도 마찬가지였습니다.
공식적으로 Nvidia는 결정을 내재화합니다. 메인스트림 GPU를 페어링하는 게이머는 많지 않고 회사는 리소스를 얇게 분산하는 것을 원하지 않으므로 더 빠른 Pascal 기반 카드에서 SLI를 최적화하는 데 집중하고 있습니다. 그러나 그 설명을 넘어 게임 개발은 대체 프레임 렌더링에 친숙하지 않은 사후 처리 및 컴퓨팅 지향 효과로 다른 방향으로 가고 있습니다. 그리고 DirectX 12를 사용하면 콘텐츠를 최대한 빨리 내보내려는 ISV에게 더 많은 제어 권한이 넘어갑니다. 이는 Nvidia가 드라이버에 쏟아붓는 많은 작업이 우회되었음을 의미합니다.
우리 제품군에는 DirectX 12: Ashes of the Singularity를 통해 여러 GPU를 지원하는 게임이 하나 있습니다. 두 번째 GeForce GTX 1060을 추가하고 확인란 하나를 클릭하면 다음과 같은 속도 향상을 볼 수 있습니다.
그것이 우리가 SLI에서 보는 데 익숙한 종류는 아니지만 ~50%는 나쁘지 않습니다. 불행히도 내장된 여러 어댑터를 지원하지 않으면 DirectX 11 게임 및 DX12 타이틀을 실험할 수도 없습니다.
이것이 1080p 중심 카드라는 점을 감안할 때 Nvidia는 드라이버 업데이트를 통해 PCI Express를 통한 SLI를 소급하여 활성화할 수 있으며 그렇게 되기를 바랍니다. GTX 1060 카드 페어링에 관심이 있는 게이머가 얼마나 적은지와 상관없이 다중 GPU 구성의 이점을 누릴 수 있는 DX11 타이틀은 여전히 많이 있습니다. 그리고 GP106이 DX12로 인한 스케일링 문제를 해결하는 모든 문제는 GP104 기반 카드에도 적용됩니다. 성능 벤치마크를 통해 SLI 1060이 얼마나 매력적인지 판단할 수 있습니다.
GeForce GTX 1060 파운더스 에디션 자세히 살펴보기
GTX 1060은 1070 및 1080에 비해 아마도 더 저렴한 구현을 자랑하지만 Nvidia는 더 엣지 있는 10 시리즈 Founders Edition 디자인을 계속 사용합니다.
그렇다고 새 카드가 작다는 의미는 아닙니다. 길이 25.4cm(슬롯 덮개에서 카드 끝까지 측정), 높이 10.7cm(마더보드 슬롯 상단에서 카드 상단까지 측정), 깊이 3.8cm입니다. 실제로 카드의 깊이는 3.5cm에 불과하지만 슬롯 덮개는 0.3cm 정도 튀어나와 있습니다.
845g에서 GeForce GTX 1060 Founders Edition도 특별히 가볍지 않습니다.
디자인, 느낌 및 커넥터
다시 한 번, Nvidia는 카드 덮개에 알루미늄과 플라스틱을 혼합하여 사용합니다. 그래도 이번에는 조금 더 간단합니다. 팬을 포함한 커버는 일체형으로 분리할 수 있습니다. 상단에는 6핀 전원 커넥터와 함께 빛나는 GeForce GTX 로고가 있습니다.
GeForce GTX 1060의 백엔드는 이전 디자인에서 약간 벗어났습니다. 짧은 PCA가 있는 그래픽 카드에는 종종 쿨러가 보드 너머로 돌출되어 방사형 팬에 서비스를 제공하는 공기 흡입구가 있습니다. 대신 1060에는 구멍이 없는 일반 덮개가 있습니다. 의심할 여지 없이 비용 문제로 인해 백플레이트도 없습니다.
카드 뒷면은 우리에게 익숙한 광경을 보여줍니다.
I/O 패널은 단일 변경 없이 Nvidia의 GeForce GTX 1080 및 1070에서 복사됩니다. 버전 1.2와 호환되는 3개의 DisplayPort 커넥터가 지배적입니다. 그러나 회사는 GPU의 디스플레이 컨트롤러와 일치하는 버전 1.3 및 1.4도 준비되어 있다고 말합니다. 또한 HDMI 2.0 커넥터와 듀얼 링크 DVI 커넥터가 있습니다. 아날로그 출력을 사용할 수 없습니다.
쿨러 디자인, 보드 및 전원 공급 장치
시선을 안쪽으로 돌려서 덮개를 제거하여 GeForce GTX 1060의 냉각 솔루션을 드러냅니다.
위쪽에서 전원 커넥터의 이상한 위치를 즉시 알 수 있습니다. 실제 PCA 너머로 튀어나온 쿨러 부분에 위치하고 있습니다. 이것은 보드에 연결하기 위해 많은 케이블을 필요로 합니다.
구현은 우아하지 않으며 Nvidia의 파트너가 더 짧은 1060을 구축하는 것을 방지합니다. 카드의 길이는 17.5cm에 불과하지만 전원 커넥터를 꽂을 공간이 없습니다.
쿨러 본체를 고정하고 있는 나사 4개를 풀면 바로 빠집니다. 아래에 거대한 구리 방열판과 금속 프레임이 있습니다. 폐쇄형 냉각 핀 디자인은 GeForce GTX 1070을 떠올리게 하며 1060의 120W TDP를 감안할 때 충분한 성능을 제공해야 합니다.
방대한 고정 및 냉각 프레임은 모든 것을 제자리에 유지하고 전압 조정 회로/메모리 모듈을 냉각함으로써 이중 역할을 합니다.
프레임을 풀고 제거한 후에는 위로 뒤집어야 합니다. 이는 보드에 영구적으로 납땜된 별도의 PCIe 전원 커넥터를 연결하는 케이블 때문입니다. 이렇게 하면 모든 영광의 베어 PCA가 드러납니다.
평소와 같이 GPU는 전면 중앙에 있습니다. GP106은 당연히 Nvidia의 GeForce GTX 1080 및 1070에서 찾은 GP104 GPU보다 약간 작습니다. 하지만 보드 간의 차이점은 여기서 끝나지 않습니다.
메모리 모듈을 예로 들어 보겠습니다. 1060의 emplacement 중 6개만 Samsung K4G80325FB-HC25 GDDR5로 채워집니다. 각각 8Gb(32 x 256Mb)의 용량을 가지며 클록 속도에 따라 1.305V에서 1.597V 사이에서 실행됩니다. 여기에서 1060의 6GB 사양을 얻을 수 있습니다.
불행히도 PWM 컨트롤러는 문서화되어 있지 않습니다. uPI Semiconductor에서 만들고 모델 번호 uP9509를 사용합니다. 즉, uP9511P의 더 작은 형제일 수 있습니다(후자의 컨트롤러는 GP104 프로세서와 쌍을 이루는 것으로 확인됨).
메모리 모듈과 GPU 단계 중 하나는 마더보드의 PCIe 슬롯을 통해 전원을 공급받습니다. 나머지 2개의 GPU 단계와 카드의 액세서리는 6핀 전원 커넥터에서 전원을 끌어옵니다. 다음 페이지에서 레일 전체의 부하 분산 측면에서 이것이 의미하는 바를 자세히 살펴보겠습니다.
전압 레귤레이션과 관련하여 Nvidia는 하이 사이드와 로우 사이드 모두에 대해 위상당 하나의 듀얼 N-채널 MOSFET인 E6930만 사용합니다. 별도의 게이트 드라이버가 필요하지 않습니다. 이 고집적 구성 요소는 보드의 빈 공간을 설명합니다.
GPU의 3단계는 완전히 충분하며 AMD의 Radeon RX 480보다 여기에서 배포가 더 합리적입니다.
어딘가에서 잘못된 방향으로 전환된 것으로 보이는 6핀 전원 커넥터를 제외하고 Nvidia의 레퍼런스 GeForce GTX 1060은 실제로 꽤 좋아 보입니다. 그리고 상대적으로 적은 양의 폐열을 감안할 때 축류 팬도 나쁘지 않은 선택입니다.