Nvidia GeForce GTX 1660 검토: Turing 맹공은 계속됩니다

쉬운 목차

우리의 평결

GeForce GTX 1660 Ti와 동일한 TU116 프로세서를 기반으로 하는 Nvidia의 GeForce GTX 1660은 2개의 스트리밍 멀티프로세서를 잃고 GDDR6 메모리를 더 느린 GDDR5로 교체합니다. 결과적으로 1920×1080에서 게임을 위한 탁월한 선택으로 남아 있지만 2560×1440에서는 권장되지 않습니다. 구매하기 전에 반드시 비교 매장을 방문하십시오. Radeon RX 580 카드에 대한 특가 상품은 성능이 낮음에도 불구하고 살펴봐야 합니다.

을위한

뛰어난 1080p 성능
$220 진입점의 매력적인 가격
합리적인 120W 소비 전력으로 발열 및 소음 감소

에 맞서

1440p 게임에 적합하지 않음
더 빠른 GeForce GTX 1660 Ti와 유사한 전력 프로필

엔비디아 지포스 GTX 1660 리뷰

Nvidia가 GeForce GTX 1660 Ti의 깨끗한 TU116 그래픽 프로세서를 가져와서 더 저렴한 파생 제품을 만드는 것은 시간 문제였습니다. 새로운 GeForce GTX 1660은 당연히 Turing 아키텍처의 고유한 RT 및 Tensor 코어가 없다는 점에서 고급 모델과 매우 유사합니다. 대신, 오늘날의 래스터화된 게임을 가속화하기 위한 온다이 리소스를 목표로 합니다.

Nvidia는 GeForce GTX 1660을 만들 때 TU116의 리소스 풀에서 많은 것을 줄이지 않았습니다. 128 CUDA 코어와 8개의 텍스처 유닛을 사용하는 한 쌍의 스트리밍 멀티프로세서가 제거되었습니다. 그러나 GPU는 그렇지 않으면 매우 완벽합니다. 이 카드의 가장 큰 손실은 GDDR6 메모리가 없다는 것입니다. 대신 8Gb/s GDDR5로 교체하면 대역폭이 1660 Ti의 288GB/s에서 192GB/s로 떨어집니다.

아마존에서 Nvidia Geforce GTX 1660(Nvidia) $605.32

당연히 GeForce GTX 1660은 6GB의 느린 메모리가 고해상도에서만큼 성능을 저하시키지 않는 FHD 게임을 주로 목표로 합니다. 그러나 $220/£200 보드가 더 넓은 버스에서 더 많은 GDDR5를 사용하여 AMD의 Radeon RX 590을 막을 수 있을 만큼 충분히 빠른 프레임 속도를 유지할 수 있습니까?

TU116 요약: RT 및 텐서 코어가 없는 튜링

GeForce GTX 1660의 핵심에 있는 GPU의 이름은 TU116-300-A1입니다. 이것은 GeForce GTX 1660 Ti의 TU116-400-A1과 가까운 친척으로, 24개의 스트리밍 멀티프로세서에서 22개로 줄였습니다. 우리는 분명히 Nvidia의 미래 지향적인 RT 및 Tensor 코어가 없고 284mm² 크기의 6.6으로 구성된 프로세서를 다루고 있습니다. TSMC의 12nm FinFET 공정을 사용하여 제조된 10억 개의 트랜지스터.

더 작은 트랜지스터에도 불구하고 TU116은 이전의 GP106 프로세서보다 42% 더 큽니다. 이러한 성장 중 일부는 Turing 아키텍처의 보다 정교한 셰이더에 기인합니다. 고급형 GeForce RTX 20 시리즈 카드와 마찬가지로 GeForce GTX 1660은 대부분의 셰이더 워크로드를 구성하는 FP32 산술 명령어와 INT32 연산(데이터 주소 지정/가져오기, 부동 소수점 최소/최대, 비교 등)의 동시 실행을 지원합니다. ). Turing 코어가 주어진 클럭 속도에서 Pascal보다 더 나은 성능을 달성한다는 이야기를 들으면 이 기능이 그 이유를 크게 설명합니다.

Turing의 Streaming Multiprocessors는 Pascal보다 적은 수의 CUDA 코어로 구성되어 있지만 설계는 각 GPU에 더 많은 SM을 분산하여 부분적으로 보상합니다. 최신 아키텍처는 16개의 CUDA 코어(파스칼과 동일)당 하나의 디스패치 유닛과 함께 16개의 CUDA 코어(2x Pascal)의 각 세트에 하나의 스케줄러를 할당합니다. 16코어 그룹 중 4개는 SM과 함께 64KB L1/32KB 공유 메모리로 또는 그 반대로 구성할 수 있는 96KB 캐시와 4개의 텍스처 유닛으로 구성됩니다. Turing은 스케줄러를 두 배로 늘리기 때문에 CUDA 코어를 가득 채운 상태로 유지하기 위해 매 클록 주기마다 CUDA 코어에 명령을 내리기만 하면 됩니다. 그 사이에 INT32 코어를 포함하여 다른 장치에 다른 명령을 자유롭게 실행할 수 있습니다.

TU116에서 Nvidia는 Turing의 Tensor 코어를 SM당 128개의 전용 FP16 코어로 교체하여 GeForce GTX 1660이 FP32의 2배 속도로 반정밀 작업을 처리할 수 있도록 합니다. 다른 Turing 기반 GPU는 Tensor 코어를 통해 이중 속도 FP16을 자랑하므로 TU116의 구성은 이 GPU를 위해 특별히 배치된 하드웨어를 통해 해당 표준을 유지하는 역할을 합니다. 다음 차트는 GeForce GTX 1660 Ti 리뷰에 게시된 버전의 업데이트된 버전으로, GeForce GTX 1060 및 Pascal 기반 GP106 칩과 비교하여 TU116의 절반 정밀도 처리량이 크게 향상되었음을 보여줍니다.

일반 행렬 곱셈을 테스트하는 Sandra의 Scientific Analysis 모듈을 실행했을 때 TU116에 비해 TU106의 Tensor 코어가 달성하는 FP16 처리량이 얼마나 되는지 알 수 있습니다. FP16만 상징적으로 지원했던 지포스 GTX 1060은 차트에 거의 오르지 않는다.

Turing 아키텍처의 셰이더 및 통합 캐시 외에도 TU116은 가변 속도 셰이딩이라고 하는 콘텐츠 적응형 셰이딩 및 모션 적응형 셰이딩이라는 한 쌍의 알고리즘도 지원합니다. 우리는 Nvidia의 Turing Architecture Explored: Inside the GeForce RTX 2080에서 이 기술을 다루었습니다. 이 이야기는 또한 GeForce GTX 1660에도 적용되는 Turing의 가속화된 비디오 인코딩 및 디코딩 기능을 소개했습니다.

함께 모아서…

Nvidia는 24개의 SM을 TU116에 포장하여 3개의 그래픽 처리 클러스터로 나눕니다. SM당 64개의 FP32 코어를 사용하면 전체 GPU에서 1,536개의 CUDA 코어와 96개의 텍스처 단위가 됩니다. 두 개의 SM을 잃으면 GeForce GTX 1660은 1,408개의 활성 CUDA 코어와 88개의 사용 가능한 텍스처 유닛으로 끝납니다.

보드 파트너는 의심할 여지 없이 카드를 차별화하기 위해 다양한 주파수를 목표로 삼을 것입니다. 그러나 공식 기본 클럭 속도는 1,530MHz이며 GPU 부스트 사양은 1,785MHz입니다. 이 두 수치는 모두 GeForce GTX 1660 Ti의 클럭보다 약간 높지만 누락된 SM을 완전히 보상할 수는 없습니다.

Gigabyte GeForce GTX 1660 OC 6G 샘플은 몇 주 전에 검토한 1660 Ti보다 약 90MHz 더 빠르게 작동하는 Metro: Last Light의 3회 실행을 통해 안정적인 1,935MHz를 유지했습니다. 문서상 GeForce GTX 1660은 최대 5TFLOPS의 FP32 성능과 10TFLOPS의 FP16 처리량을 제공합니다.

6개의 32비트 메모리 컨트롤러는 TU116에 최대 192GB/s를 밀어내는 8Gb/s GDDR5 모듈로 채워진 통합 192비트 버스를 제공합니다. 이는 GeForce GTX 1060 6GB와 비슷하며 GeForce GTX 1660 Ti에 비해 33% 감소한 것입니다. 2개의 SM 손실과 함께 GDDR6에서 GDDR5 메모리로 떨어지는 것은 GeForce GTX 1660의 성능이 1660Ti에 비해 낮은 이유입니다.

각 메모리 컨트롤러는 8개의 ROP 및 256KB의 L2 캐시 슬라이스와 연결됩니다. 전체적으로 TU116은 48개의 ROP와 1.5MB의 L2를 노출합니다. GeForce GTX 1660의 ROP 수는 48개의 렌더 출력도 사용하는 RTX 2060과 비교됩니다. 그러나 TU116의 L2 캐시 슬라이스는 TU106에 비해 절반입니다.

GeForce GTX 1660 Ti와의 유사성을 감안할 때 GeForce GTX 1660이 동일한 120W로 평가되는 것은 놀라운 일이 아닙니다. 불행히도 두 그래픽 카드 모두 다중 GPU 지원을 포함하지 않습니다. Nvidia는 SLI가 게이머에게 단일 GPU 구성과 일치시키는 방법을 제공하기 보다는 더 높은 절대 성능을 구동하기 위한 것이라는 내러티브를 계속해서 추진하고 있습니다.

Gigabyte GeForce GTX 1660 OC 6GGeForce GTX 1660 TiGeForce RTX 2060 FEGEForce GTX 1060 FEGEForce GTX 1070 FE 아키텍처(GPU) CUDA 코어 피크 FP32 컴퓨트 텐서 코어 RT 코어 캐시 대역폭 메모리 OP 베이스 클럭 속도 L2 부스트 속도 메모리 TDP 메모리 용량 카운트 다이 크기 SLI 지원

튜링(TU116)
튜링(TU116)
튜링(TU106)
파스칼(GP106)
파스칼(GP104)

1408
1536
1920년
1280
1920년

5 TFLOPS
5.4 TFLOPS
6.45 TLFOPS
4.4 TFLOPS
6.5 TFLOPS

해당 없음
해당 없음
240
해당 없음
해당 없음

해당 없음
해당 없음
30
해당 없음
해당 없음

88
96
120
80
120

1530MHz
1500MHz
1365MHz
1506MHz
1506MHz

1785MHz
1770MHz
1680MHz
1708MHz
1683MHz

6GB GDDR5
6GB GDDR6
6GB GDDR6
6GB GDDR5
8GB GDDR5

192비트
192비트
192비트
192비트
256비트

192GB/초
288GB/초
336GB/초
192GB/초
256GB/초

48
48
48
48
64

1.5MB
1.5MB
3MB
1.5MB
2MB

120W
120W
160W
120W
150W

66억
66억
108억
44억
72억

284mm²
284mm²
445mm²
200mm²
314mm²

아니
아니
아니
아니
예(MIO)

Nvidia GeForce GTX 1660 검토: Turing 맹공은 계속됩니다

우리의 평결

을위한

에 맞서

엔비디아 지포스 GTX 1660 리뷰

TU116 요약: RT 및 텐서 코어가 없는 튜링

함께 모아서…

Related Posts

시스템 빌더 마라톤 2015년 4분기: 895달러 LAN 박스 PC

EVGA SuperNOVA 1000 P6 전원 공급 장치 검토

PlayStation 5 개봉 및 실습

PS5 첫 번째 게임 플레이: Astro의 플레이룸 및 DualSense를 사용한 실습