우리의 평결
GeForce GTX 1660 Ti는 대체하는 1060 6GB보다 비싸지만 Nvidia의 최신 Turing 기반 보드는 GeForce GTX 1070과 유사한 성능을 제공합니다. 고성능, 합리적인 가격표 및 적당한 전력 소비가 견고한 상위 메인스트림 그래픽 카드에 결합되어 있습니다. .
을 위한
1920 x 1080에서 뛰어난 성능
2560 x 1440에서 허용되는 프레임 속도
Turing의 비디오 인코딩/디코딩 가속 기능 유지
120W 보드 전력은 AMD 경쟁 제품에 비해 유리합니다.
에 맞서
RT/Tensor 코어가 없으면 레이 트레이싱이나 DLSS를 시도할 수 없습니다.
RTX 없이 튜링
2019년 11월 21일 업데이트: 2019년 2월 GTX 1660 Ti 출시 이후 GPU 환경이 극적으로 바뀌었습니다. 동일한 Turing 아키텍처를 기반으로 하지만 더 높은 성능과 더 낮은 가격을 모두 제공하는 “Super” 카드가 많습니다. 회사의 초기 Turing 라인업. GTX 1660 Ti의 잠재적 구매자와 가장 관련성이 높은 것은 1660 Ti와 유사한 성능을 제공하는 GeForce GTX 1660 Super이며, 저렴한 시작 가격인 $229입니다. 이 글을 쓰는 시점에서 이는 최저 가격의 GTX 1660 Ti보다 약 30달러 저렴합니다.
Nvidia GeForce GTX 1660 Ti는 Turing의 개선된 셰이더, 통합 캐시 아키텍처, 적응형 셰이딩 지원, 비디오 인코딩/디코딩 가속 기능의 완전한 보완을 통합하는 완전히 새로운 그래픽 프로세서인 TU116을 기반으로 합니다. GPU는 고급 GeForce RTX 20 시리즈 모델과 마찬가지로 최대 GDDR6 메모리와 쌍을 이룹니다. 그러나 가속 레이 트레이싱을 위한 RT 코어나 게임 추론을 위한 Tensor 코어를 정당화할 만큼 빠르지 않습니다. 결과적으로 TU116은 오늘날 최고의 타이틀을 강조하는 사양 목록이 있는 더 얇은 칩입니다.
Nvidia는 GeForce GTX 1660 Ti가 280달러에서 시작하여 GeForce GTX 1060 6GB를 완전히 대체할 것이라고 말합니다. 기본 가격은 Pascal 기반 1060 6GB가 2016년에 출시된 곳보다 30달러(또는 12%) 높지만 GeForce GTX 1660 Ti는 동일한 120W 보드 전력 정격에서 최대 1.5배 더 빠릅니다. 그 이하도 아니다.
달러당 향상된 성능은 지금까지 Turing 세대에서 많이 본 것이 아닙니다. Nvidia는 1920 x 1080에서 성능을 위해 특별히 제작된 GPU를 사용하여 이 문제를 해결할 수 있습니까?
TU116 만나기: Turing Sans RT 및 Tensor 코어
우리는 Nvidia가 우리를 Turing 계층 아래로 안내하면서 4개의 개별 GPU를 출시하는 것을 보았습니다. 각각을 사용하여 회사는 더 낮은 가격대를 목표로 리소스를 제거합니다. 하지만 그 과정에서 균형을 유지하기 위해 노력하고 있다는 것을 알고 있으며, 저사양 프로세서에서 최대 성능을 불필요하게 빼앗는 병목 현상을 최소화합니다.
GeForce RTX 2060은 2080 Ti의 CUDA 코어 및 텍스처 유닛의 44%, ROP 및 메모리 대역폭의 54%, L2 캐시의 50%를 갖추고 있습니다. 2060이 출시되기 전에 우리는 RT 및 Tensor 코어와 같은 사치가 이러한 수준에서 더 이상 의미가 없을 것이라고 생각했습니다. 그러나 당시 하나의 레이 트레이싱 지원 게임인 Battlefield V용 일련의 패치는 성능을 크게 향상시켜 Turing의 특징적인 기능을 여전히 재생 가능한 프레임 속도로 사용할 수 있음을 증명했습니다.
우리는 한 단계 떨어진 것으로 나타났습니다. Nvidia는 TU116을 튜링의 미래 지향적인 기능이 많은 목적을 달성하지 못할 만큼 충분히 낮게 떨어지는 경계를 고려합니다. RT 및 Tensor 코어를 제거하면 TSMC의 12nm FinFET 공정을 사용하여 제조된 66억 개의 트랜지스터로 구성된 284mm² 칩이 남습니다. 그러나 더 작은 트랜지스터에도 불구하고 TU116은 이전의 GP106 프로세서보다 여전히 42% 더 큽니다.
성장의 일부는 Turing의 보다 정교한 셰이더에 기인합니다. 고급형 GeForce RTX 20 시리즈 카드와 마찬가지로 GeForce GTX 1660 Ti는 대부분의 셰이더 워크로드를 구성하는 FP32 산술 명령어와 INT32 작업(데이터 주소 지정/가져오기, 부동 소수점 최소/최대, 비교 등)의 동시 실행을 지원합니다. .). Turing 코어가 주어진 클럭 속도에서 Pascal보다 더 나은 성능을 달성한다는 이야기를 들으면 이 기능이 그 이유를 크게 설명합니다.
Turing의 Streaming Multiprocessors는 Pascal보다 적은 수의 CUDA 코어로 구성되어 있지만 설계는 각 GPU에 더 많은 SM을 분산하여 부분적으로 보상합니다. 최신 아키텍처는 16개의 CUDA 코어(파스칼과 동일)당 하나의 디스패치 유닛과 함께 16개의 CUDA 코어(2x Pascal)의 각 세트에 하나의 스케줄러를 할당합니다. 16코어 그룹 중 4개는 SM과 함께 64KB L1/32KB 공유 메모리로 또는 그 반대로 구성할 수 있는 96KB 캐시와 4개의 텍스처 유닛으로 구성됩니다. Turing은 스케줄러를 두 배로 늘리기 때문에 CUDA 코어를 가득 채운 상태로 유지하기 위해 매 클록 주기마다 CUDA 코어에 명령을 내리기만 하면 됩니다. 그 사이에 INT32 코어를 포함하여 다른 장치에 다른 명령을 자유롭게 실행할 수 있습니다.
특히 TU116에서 Nvidia는 Turing의 Tensor 코어를 SM당 128개의 전용 FP16 코어로 대체하여 GeForce GTX 1660 Ti가 FP32의 2배 속도로 반정밀 작업을 처리할 수 있다고 말합니다. 다른 Turing 기반 GPU도 2배율 FP16을 자랑하므로 GeForce GTX 1660 Ti가 제품군 내에서 어떻게 고유한지는 불분명합니다. 아래 차트를 기반으로 하면 1660 Ti가 GeForce GTX 1060 및 Pascal 기반 GP106 칩에 비해 절반 정밀도 처리량이 크게 향상되었다는 것이 더 분명합니다.
그러나 일반 행렬 곱셈을 테스트하는 Sandra의 과학 분석 모듈을 실행하면 TU116에 비해 TU106의 Tensor 코어가 얼마나 많은 FP16 처리량을 달성하는지 알 수 있습니다. FP16만 상징적으로 지원했던 지포스 GTX 1060은 차트에 거의 오르지 않는다.
Turing 아키텍처의 셰이더 및 통합 캐시 외에도 TU116은 가변 속도 셰이딩이라고 하는 콘텐츠 적응형 셰이딩 및 모션 적응형 셰이딩이라는 한 쌍의 알고리즘도 지원합니다. 우리는 Nvidia의 Turing Architecture Explored: Inside the GeForce RTX 2080에서 이 기술을 다루었습니다. 이 이야기는 또한 Turing의 가속화된 비디오 인코딩 및 디코딩 기능을 소개했으며 GeForce GTX 1660 Ti에도 적용됩니다.
함께 모아서…
Nvidia는 24개의 SM을 TU116에 포장하여 3개의 그래픽 처리 클러스터로 나눕니다. SM당 64개의 FP32 코어를 사용하면 전체 GPU에 걸쳐 1,536개의 CUDA 코어와 96개의 텍스처 유닛이 있습니다. 보드 파트너는 의심할 여지 없이 GTX 1660 Ti와 RTX 2060 사이의 격차를 채우기 위해 다양한 주파수를 목표로 삼을 것입니다. 그러나 공식 기본 클럭 속도는 1,500MHz이고 GPU 부스트 사양은 1,770MHz입니다. 우리의 EVGA GeForce GTX 1660 Ti XC Black Gaming 샘플은 Metro: Last Light의 3회 실행을 통해 약 1,845MHz를 돌파했으며, 우리가 본 다른 카드는 2,000MHz를 쉽게 초과했습니다. 문서상 GeForce GTX 1660 Ti는 최대 5.4TFLOPS의 FP32 성능과 10.9TFLOPS의 FP16 처리량을 제공합니다.
6개의 32비트 메모리 컨트롤러는 TU116에 총 192비트 버스를 제공하며, 최대 288GB/s를 지원하는 12Gb/s GDDR6 모듈(Micron MT61K256M32JE-12:A)로 채워집니다. 이는 GeForce GTX 1060보다 50% 더 많은 메모리 대역폭을 제공하여 GeForce GTX 1660 Ti가 앤티앨리어싱이 활성화된 상태에서 2560 x 1440에서 성능 이점을 유지하는 데 도움이 됩니다.
각 메모리 컨트롤러는 8개의 ROP 및 256KB의 L2 캐시 슬라이스와 연결됩니다. 전체적으로 TU116은 48개의 ROP와 1.5MB의 L2를 노출합니다. GeForce GTX 1660 Ti의 ROP 수는 48개의 렌더 출력을 사용하는 RTX 2060과 비교하여 유리합니다. 그러나 L2 캐시 슬라이스 크기는 절반입니다.
더 큰 다이, 50% 더 많은 트랜지스터 수, 더 공격적인 GPU 부스트 클럭 속도에도 불구하고 GeForce GTX 1660 Ti는 GeForce GTX 1060과 동일한 120W로 평가됩니다. 불행히도 두 그래픽 카드 모두 다중 GPU 지원을 포함하지 않습니다. Nvidia는 SLI가 게이머에게 단일 GPU 구성과 일치시키는 방법을 제공하기 보다는 더 높은 절대 성능을 구동하기 위한 것이라는 내러티브를 계속해서 추진하고 있습니다.
EVGA GeForce GTX 1660 Ti XC Black GamingGeForce RTX 2060 FEGEForce GTX 1060 FEGEForce GTX 1070 FE 아키텍처(GPU) CUDA 코어 피크 FP32 컴퓨팅 텐서 코어 RT 코어 텍스처 유닛 기본 클럭 속도 GPU 부스트 속도 메모리 용량 메모리 버스 메모리 대역폭 ROPs L2 캐시 다이 크기 SLI 지원
튜링(TU116)
튜링(TU106)
파스칼(GP106)
파스칼(GP104)
1536
1920년
1280
1920년
5.4 TFLOPS
6.45 TLFOPS
4.4 TFLOPS
6.5 TFLOPS
해당 없음
240
해당 없음
해당 없음
해당 없음
30
해당 없음
해당 없음
96
120
80
120
1500MHz
1365MHz
1506MHz
1506MHz
1770MHz
1680MHz
1708MHz
1683MHz
6GB GDDR6
6GB GDDR6
6GB GDDR5
8GB GDDR5
192비트
192비트
192비트
256비트
288GB/초
336GB/초
192GB/초
256GB/초
48
48
48
64
1.5MB
3MB
1.5MB
2MB
120W
160W
120W
150W
66억
108억
44억
72억
284mm²
445mm²
200mm²
314mm²
아니요
아니요
아니요
예(MIO)
EVGA의 지포스 GTX 1660 Ti XC 블랙 게이밍
GeForce GTX 1060 Founders Edition도 120W 카드였으며 6핀 보조 커넥터 1개로 삐걱거렸습니다. 반면 EVGA의 GeForce GTX 1660 Ti XC Black Gaming은 8핀 입력을 사용하여 상당한 추가 헤드룸을 제공합니다. 레일당 전력 테스트에서 알 수 있듯이 카드는 스트레스 테스트 중에 PCIe 슬롯을 통해 3A의 전류를 소비합니다. 나머지는 8핀 커넥터에서 나옵니다.
EVGA는 TU116에 대해 4개의 전력 위상을 사용합니다. GPU의 위상은 ON Semiconductor NCP302155의 4중주에 연결된 PCB 뒷면의 이전 ON Semiconductor NCP81276에 의해 제어됩니다.
이 4가지 구성 요소는 하이사이드 및 로우사이드 MOSFET, 드라이버, 부트스트랩 다이오드를 통합합니다. GeForce RTX 2070 Founders Edition에 사용된 것과 동일한 부품으로 최대 55A의 평균 전류가 가능합니다.
Ubiq Semiconductor의 친숙한 이중 위상 uP1666Q는 2개의 QM3816N6 이중 N-채널 MOSFET을 통해 메모리의 전압 조정 회로를 제어합니다.
GeForce GTX 1660 Ti XC Black Gaming의 상당히 단순한 전원 공급 장치보다 더 흥미로운 점은 아마도 EVGA의 PCB에 추가 2개의 GPU 단계를 위한 빈 패드가 있다는 사실일 것입니다. GDDR6 메모리 모듈 2개를 위한 한 쌍의 배치도 있습니다. Nvidia는 GeForce GTX 1060과 유사한 작업을 수행하여 Founders Edition 카드에 채워지지 않은 몇 개의 빈 공간을 남겼습니다. 이것은 회사가 여러 제품에 대해 하나의 PCB를 사용할 수 있도록 하는 시간 및 비용 절감 조치입니다.
금속판은 PCB 상단에 위치하며 통합 드라이버/MOSFET, GDDR6 메모리 모듈 및 전류 감지 저항 사이에 열 패드를 끼웁니다. 플레이트 상단의 더 많은 열 패드는 열이 메인 싱크 어셈블리로 계속 이동하도록 하며, 메인 싱크 어셈블리는 4개 지점에서 GPU 주위에 장착되고 PCB의 후면을 통해 나사로 고정됩니다.
열 솔루션 자체는 TU116과 직접 접촉하는 상당히 얇은 구리 패드로 구성됩니다. 세 개의 평평한 파이프가 상단에 납땜되고 알루미늄 핀 배열이 차례로 히트 파이프에 납땜됩니다. 상대적으로 두꺼운 핀 스택은 단일 85mm 팬을 수용하고 더 많은 깊이를 추가하는 슈라우드에 의해 과장됩니다. EVGA의 GeForce GTX 1660 Ti XC Black Gaming은 마더보드에서 3개의 확장 슬롯을 차지합니다.
EVGA는 길이를 위해 두께를 거래하는 것으로 끝납니다. GeForce GTX 1660 Ti XC Black Gaming은 깊이가 2″일 수 있지만 길이는 약 7.5″(~190mm), 높이는 4 ⅜”(111mm)에 불과합니다. 게다가, 우리가 검토한 두툼한 Founders Edition 카드와 비교할 때 총 무게는 1파운드 7온스입니다. (656g) 정말 가벼운 느낌.
전면에 GeForce GTX 1660 Ti XC Black Gaming은 1개의 듀얼 링크 DVI 커넥터, HDMI 포트 및 DisplayPort 인터페이스를 노출합니다. 지금까지 다른 모든 Turing 클래스 카드에서 볼 수 있었던 USB Type-C 기반 VirtualLink 커넥터가 사라졌습니다. 이는 최고의 VR 헤드셋에서도 부드러운 VR 게임 플레이에 도움이 되지 않는 성능 수준으로 떨어지고 있다는 신호입니다. 자신의 디자인에 VirtualLink를 추가하기로 선택한 보드 파트너는 자유롭게 추가할 수 있습니다. EVGA는 단순히 이 모델에서 구현하지 않았습니다.
EVGA의 GeForce GTX 1660 Ti XC Black Gaming을 테스트한 방법
분명히 GeForce GTX 1660 Ti는 우리가 검토한 다른 Turing 기반 보드보다 주류입니다. 따라서 MSI Z170 Gaming M7 마더보드와 4.2GHz의 Intel Core i7-7700K CPU를 기반으로 하는 그래픽 워크스테이션이 적합합니다. 프로세서는 G.Skill의 F4-3000C15Q-16GRR 메모리 키트로 보완됩니다. Crucial의 MX200 SSD가 여기에 있으며 게임이 로드된 1.6TB Intel DC P3700이 있습니다.
경쟁이 진행되는 한 1660 Ti는 1070 Ti도 포함하지만 대부분 GeForce GTX 1070과 경쟁합니다. 물론 지포스 GTX 1060과의 비교는 불가피하다. 이러한 모든 카드는 GeForce RTX 2060 및 GeForce RTX 2070과 함께 라인업에 포함되어 있습니다. AMD 측에서는 Radeon RX Vega 64 및 Radeon RX Vega 56이 흥미롭긴 하지만 AMD 측에서는 주로 Radeon RX 590에 관심이 있습니다. 추가도.
벤치마크 선택에는 Ashes of the Singularity: Escalation, Battlefield V, Destiny 2, Far Cry 5, Forza Horizon 4, Grand Theft Auto V, Metro: Last Light Redux, Shadow of the Tomb Raider, Tom Clancy’s The Division, Tom Clancy’s Ghost가 포함됩니다. 와일드랜드 정찰기, 더 위쳐 3, 울펜슈타인 II: 더 뉴 콜로서스.
우리가 사용하는 테스트 방법론은 PresentMon: Performance In DirectX, OpenGL 및 Vulkan에서 가져왔습니다. 간단히 말해서, 이 게임은 GPU-Z를 통한 로깅과 함께 OCAT와 PresentMon용 사내 GUI의 조합을 사용하여 평가됩니다.
우리는 드라이버 버전 418.91을 사용하여 GeForce GTX 1660 Ti를 테스트하고 다른 모든 것에 대해 417.54를 빌드합니다. AMD의 카드는 Crimson Adrenalin 2019 Edition 18.12.3을 사용합니다.