Nosso Veredicto
Embora a GeForce GTX 1660 Ti custe mais do que a 1060 6GB que substitui, a mais nova placa baseada em Turing da Nvidia oferece desempenho semelhante à GeForce GTX 1070. Alto desempenho, preço razoável e consumo de energia modesto se reúnem em uma sólida placa de vídeo mainstream .
Por
Ótimo desempenho em 1920 x 1080
Taxas de quadros aceitáveis em 2560 x 1440
Mantém os recursos de aceleração de codificação/decodificação de vídeo de Turing
A potência da placa de 120W se compara favoravelmente à concorrência da AMD
Contra
Sem núcleos RT/Tensor significa que você não poderá tentar ray tracing ou DLSS
Turing sem o RTX
Atualização de 21/11/2019: Desde o lançamento da GTX 1660 Ti em fevereiro de 2019, o cenário da GPU mudou drasticamente, com uma série de placas “Super” baseadas na mesma arquitetura Turing, mas aumentando o desempenho e os preços mais baixos do que a formação inicial de Turing da empresa. O mais relevante para potenciais compradores da GTX 1660 Ti é a GeForce GTX 1660 Super, que oferece desempenho semelhante à 1660 Ti, a um preço inicial mais baixo de US$ 229. Até o momento, isso é cerca de US $ 30 a menos que a GTX 1660 Ti de menor preço.
A Nvidia GeForce GTX 1660 Ti é construída no TU116 – um processador gráfico totalmente novo que incorpora os shaders aprimorados da Turing, sua arquitetura de cache unificada, suporte para sombreamento adaptável e um complemento completo de recursos de aceleração de codificação/decodificação de vídeo. A GPU está emparelhada com a memória GDDR6, assim como os modelos da série GeForce RTX 20 de ponta. Mas não é rápido o suficiente para justificar o uso de núcleos RT para rastreamento de raio acelerado ou núcleos Tensor para inferência em jogos. Como resultado, o TU116 é um chip mais enxuto com uma lista de especificações que enfatiza os principais títulos atuais.
A Nvidia diz que a GeForce GTX 1660 Ti custará a partir de US$ 280 e substituirá completamente a GeForce GTX 1060 6GB. Embora esse preço base seja US$ 30 (ou 12%) mais alto do que quando o 1060 6GB baseado em Pascal começou sua jornada em 2016, a empresa afirma que a GeForce GTX 1660 Ti é até 1,5 vezes mais rápida – e com a mesma potência de placa de 120W, não menos.
Melhor desempenho por dólar não é algo que vimos muito da geração Turing até agora. A Nvidia pode mudar isso com uma GPU mais desenvolvida para desempenho em 1920 x 1080?
Conheça o TU116: Turing Sans RT e Tensor Cores
Vimos a Nvidia lançar quatro GPUs separadas enquanto nos escolta pela hierarquia de Turing. Com cada um, a empresa retira recursos para atingir preços mais baixos. Mas sabemos que está tentando manter o equilíbrio ao longo do caminho, minimizando os gargalos que desnecessariamente roubariam o desempenho máximo dos processadores de baixo custo.
A GeForce RTX 2060 está equipada com 44% dos núcleos CUDA e unidades de textura do 2080 Ti, 54% de seus ROPs e largura de banda de memória e 50% de seu cache L2. Antes do lançamento de 2060, suspeitávamos que luxos como núcleos RT e Tensor não fariam mais sentido nesses níveis. Mas uma série de patches para Battlefield V – o jogo habilitado para rastreamento de raio único disponível na época – permitiu grandes ganhos de desempenho, provando que os recursos de assinatura de Turing ainda podiam ser utilizados em taxas de quadros jogáveis.
Acontece que estávamos fora por um nível. A Nvidia considera o TU116 o limite onde a potência de sombreamento cai o suficiente para impedir que os recursos de futuro de Turing sirvam a muitos propósitos. Depois de remover os núcleos RT e Tensor, ficamos com um chip de 284 mm² composto por 6,6 bilhões de transistores fabricados usando o processo FinFET de 12 nm da TSMC. Mas apesar de seus transistores menores, o TU116 ainda é 42% maior que o processador GP106 que o precedeu.
Parte do crescimento é atribuível aos shaders mais sofisticados de Turing. Assim como as placas GeForce RTX série 20 de ponta, a GeForce GTX 1660 Ti suporta a execução simultânea de instruções aritméticas FP32, que constituem a maioria das cargas de trabalho de sombreamento, e operações INT32 (para endereçamento/busca de dados, ponto flutuante mínimo/máximo, comparação, etc.) .). Quando você ouve falar que os núcleos Turing alcançam um desempenho melhor do que o Pascal em uma determinada taxa de clock, esse recurso explica amplamente o motivo.
Os multiprocessadores de streaming de Turing são compostos de menos núcleos CUDA do que os de Pascal, mas o design compensa em parte espalhando mais SMs em cada GPU. A arquitetura mais recente atribui um escalonador para cada conjunto de 16 núcleos CUDA (2x Pascal), juntamente com uma unidade de despacho por 16 núcleos CUDA (o mesmo que Pascal). Quatro desses agrupamentos de 16 núcleos compõem o SM, juntamente com 96 KB de cache que pode ser configurado como memória compartilhada de 64 KB L1/32 KB ou vice-versa e quatro unidades de textura. Como o Turing duplica os escalonadores, ele só precisa emitir uma instrução para os núcleos CUDA a cada dois ciclos de clock para mantê-los cheios. No meio, é livre emitir uma instrução diferente para qualquer outra unidade, incluindo os núcleos INT32.
Especificamente no TU116, a Nvidia diz que substitui os núcleos Tensor da Turing por 128 núcleos FP16 dedicados por SM, que permitem que a GeForce GTX 1660 Ti processe operações de meia precisão a 2x a taxa de FP32. As outras GPUs baseadas em Turing também possuem FP16 de taxa dupla, portanto, não está claro como a GeForce GTX 1660 Ti é única em sua família. Mais óbvio, com base no gráfico abaixo, é que a 1660 Ti oferece uma grande melhoria na taxa de transferência de meia precisão em comparação com a GeForce GTX 1060 e seu chip GP106 baseado em Pascal.
Mas quando executamos o módulo de Análise Científica da Sandra, que testa multiplicações gerais de matrizes, vemos quanto mais rendimentos os núcleos Tensor do TU106 alcançam em relação ao TU116. A GeForce GTX 1060, que só suportava o FP16 simbolicamente, mal se registra no gráfico.
Além dos shaders e cache unificado da arquitetura Turing, o TU116 também suporta um par de algoritmos chamados Content Adaptive Shading e Motion Adaptive Shading, juntos chamados de Variable Rate Shading. Cobrimos essa tecnologia em Arquitetura Turing da Nvidia Explorada: Dentro da GeForce RTX 2080. Essa história também apresentou os recursos acelerados de codificação e decodificação de vídeo da Turing, que também são transferidos para a GeForce GTX 1660 Ti.
Juntando tudo…
A Nvidia embala 24 SMs no TU116, dividindo-os entre três Clusters de Processamento Gráfico. Com 64 núcleos FP32 por SM, são 1.536 núcleos CUDA e 96 unidades de textura em toda a GPU. Sem dúvida, os parceiros da placa terão como alvo uma faixa de frequências para preencher a lacuna entre a GTX 1660 Ti e a RTX 2060. No entanto, a taxa de clock base oficial é de 1.500 MHz com uma especificação GPU Boost de 1.770 MHz. Nossa amostra EVGA GeForce GTX 1660 Ti XC Black Gaming atingiu cerca de 1.845 MHz em três execuções de Metro: Last Light, enquanto outras placas que vimos excedem prontamente 2.000 MHz. No papel, então, a GeForce GTX 1660 Ti oferece até 5,4 TFLOPS de desempenho de FP32 e 10,9 TFLOPS de taxa de transferência de FP16.
Seis controladores de memória de 32 bits fornecem ao TU116 um barramento agregado de 192 bits, que é preenchido por módulos GDDR6 de 12 Gb/s (Micron MT61K256M32JE-12:A) que empurram até 288 GB/s. Isso é 50% mais largura de banda de memória do que a GeForce GTX 1060 obtém, ajudando a GeForce GTX 1660 Ti a manter sua vantagem de desempenho em 2560 x 1440 com anti-aliasing ativado.
Cada controlador de memória está associado a oito ROPs e uma fatia de 256 KB de cache L2. No total, o TU116 expõe 48 ROPs e 1,5 MB de L2. A contagem de ROP da GeForce GTX 1660 Ti se compara favoravelmente à RTX 2060, que também utiliza 48 saídas de renderização. Mas suas fatias de cache L2 são metade do tamanho.
Apesar de uma matriz maior, uma contagem de transistores 50% maior e uma frequência GPU Boost mais agressiva, a GeForce GTX 1660 Ti é classificada para os mesmos 120W que a GeForce GTX 1060. Infelizmente, nenhuma placa de vídeo inclui suporte multi-GPU. A Nvidia continua empurrando a narrativa de que o SLI deve aumentar o desempenho absoluto, em vez de dar aos jogadores uma maneira de combinar configurações de GPU única.
EVGA GeForce GTX 1660 Ti XC Preto GamingGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FE Arquitetura (GPU) CUDA Cores Peak FP32 Compute Tensor Cores RT Cores Texture Units Base Clock Rate GPU Boost Rate Capacidade de memória Memory Bus Memory Bandwidth ROPs L2 Cache TDP Contagem de transistores Suporte SLI de tamanho de matriz
Turing (TU116)
Turing (TU106)
Pascal (GP106)
Pascal (GP104)
1536
1920
1280
1920
5.4 TFLOPS
6,45 TLFOPS
4.4 TFLOPS
6,5 TFLOPS
N / D
240
N / D
N / D
N / D
30
N / D
N / D
96
120
80
120
1500 MHz
1365 MHz
1506 MHz
1506 MHz
1770 MHz
1680 MHz
1708 MHz
1683MHz
6 GB GDDR6
6 GB GDDR6
6 GB GDDR5
8 GB GDDR5
192 bits
192 bits
192 bits
256 bits
288 GB/s
336 GB/s
192 GB/s
256 GB/s
48
48
48
64
1,5 MB
3 MB
1,5 MB
2 MB
120 W
160 W
120 W
150 W
6,6 bilhões
10,8 bilhões
4,4 bilhões
7,2 bilhões
284 mm²
445 mm²
200 mm²
314 mm²
Não
Não
Não
Sim (MIO)
GeForce GTX 1660 Ti XC Black da EVGA
A GeForce GTX 1060 Founders Edition também era uma placa de 120W e passou com um conector auxiliar de seis pinos. A GeForce GTX 1660 Ti XC Black Gaming da EVGA, por outro lado, emprega uma entrada de oito pinos, dando-lhe bastante espaço adicional. Como veremos em nosso teste de energia por trilho, a placa consome 3A de corrente em seu slot PCIe durante nosso teste de estresse – o restante vem de seu conector de oito pinos.
A EVGA utiliza quatro fases de alimentação para o TU116. As fases da GPU são controladas por um ON Semiconductor NCP81276 mais antigo na parte traseira do PCB, que é conectado a um quarteto de ON Semiconductor NCP302155s.
Esses quatro componentes integram os MOSFETs de alto e baixo, um driver e o diodo de bootstrap. São as mesmas peças usadas na GeForce RTX 2070 Founders Edition, capazes de correntes médias de até 55A.
O familiar uP1666Q de fase dupla da Ubiq Semiconductor controla o circuito de regulação de tensão da memória por meio de dois MOSFETs de canal N duplo QM3816N6.
Mais interessante do que a fonte de alimentação bastante simples da GeForce GTX 1660 Ti XC Black Gaming, talvez, seja o fato de que o PCB da EVGA tem blocos vagos para duas fases adicionais de GPU. Há também um par de posicionamentos para mais dois módulos de memória GDDR6. A Nvidia fez algo semelhante com a GeForce GTX 1060, deixando alguns espaços em branco em sua placa Founders Edition que nunca foram preenchidos. Esta é uma medida de economia de tempo e custo, que permite que a empresa use um PCB para vários produtos.
Uma placa de metal fica no topo da PCB, intercalando almofadas térmicas entre o driver/MOSFETs integrados, os módulos de memória GDDR6 e o resistor de detecção de corrente. Mais almofadas térmicas na parte superior da placa mantêm o calor se movendo para o conjunto do dissipador principal, que é montado ao redor da GPU em quatro pontos e aparafusado pela parte traseira do PCB.
A própria solução térmica é composta por uma almofada de cobre bastante fina que faz contato direto com o TU116. Três tubos achatados são soldados ao topo e uma série de aletas de alumínio são, por sua vez, soldadas aos tubos de calor. Uma pilha de aletas relativamente espessa é exagerada pela cobertura, que abriga uma única ventoinha de 85 mm e adiciona ainda mais profundidade. Ao todo, a GeForce GTX 1660 Ti XC Black Gaming da EVGA ocupa três slots de expansão em sua placa-mãe.
A EVGA acaba trocando espessura por comprimento. A GeForce GTX 1660 Ti XC Black Gaming pode ter 2” de profundidade, mas tem apenas cerca de 7,5” (~190mm) de comprimento e 4 ⅜” (111mm) de altura. Além disso, em comparação com os robustos cartões Founders Edition que analisamos, um peso total de 1 lb. 7 oz. (656g) parece absolutamente leve.
Na frente, a GeForce GTX 1660 Ti XC Black Gaming expõe um conector DVI de link duplo, uma porta HDMI e uma interface DisplayPort. O conector VirtualLink baseado em USB Type-C visto em todas as outras placas da classe Turing até agora desapareceu, um sinal de que estamos chegando a um nível de desempenho que não conduz a uma jogabilidade VR suave (mesmo nos melhores fones de ouvido VR). Os parceiros do conselho que optarem por adicionar o VirtualLink aos seus projetos são livres para fazê-lo; A EVGA simplesmente não o implementou neste modelo.
Como testamos a GeForce GTX 1660 Ti XC Black Gaming da EVGA
Obviamente, a GeForce GTX 1660 Ti é mais popular do que as outras placas baseadas em Turing que testamos. Como tal, nossa estação de trabalho gráfica, baseada em uma placa-mãe MSI Z170 Gaming M7 e CPU Intel Core i7-7700K a 4,2 GHz, é adequada. O processador é complementado pelo kit de memória F4-3000C15Q-16GRR da G.Skill. O SSD MX200 da Crucial está aqui, acompanhado por um Intel DC P3700 de 1,6 TB carregado com jogos.
No que diz respeito à concorrência, a 1660 Ti geralmente supera a GeForce GTX 1070, embora também incluamos a 1070 Ti. Claro, as comparações com a GeForce GTX 1060 são inevitáveis. Todas essas placas estão incluídas em nossa linha, junto com a GeForce RTX 2060 e a GeForce RTX 2070. No lado da AMD, estamos mais interessados na Radeon RX 590, embora a Radeon RX Vega 64 e a Radeon RX Vega 56 sejam interessantes acréscimos também.
Nossa seleção de benchmark inclui Ashes of the Singularity: Escalation, Battlefield V, Destiny 2, Far Cry 5, Forza Horizon 4, Grand Theft Auto V, Metro: Last Light Redux, Shadow of the Tomb Raider, Tom Clancy’s The Division, Tom Clancy’s Ghost Recon Wildlands, The Witcher 3 e Wolfenstein II: The New Colossus.
A metodologia de teste que estamos usando vem do PresentMon: Performance In DirectX, OpenGL e Vulkan. Em suma, esses jogos são avaliados usando uma combinação de OCAT e nossa própria GUI interna para PresentMon, com registro via GPU-Z.
Estamos usando a versão do driver 418.91 para testar a GeForce GTX 1660 Ti e construir 417.54 para todo o resto. As placas da AMD utilizam Crimson Adrenalin 2019 Edition 18.12.3.