Diga Olá para uma nova GPU baseada em Pascal
Dois meses após sua estreia, a arquitetura Pascal da Nvidia está lentamente preenchendo o portfólio de placas gráficas de desktop da empresa de cima a baixo. Primeiro veio a GeForce GTX 1080, oferecendo mais de 30% de desempenho do que uma GeForce GTX 980 Ti por menos dinheiro. Os fornecedores on-line ainda não podem mantê-los em estoque (a Newegg não tem nenhum até o momento). Em seguida, fomos apresentados à GeForce GTX 1070, que também supera uma 980 Ti por centenas de dólares a menos.
Agora estamos recebendo uma terceira placa baseada em Pascal na GeForce GTX 1060. Anunciado no início deste mês, já sabemos que os parceiros da Nvidia terão versões a partir de US$ 250. A implementação da Founders Edition será vendida por US$ 300 no nvidia.com e nas lojas Best Buy, então não se surpreenda quando você não encontrá-los em outro lugar online.
A GeForce GTX 1060 é baseada em uma nova GPU chamada GP106 que expõe muitos dos mesmos recursos do GP104, mas em um pacote mais convencional. Não deixe esse termo dissuadi-lo, no entanto. A 1060 pode ser uma mera placa de 120W, mas a Nvidia diz que é boa para as taxas de quadros da classe GeForce GTX 980. Dois anos atrás, esse nível de desempenho foi vendido por US$ 550. Percorremos um longo caminho, com certeza.
Conheça GP106
A Nvidia constrói sua principal GeForce GTX 1080 usando um processador GP104 completo com quatro clusters de processamento gráfico habilitados. Isso produz uma placa com 2560 núcleos CUDA e 160 unidades de textura. A GTX 1070 se concentra na mesma GPU com três de seus GPCs ativados, somando 1920 núcleos e 120 unidades de textura.
A GeForce GTX 1060 é reduzida de forma semelhante usando os mesmos blocos de construção arquitetônicos. Da nossa cobertura de lançamento da GeForce GTX 1080:
“Cada GPC inclui cinco clusters de processamento de thread/textura e mecanismo raster. Dividido ainda mais, um TPC combina um multiprocessador de streaming e um mecanismo PolyMorph. O SM combina 128 núcleos CUDA de precisão simples, capacidade de arquivo de registro de 256 KB, 96 KB de memória compartilhada, 48 KB de cache L1/textura e oito unidades de textura. Enquanto isso, o mecanismo PolyMorph de quarta geração inclui um novo bloco de lógica que fica no final do pipeline de geometria e à frente da unidade raster para lidar com o recurso de projeção múltipla simultânea da Nvidia.”
GPU
GeForce GTX 1060 (GP106)
GeForce GTX 980 (GM204)
SMS
10
16
Núcleos CUDA
1280
2048
Relógio básico
1506 MHz
1126 MHz
Relógio de impulso da GPU
1708 MHz
1216 MHz
GFLOPs (relógio base)
3855
4612
Unidades de textura
80
128
Taxa de preenchimento de Texel
120,5 GT/s
144,1 GT/s
Taxa de dados da memória
8 Gb/s
7 Gb/s
Largura de banda de memória
192 GB/s
224 GB/s
ROPs
48
64
Cache L2
1,5 MB
2 MB
TDP
120 W
165 W
Transistores
4,4 bilhões
5,2 bilhões
Tamanho da matriz
200 mm²
398 mm²
Nó de Processo
16 nm
28 nm
O GP106 vem equipado com dois GPCs, então você acaba com um total de 1280 núcleos CUDA e 80 unidades de textura. O chip se beneficia dos mesmos tempos otimizados que permitem que a Nvidia aumente as taxas de clock no GP104, facilitando uma frequência base de 1506 MHz e uma classificação típica de GPU Boost de 1708 MHz.
O back-end do processador também é reduzido. Seis controladores de memória de 32 bits fornecem um caminho de dados agregado de 192 bits. Assim como o GP104 maior, cada controlador está associado a oito ROPs e 256 KB de L2, somando até 48 ROPs e 1,5 MB de cache. A Nvidia coloca 6 GB de 8 GT/s GDDR5 na placa, servindo até 192 GB/s de taxa de transferência máxima. Embora esse valor seja inferior aos 224 GB/s da GTX 980, lembre-se também que o Pascal emprega novas técnicas sem perdas para extrair economias no subsistema de memória, aumentando efetivamente a largura de banda utilizável. Adaptado de nossa cobertura GTX 1080, “a compactação de cores delta do [GP106] tenta alcançar uma economia de 2:1, e esse modo é supostamente aprimorado para ser usado com mais frequência. Há também um novo modo 4:1 que cobre casos em que as diferenças por pixel são muito pequenos e compressíveis em espaço ainda menor.
Obviamente, o GP106 é fabricado usando o mesmo processo TSMC 16FF+ que o GP104. Enquanto a GPU maior é composta por 7,2 bilhões de transistores em uma matriz de 314 mm², a Nvidia embala 4,4 bilhões de transistores FinFET em 200 mm² para GP106. O processador menos complexo, combinado com menos memória em um PCA mais simples, resulta em um TDP de 120W.
A First: Sem SLI para Upper-Mainstream
Observe a falta de um conector SLI na parte superior? A Nvidia recomenda uma GeForce GTX 1070 ou 1080 para jogadores que procuram mais desempenho do que uma 1060 oferece (é claro), e não suporta SLI na 1060. Geracionalmente, esta é a placa mais avançada que podemos lembrar sem a tecnologia. Claro, a GeForce GTX 750 Ti não tinha, mas a 760 tinha. O mesmo aconteceu com a GeForce GTX 950.
Oficialmente, a Nvidia internaliza a decisão. Não há muitos jogadores que emparelham GPUs convencionais, e a empresa não quer espalhar recursos, por isso está se concentrando em otimizar o SLI em placas baseadas em Pascal mais rápidas. Além dessa explicação, porém, o desenvolvimento de jogos está indo em uma direção diferente com pós-processamento e efeitos orientados a computação que não são amigáveis para renderização de quadros alternativos. E com o DirectX 12, mais controle é transferido para ISVs ansiosos para divulgar seu conteúdo o mais rápido possível. Isso significa que grande parte do trabalho da Nvidia em seus drivers é contornado.
Temos um jogo em nosso pacote que suporta várias GPUs através do DirectX 12: Ashes of the Singularity. Depois de adicionar uma segunda GeForce GTX 1060 e clicar em uma caixa de seleção, vemos a seguinte aceleração:
Embora esse não seja o tipo de dimensionamento que estamos acostumados a ver no SLI, ~50% não é ruim. Infelizmente, não podemos nem experimentar jogos DirectX 11 e títulos DX12 sem suporte para vários adaptadores integrados.
Dado que esta é uma placa focada em 1080p, a Nvidia pode habilitar retroativamente o SLI sobre PCI Express por meio de uma atualização de driver, e esperamos que sim. Independentemente de quão poucos jogadores possam estar interessados em emparelhar placas GTX 1060, ainda há muitos títulos DX11 que se beneficiam de configurações multi-GPU. E qualquer problema que o GP106 tenha ao cortar os problemas de dimensionamento impostos pelo DX12 também se aplica às placas baseadas em GP104. Deixe que os benchmarks de desempenho determinem o quão atraentes os 1060s SLI são ou não, dizemos.
Uma visão mais detalhada da GeForce GTX 1060 Founders Edition
A Nvidia continua com seu design mais ousado da Founders Edition da série 10, embora a GTX 1060 ostente uma implementação presumivelmente mais barata em comparação com a 1070 e a 1080.
Isso não significa que o novo cartão é pequeno, no entanto. Tem 25,4 cm de comprimento (medido da tampa do slot até a extremidade da placa), 10,7 cm de altura (medido da parte superior do slot da placa-mãe até a parte superior da placa) e 3,8 cm de profundidade. Na realidade, a profundidade do cartão é de apenas 3,5 cm, mas a tampa do slot se destaca por 0,3 cm.
Com 845g, a GeForce GTX 1060 Founders Edition também não é particularmente leve.
Design, sensação e conectores
Mais uma vez, a Nvidia usa uma mistura de alumínio e plástico para a cobertura da placa. É um pouco mais simples desta vez, no entanto. A tampa, incluindo o ventilador, pode ser removida em uma única peça. No topo, encontramos o logotipo GeForce GTX iluminado, junto com um conector de alimentação de seis pinos.
O back-end da GeForce GTX 1060 é um pouco diferente dos designs anteriores. Placas gráficas com PCAs curtos geralmente têm entradas de ar onde o cooler se projeta além da placa, atendendo a ventoinha radial. Em vez disso, o 1060 tem uma tampa normal sem abertura. Sem dúvida, devido a preocupações com custos, também não há placa traseira.
O verso do cartão nos apresenta uma visão familiar.
O painel de E/S é copiado da GeForce GTX 1080 e 1070 da Nvidia sem uma única alteração. É dominado por três conectores DisplayPort, que são compatíveis com a versão 1.2. No entanto, a empresa nos diz que também está pronta para a versão 1.3 e 1.4, combinando com o controlador de exibição da GPU. Além disso, há um conector HDMI 2.0 e um conector DVI de link duplo; nenhuma saída analógica está disponível.
Design de refrigerador, placa e fonte de alimentação
Voltando nossa atenção para dentro, removemos a cobertura para expor a solução de resfriamento da GeForce GTX 1060.
No topo, notamos imediatamente a posição estranha do conector de alimentação. Ele está situado em uma parte do cooler que se projeta além do PCA real. Isso requer uma série de cabos para conectar à placa.
A implementação não é nada elegante e impede que os parceiros da Nvidia criem 1060s mais curtos. Embora a placa tenha apenas 17,5 cm de comprimento, ela não possui espaço para acomodar um conector de alimentação.
Remova os quatro parafusos que prendem o corpo do cooler e ele sai imediatamente. Há um enorme dissipador de calor de cobre e estrutura de metal embaixo. O design da aleta de resfriamento fechada nos lembra a GeForce GTX 1070, e deve fornecer amplo desempenho devido ao TDP de 120W da 1060.
A estrutura massiva de retenção e resfriamento tem dupla função, mantendo tudo no lugar e resfriando o circuito de regulação de tensão/módulos de memória.
Uma vez que o quadro é solto e retirado, ele precisa ser virado para cima e para cima. Isso se deve aos cabos que conectam o conector de alimentação PCIe separado, que são soldados permanentemente à placa. Fazer isso revela o PCA nu em toda a sua glória.
Como de costume, a GPU fica na frente e no centro. A GP106 é naturalmente um pouco menor que a GPU GP104 que encontramos nas GeForce GTX 1080 e 1070 da Nvidia. As diferenças entre as placas não param por aí.
Tome os módulos de memória como exemplo. Apenas seis das instalações do 1060 são preenchidas com Samsung K4G80325FB-HC25 GDDR5. Eles têm uma capacidade de 8Gb (32 x 256Mb) cada e funcionam de 1.305V a 1.597V, dependendo da taxa de clock. Tudo dito, é aqui que obtemos a especificação de 6 GB do 1060.
Infelizmente, o controlador PWM não está documentado. É feito pela uPI Semiconductor e tem o número do modelo uP9509, o que significa que provavelmente é o irmão menor do uP9511P (o último controlador é o que encontramos emparelhado com o processador GP104).
Os módulos de memória e uma das fases da GPU obtêm energia através do slot PCIe da placa-mãe. As duas fases restantes da GPU e os acessórios da placa consomem energia do conector de alimentação de seis pinos. Veremos mais de perto o que isso significa em termos de distribuição de carga nos trilhos na próxima página.
Quando se trata de regulação de tensão, a Nvidia usa apenas um MOSFET Dual N-Channel, o E6930, por fase para o lado alto e baixo; drivers de portão separados não são necessários. Este componente altamente integrado explica os espaços vazios no tabuleiro.
As três fases da GPU são completamente suficientes, e sua distribuição faz mais sentido aqui do que na Radeon RX 480 da AMD.
Além do conector de alimentação de seis pinos, que parece ter errado em algum lugar, a referência da Nvidia GeForce GTX 1060 realmente parece muito boa. E dada uma quantidade relativamente baixa de calor residual, sua ventoinha axial também não é uma má escolha.