Saluda a una nueva GPU basada en Pascal
Dos meses después de su debut, la arquitectura Pascal de Nvidia está llenando lentamente la cartera de tarjetas gráficas de escritorio de la compañía de arriba a abajo. Primero vino la GeForce GTX 1080, que ofrece un 30 % más de rendimiento que una GeForce GTX 980 Ti por menos dinero. Los proveedores en línea aún no pueden mantenerlos en stock (Newegg no tiene ninguno al momento de escribir este artículo). Luego nos presentaron la GeForce GTX 1070, que también supera a la 980 Ti por cientos de dólares menos.
Ahora estamos obteniendo una tercera placa basada en Pascal en la GeForce GTX 1060. Anunciada a principios de este mes, ya sabemos que los socios de Nvidia tendrán versiones a partir de $250. La implementación de Founders Edition se venderá por $300 en nvidia.com y en las tiendas Best Buy, así que no se sorprenda si no los encuentra en otros lugares en línea.
GeForce GTX 1060 se basa en una GPU completamente nueva llamada GP106 que expone muchas de las mismas funciones que la GP104, pero en un paquete más convencional. Sin embargo, no dejes que ese término te disuada. La 1060 puede ser una mera tarjeta de 120 W, pero Nvidia dice que es buena para las velocidades de cuadro de la clase GeForce GTX 980. Hace dos años, ese nivel de desempeño se vendía por $550. Hemos recorrido un largo camino, sin duda.
Conoce GP106
Nvidia construye su GeForce GTX 1080 insignia utilizando un procesador GP104 completo con cuatro clústeres de procesamiento de gráficos habilitados. Esto produce una tarjeta con 2560 núcleos CUDA y 160 unidades de textura. La GTX 1070 se centra en la misma GPU con tres de sus GPC encendidas, sumando hasta 1920 núcleos y 120 unidades de textura.
GeForce GTX 1060 se reduce de manera similar utilizando los mismos bloques de construcción arquitectónicos. De nuestra cobertura de lanzamiento de GeForce GTX 1080:
“Cada GPC incluye cinco clústeres de procesamiento de hilos/texturas y un motor de trama. Desglosado aún más, un TPC combina un multiprocesador de transmisión y un motor PolyMorph. El SM combina 128 núcleos CUDA de precisión simple, capacidad de archivo de registro de 256 KB, 96 KB de memoria compartida, 48 KB de caché L1/textura y ocho unidades de textura. Mientras tanto, el motor PolyMorph de cuarta generación incluye un nuevo bloque de lógica que se encuentra al final de la tubería de geometría y por delante de la unidad de trama para manejar la función de proyección múltiple simultánea de Nvidia”.
GPU
GeForce GTX 1060 (GP106)
GeForce GTX 980 (GM204)
SMS
10
dieciséis
Núcleos CUDA
1280
2048
Reloj básico
1506 MHz
1126 MHz
Reloj de refuerzo de GPU
1708 MHz
1216 MHz
GFLOP (reloj base)
3855
4612
Unidades de textura
80
128
Tasa de relleno de Texel
120,5 GT/s
144,1 GT/s
Tasa de datos de memoria
8 GB/s
7 GB/s
ancho de banda de memoria
192 GB/s
224 GB/s
ROP
48
64
Caché L2
1,5 MB
2MB
TDP
120W
165W
transistores
4.4 mil millones
5.2 mil millones
Tamaño del troquel
200 mm²
398 mm²
Nodo de proceso
16nm
28nm
GP106 viene equipado con dos GPC, por lo que termina con un total de 1280 núcleos CUDA y 80 unidades de textura. El chip se beneficia de los mismos tiempos optimizados que permitieron a Nvidia aumentar la velocidad del reloj en GP104, lo que facilita una frecuencia base de 1506 MHz y una clasificación GPU Boost típica de 1708 MHz.
El back-end del procesador también está recortado. Seis controladores de memoria de 32 bits proporcionan una ruta de datos agregada de 192 bits. Al igual que el GP104 más grande, cada controlador está asociado con ocho ROP y 256 KB de L2, sumando hasta 48 ROP y 1,5 MB de caché. Nvidia coloca 6 GB de 8 GT/s GDDR5 en la placa, con un rendimiento máximo de hasta 192 GB/s. Aunque esa cifra es más baja que los 224 GB/s de la GTX 980, recuerda también que Pascal emplea nuevas técnicas sin pérdidas para extraer ahorros en el subsistema de memoria, aumentando efectivamente el ancho de banda utilizable. Adaptado de nuestra cobertura GTX 1080, «la compresión de color delta [GP106] intenta lograr un ahorro de 2:1, y este modo supuestamente se ha mejorado para que se pueda usar con más frecuencia. También hay un nuevo modo 4:1 que cubre los casos en los que las diferencias por píxel son muy pequeños y comprimibles en incluso menos espacio.Finalmente,
Por supuesto, GP106 se fabrica utilizando el mismo proceso TSMC 16FF+ que GP104. Mientras que la GPU más grande se compone de 7200 millones de transistores en una matriz de 314 mm², Nvidia empaqueta 4400 millones de transistores FinFET en 200 mm² para GP106. El procesador menos complejo, junto con menos memoria en un PCA más simple, da como resultado un TDP de 120 W.
Una primicia: sin SLI para la corriente principal superior
¿Notó la falta de un conector SLI en la parte superior? Nvidia recomienda una GeForce GTX 1070 o 1080 a los jugadores que buscan más rendimiento que el que ofrece una 1060 (por supuesto), y no es compatible con SLI en la 1060. Generacionalmente, esta es la placa de gama más alta que podemos recordar sin la tecnología. Claro, la GeForce GTX 750 Ti no la tenía, pero la 760 sí. También lo hizo la GeForce GTX 950.
Oficialmente, Nvidia interioriza la decisión. No hay muchos jugadores que emparejen las GPU convencionales, y la compañía no quiere distribuir los recursos, por lo que se está enfocando en optimizar SLI en tarjetas más rápidas basadas en Pascal. Sin embargo, más allá de esa explicación, el desarrollo de juegos va en una dirección diferente con el posprocesamiento y los efectos orientados a la computación que no son compatibles con la representación de fotogramas alternativos. Y con DirectX 12, se transfiere más control a los ISV ansiosos por publicar su contenido lo más rápido posible. Eso significa que gran parte del trabajo que Nvidia invierte en sus controladores se elude.
Tenemos un juego en nuestra suite que admite múltiples GPU a través de DirectX 12: Ashes of the Singularity. Después de agregar una segunda GeForce GTX 1060 y hacer clic en una casilla de verificación, vemos la siguiente aceleración:
Aunque ese no es el tipo de escalado que estamos acostumbrados a ver en SLI, ~50% no está mal. Desafortunadamente, ni siquiera podemos experimentar con juegos DirectX 11 y títulos DX12 sin soporte para múltiples adaptadores integrados.
Dado que esta es una tarjeta enfocada en 1080p, Nvidia podría habilitar retroactivamente SLI sobre PCI Express a través de una actualización del controlador, y esperamos que así sea. Independientemente de cuán pocos jugadores puedan estar interesados en emparejar tarjetas GTX 1060, todavía hay muchos títulos DX11 que se benefician de las configuraciones de múltiples GPU. Y cualquier problema que tenga GP106 para superar los problemas de escala impuestos por DX12 también se aplica a las tarjetas basadas en GP104. Deje que los puntos de referencia de rendimiento determinen qué tan atractivos son o no los 1060 con SLI, decimos.
Una mirada más cercana a la GeForce GTX 1060 Founders Edition
Nvidia continúa con su diseño de edición de fundadores de la serie 10 más vanguardista, aunque la GTX 1060 tiene una implementación presumiblemente menos costosa en comparación con la 1070 y la 1080.
Sin embargo, eso no significa que la nueva tarjeta sea pequeña. Mide 25,4 cm de largo (medido desde la tapa de la ranura hasta el final de la tarjeta), 10,7 cm de alto (medido desde la parte superior de la ranura de la placa base hasta la parte superior de la tarjeta) y 3,8 cm de profundidad. En realidad, la profundidad de la tarjeta es de solo 3,5 cm, pero la tapa de la ranura sobresale 0,3 cm.
Con 845 g, la GeForce GTX 1060 Founders Edition tampoco es particularmente liviana.
Diseño, Sensación y Conectores
Una vez más, Nvidia usa una mezcla de aluminio y plástico para la cubierta de la tarjeta. Sin embargo, esta vez es un poco más simple. La cubierta, incluido el ventilador, se puede quitar en una sola pieza. Arriba, encontramos el logotipo de GeForce GTX iluminado, junto con un conector de alimentación de seis pines.
El back-end de la GeForce GTX 1060 se aparta un poco de los diseños anteriores. Las tarjetas gráficas con PCA cortos a menudo tienen tomas de aire donde el enfriador sobresale más allá de la placa, dando servicio al ventilador radial. En cambio, el 1060 tiene una tapa normal sin abertura. Sin duda, debido a problemas de costos, tampoco hay placa posterior.
El reverso de la tarjeta nos presenta una vista familiar.
El panel de E/S se copia de GeForce GTX 1080 y 1070 de Nvidia sin un solo cambio. Está dominado por tres conectores DisplayPort, que son compatibles con la versión 1.2. Sin embargo, la compañía nos dice que también están listos para las versiones 1.3 y 1.4, que coinciden con el controlador de pantalla de la GPU. Además, hay un conector HDMI 2.0 y un conector DVI de doble enlace; no hay salida analógica disponible.
Diseño de refrigerador, placa y fuente de alimentación
Dirigiendo nuestra atención hacia adentro, quitamos la cubierta para exponer la solución de enfriamiento de la GeForce GTX 1060.
En la parte superior, inmediatamente notamos la extraña posición del conector de alimentación. Está situado en una parte del enfriador que sobresale más allá del PCA real. Esto requiere una serie de cables para conectar a la placa.
La implementación es todo menos elegante y evita que los socios de Nvidia construyan 1060 más cortos. Aunque la tarjeta tiene solo 17,5 cm de largo, no tiene espacio para acomodar un conector de alimentación.
Retire los cuatro tornillos que sujetan el cuerpo del enfriador y saldrá de inmediato. Hay un disipador de calor de cobre masivo y un marco de metal debajo. El diseño de la aleta de refrigeración cerrada nos recuerda a la GeForce GTX 1070, y debería proporcionar un amplio rendimiento dado el TDP de 120 W de la 1060.
El marco masivo de retención y enfriamiento cumple una doble función al mantener todo en su lugar y enfriar los módulos de memoria/circuitos de regulación de voltaje.
Una vez que el marco se desabrocha y se quita, se debe voltear hacia arriba y hacia abajo. Esto se debe a los cables que conectan el conector de alimentación PCIe separado, que están soldados permanentemente a la placa. Hacer esto revela el PCA desnudo en todo su esplendor.
Como de costumbre, la GPU se encuentra al frente y al centro. La GP106 es, naturalmente, un poco más pequeña que la GPU GP104 que encontramos en las GeForce GTX 1080 y 1070 de Nvidia. Sin embargo, las diferencias entre placas no terminan ahí.
Tome los módulos de memoria como ejemplo. Solo seis de los emplazamientos del 1060 están equipados con Samsung K4G80325FB-HC25 GDDR5. Tienen una capacidad de 8 Gb (32 x 256 Mb) cada uno y funcionan entre 1,305 V y 1,597 V, según la velocidad del reloj. En total, aquí es donde obtenemos la especificación de 6GB del 1060.
Desafortunadamente, el controlador PWM no está documentado. Está fabricado por uPI Semiconductor y lleva el número de modelo uP9509, lo que significa que probablemente sea el hermano menor del uP9511P (el último controlador es lo que encontramos emparejado con el procesador GP104).
Los módulos de memoria y una de las fases de la GPU obtienen su energía a través de la ranura PCIe de la placa base. Las dos fases GPU restantes y los accesorios de la tarjeta obtienen energía del conector de alimentación de seis pines. Echaremos un vistazo más de cerca a lo que esto significa en términos de distribución de carga a través de los rieles en la página siguiente.
Cuando se trata de la regulación de voltaje, Nvidia usa solo un MOSFET de canal N dual, el E6930, por fase para el lado alto y bajo; no se necesitan controladores de puerta separados. Este componente altamente integrado explica los espacios vacíos en el tablero.
Las tres fases de la GPU son completamente suficientes y su distribución tiene más sentido aquí que en la Radeon RX 480 de AMD.
Aparte del conector de alimentación de seis pines, que parece haber tomado un giro equivocado en alguna parte, la GeForce GTX 1060 de referencia de Nvidia en realidad se ve bastante bien. Y dada una cantidad relativamente baja de calor residual, su ventilador axial tampoco es una mala elección.