Skylake-X: el estado actual de sus problemas
A raíz de la introducción de Skylake-X y los resultados decepcionantes de nuestros intentos de overclocking, pensamos mucho en los problemas térmicos y de energía que afectan a las CPU de escritorio de gama alta de Intel. Estos obstáculos se reducen a un par de puntos destacados que nos gustaría explorar con la mayor profundidad posible:
(1) Skylake-X en su configuración original apenas se puede enfriar durante el funcionamiento normal. Esto se debe a que su consumo de energía es extremadamente alto en algunas situaciones, y su pasta térmica evita que el calor residual se disipe de manera efectiva. (2) Apenas hay espacio para que los entusiastas hagan overclocking. Además, muchas placas base limitan aún más las CPU Skylake-X debido a las malas elecciones de diseño, como la refrigeración VRM insuficiente. Aquellos que buscan overclocks altos no necesitan postularse.
Equipo de prueba y configuración
En un esfuerzo por descubrir ambos puntos, decidimos tomar una de las placas base LGA 2066 más simples que existen, construir una mesa de banco capaz de admitir la operación vertical y comenzar a ejecutar Core i9-7900X a través de más pruebas.
Nuestros experimentos fueron en dos direcciones. Primero, examinamos las lecturas del sensor térmico y dónde reportaban calor. En segundo lugar, comparamos nuestras mediciones térmicas infrarrojas alrededor de la interfaz LGA de la placa base y los VRM para verificar la plausibilidad de los sensores. Esto también nos permitió documentar la fase de calentamiento y cómo se propagaba el calor a través de videos de lapso de tiempo.
Finalmente, nos interesa saber si otros componentes integrados se ven afectados por los puntos calientes impuestos por el procesador y de qué manera.
Estamos utilizando la versión más actual del BIOS de nuestra placa base para garantizar lecturas confiables del sensor, junto con un funcionamiento estable. La nueva versión beta de HWiNFO (v5.53-3190) fue elegida por las mismas razones.
La fuente de alimentación de la CPU de la placa base emplea un total de 5+1 fases, realizadas por un controlador buck de doble bucle International Rectifier IR35201. Es oficialmente compatible con VR12.5 Rev 1.5 de Intel y, aparentemente, también con VR13. Felicitaciones si contaste más circuitos reguladores; la duplicación de cinco fases permite dos circuitos por fase, lo que reduce la carga de cada VRM y distribuye los puntos calientes de manera más uniforme.
Cada circuito tiene su propio PowIRstage IR3555 de 60A. Estos chips altamente integrados combinan los controladores de compuerta necesarios, los MOSFET de lado alto y bajo y el diodo Schottky en un solo paquete. A diferencia de la mayoría de los MOSFET, el IR3555 puede leer valores analógicos para el sensor de temperatura incorporado. Entonces, ¿cómo es posible determinar también la temperatura de los puntos calientes en la PCB sin una cámara IR a mano?
MSI utiliza el chip NCT6795D Super I/O de Nuvoton, que puede recopilar e informar una amplia variedad de lecturas de sensores. Una de estas lecturas proviene de un termistor (ver imagen a continuación) colocado entre los chips PowIRstage. Es por eso que elegimos el lugar justo debajo de este termistor, en la parte posterior de la placa base, como ubicación para nuestras mediciones basadas en video.
Además, comprobaremos las temperaturas en los estranguladores y condensadores de los circuitos reguladores, así como las temperaturas de la placa hasta la CPU.
Regulación de frecuencia y parada de emergencia
Es importante comprender que los fabricantes de placas base agregan deliberadamente ciertos mecanismos de seguridad a sus diseños. Un ejemplo de nuestra plataforma de prueba es que la frecuencia de reloj de un procesador Skylake-X se acelera a exactamente 1,2 GHz si el termistor informa una temperatura de 105 °C o más (consulte la línea MOS en la imagen a continuación). Esa frecuencia se mantiene hasta que la temperatura cae por debajo de 90°C. Solo entonces restaura la velocidad máxima del procesador.
Aunque el punto de inflamación del material de la placa (FR4) es significativamente superior a 105 °C, las temperaturas máximas recomendadas para un funcionamiento continuado están entre 95 y 105 °C. De lo contrario, la placa base podría secarse, doblarse o fracturarse en las rutas de los conductores. Esta conciencia de seguridad es una tendencia bienvenida, sin duda.
Los entusiastas que utilizan Extreme Tuning Utility (XTU) de Intel pueden encontrar esta configuración en Thermal Throttling: Sí, en amarillo. Pero, ¿qué pasa con otras configuraciones, como Motherboard VR Throttling?
Primero, un poco de historia. Sin los MOSFET correspondientes con salida de sensor de temperatura (principalmente como voltaje), el controlador reductor IR35201 proporciona sus propias lecturas de temperatura. Hace mucho tiempo, supuestamente era posible leer las temperaturas del convertidor de voltaje como VRM1 y VRM2 para tarjetas gráficas con ciertos controladores PWM. Sin embargo, los valores de temperatura no fueron determinados por los sensores de temperatura, sino por el propio chip, ya que los MOSFET que se usaban no tenían sensores en su interior.
En nuestro caso, obtenemos los valores informados desde el PowIRstage. Después de todo, los valores bajo VR T1 y VR T2 son significativamente más altos de lo que esperábamos.
El controlador PWM solo puede garantizar un suministro de energía estable y seguro si todos los componentes se mantienen dentro de sus especificaciones técnicas. Esto significa que es necesario un ajuste de temperatura máxima. Aquí, eso es 125°C. A 125 °C o más, la configuración de limitación de VR de la placa base de XTU: Sí se vuelve amarilla y la frecuencia de la CPU se reduce a 1,2 GHz. A 135 °C, la placa base simplemente se apaga para evitar daños en el hardware.
La CPU también se protege a sí misma. Estima las temperaturas de sus núcleos y paquetes en función de las lecturas de diferentes sensores de temperatura digitales (DTS) integrados. La precisión de esas estimaciones aumenta a medida que los sensores se calientan. Por debajo de 40°C, sus medidas no tienen sentido. Sin embargo, son muy precisos por encima de los 80 °C, que es donde cuenta. Si la temperatura del núcleo o del paquete se calienta demasiado, se produce un estrangulamiento.
La temperatura del paquete incluye las corrientes de fuga del regulador de voltaje integrado. El IVR es responsable de proporcionar diferentes voltajes a los subsistemas dentro de la CPU. Los overclocks altos y los aumentos manuales de voltaje pueden hacer que el límite de temperatura se exceda inesperadamente. Es posible que las herramientas no puedan capturar este efecto de manera confiable, lo que significa que la CPU podría acelerarse sin ningún motivo visible para el usuario.
Observación n.º 1: es bien sabido que la CPU puede acelerar su frecuencia de reloj debido a que las temperaturas del núcleo o del paquete son demasiado altas. Sin embargo, el chip Super I/O también podría estrangularlo debido a que las temperaturas de VRM son demasiado altas. Finalmente, el controlador PWM también puede causar estrangulamiento si se calienta demasiado, ya que esto podría resultar en una fuente de alimentación peligrosamente inestable. Además, es una leyenda urbana que el controlador PWM puede informar temperaturas VRM.
El sistema de prueba
Equipo de prueba y entorno
Sistema
Intel Core i9-7900XMSI X299 Gaming Pro Carbon AC4x 4GB G.Skill Ripjaws IV DDR4-2600Nvidia Quadro P6000 (estación de trabajo)1x 1TB Toshiba OCZ RD400 (M.2, sistema)2x 960GB Toshiba OCZ TR150 (almacenamiento, imágenes)Be Quiet Dark Power Pro 11, unidad de fuente de alimentación (PSU) de 850 WWindows 10 Pro (actualización de creadores)
Enfriamiento
Alphacool Eiszeit 2000 Chiller + Alphacool Eisblock XPXAlphacool Eisbär 240 (Enfriador de agua todo en uno)Noctua NH-D15 (Enfriador de aire)Thermal Grizzly Kryonaut (Usado al cambiar de enfriadores)
Monitor
Eizo EV3237-BK
Medición del consumo de energía
Medición de corriente continua en derivaciones (caída de tensión) Medición de corriente continua en puntos de medición Medición de CC sin contacto en cable de alimentación auxiliar externo 2 osciloscopios multicanal digitales Rohde & Schwarz HMO 3054 de 500 MHz con función de almacenamiento 4 sondas de corriente Rohde & Schwarz HZO50 (1 mA – 30 A, 100 kHz, CC) 4 Rohde & Schwarz HZ355 (sondas 10:1, 500 MHz) 1 multímetro digital Rohde & Schwarz HMC 8012 con función de almacenamiento
Medición Térmica
1x Cámara infrarroja Optris PI640 80Hz + PI Connect Monitoreo y grabación de imágenes y videos de emisión de infrarrojos en tiempo real