Saltar al contenido

OpenCL en acción: aplicaciones de procesamiento posterior, aceleradas

    1652144343

    ¿Qué promete realmente la computación heterogénea?

    Nadie está listo para declarar que la edad de las CPU ha terminado. Después de todo, empresas como Xilinx todavía venden dispositivos lógicos programables específicos de la aplicación que están mucho menos integrados funcionalmente y tienen múltiples propósitos que las unidades de procesamiento central modernas. A veces, lo más simple es más efectivo. Es probable que los procesadores especializados continúen teniendo éxito en ciertos segmentos del mercado, especialmente donde la principal preocupación es mucho rendimiento. Sin embargo, en una gama cada vez más diversa de entornos convencionales, esperamos que la computación heterogénea, que tiene muchos tipos de recursos computacionales empaquetados en un solo dispositivo integrado, continúe siendo más popular. Y como dispositivos de fabricación, estos dispositivos también se volverán más complejos.

    El final lógico de la informática heterogénea es un sistema en un chip (SoC), en el que todos (o al menos muchos) los principales sistemas de circuitos están integrados en un solo paquete. Como ejemplo, los chips Geode de AMD (que actualmente impulsan el proyecto One Laptop Per Child) han evolucionado a partir de los diseños SoC de la década de 1990. Si bien muchos productos SoC todavía carecen de la potencia para alimentar una PC de escritorio convencional y moderna, tanto AMD como Intel venden arquitecturas que combinan núcleos de CPU, recursos gráficos y control de memoria. Estas unidades de procesamiento acelerado (APU), como las llama AMD, cumplen e incluso superan los niveles de rendimiento que se esperan de las típicas estaciones de trabajo orientadas a la productividad. En particular, complementan los diseños de procesadores familiares con muchas, muchas ALU que normalmente se usan para acelerar los gráficos 3D. Sin embargo, estos recursos programables no tienen que usarse para jugar.

    Históricamente, las soluciones gráficas integradas estaban habilitadas por la lógica en el puente norte del conjunto de chips. Paralizado por graves cuellos de botella y latencias, en cierto punto simplemente se hizo más difícil escalar el rendimiento usando componentes de plataforma tan lejos unos de otros. Como resultado, hemos visto que la funcionalidad migra hacia la CPU, creando una nueva generación de productos capaces no solo de ofrecer un rendimiento de juego significativamente mejor, sino también de abordar tareas más generales que aprovechan la naturaleza híbrida de los SoC con la CPU. y funcionalidad GPU. 

    Para AMD, esto marca la culminación buscada durante mucho tiempo de la iniciativa Fusion de la compañía, que presumiblemente fue el impulsor detrás de la adquisición de ATI Technologies por parte de AMD en 2006. AMD vio el potencial de sus CPU y la tecnología de gráficos de ATI para suplantar a las CPU puras en una parte cada vez mayor del mercado, y la empresa estaba decidida a estar a la vanguardia de esa transición. Intel, por supuesto, emplea su propia tecnología gráfica interna, pero con un fin diferente. Decididamente, su énfasis se ha centrado más en sus núcleos de procesamiento y menos en la tecnología gráfica.

    A principios de 2011 llegó la primera familia de APU de las series C y E de AMD, fabricadas en un proceso de 40 nm. El uso de la integración permitió modelos de bajo consumo de 9 y 18 W que se convirtieron en portátiles ultraportátiles. Hoy, tenemos la familia de APU serie A basada en Llano. El uso de la fabricación de 32 nm hace posible acumular suficientes recursos para una verdadera arquitectura de clase de escritorio a un precio orientado al valor.

    Si bien aquí hay una variedad de especificaciones en juego, quizás el mayor diferenciador entre los modelos que se enumeran a continuación son sus respectivos motores gráficos. El A8 emplea una configuración a la que AMD se refiere como Radeon HD 6550D. Consta de 400 procesadores de flujo, núcleos Radeon o sombreadores, cualquiera que sea el nombre que desee usar. La A6 desciende a la Radeon HD 6530, que cuenta con 320 procesadores de flujo. Y la A4 se reduce a una Radeon HD 6410D con 160 procesadores de flujo.

    Ya hemos probado CPU y APU de menos de $ 200 a través de varios de nuestros puntos de referencia de juegos favoritos, por lo que sabemos cómo se elevan o se hunden los chips más recientes en los títulos modernos. Sin embargo, ahora queremos echar un vistazo a algunas de las otras formas en que los entusiastas pueden aprovechar los recursos informáticos, utilizando cargas de trabajo que gravan los núcleos de CPU convencionales y los procesadores programables que se encuentran en los productos orientados a gráficos.

    En esta entrega inicial de lo que será una serie de nueve partes, estamos examinando el posprocesamiento de video. En el pasado, este habría sido un modelo de uso que consumía mucho tiempo, incluso con una CPU multinúcleo debajo del capó. Sin embargo, debido a que es una carga de trabajo en gran parte paralela, acelerarla con los muchos núcleos de un procesador de gráficos se ha convertido en una excelente manera de aumentar la productividad y mejorar el rendimiento.

    Solicitamos la ayuda de AMD para armar esta serie, por lo que nos centraremos en el hardware de la empresa para crear algunas comparaciones bastante básicas. ¿Cómo funciona una CPU por sí sola en el software habilitado para OpenCL? ¿Qué tal una de las APU basadas en Llano por sí sola? Luego, uniremos las APU más baratas y las CPU más caras hasta un par de tarjetas discretas diferentes para trazar cómo el rendimiento aumenta y disminuye en cada configuración.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x