Avançar para o conteúdo

OpenCL em ação: aplicativos de pós-processamento, acelerados

    1652144343

    O que a computação heterogênea realmente promete?

    Ninguém está pronto para declarar que a idade das CPUs acabou. Afinal, empresas como a Xilinx ainda vendem dispositivos lógicos programáveis ​​específicos de aplicativos que são muito menos integrados funcionalmente e multifuncionais do que as unidades de processamento central modernas. Às vezes, o mais simples é mais eficaz. É provável que processadores especializados continuem a ter sucesso em certos segmentos de mercado, especialmente onde o desempenho é a principal preocupação. No entanto, em uma gama cada vez mais diversificada de ambientes convencionais, esperamos que a computação heterogênea – com muitos tipos de recursos computacionais reunidos em um único dispositivo integrado – continue a se tornar mais popular. E como dispositivos de fabricação, esses dispositivos também ficarão mais complexos.

    O fim lógico da computação heterogênea é um sistema em um chip (SoC), em que todos (ou pelo menos muitos) os principais sistemas de circuito são integrados em um pacote. Como exemplo, os chips Geode da AMD (atualmente alimentando o projeto One Laptop Per Child) evoluíram a partir dos designs de SoC da década de 1990. Embora muitos produtos SoC ainda não tenham a potência necessária para alimentar um PC desktop moderno e convencional, tanto a AMD quanto a Intel vendem arquiteturas que combinam núcleos de CPU, recursos gráficos e controle de memória. Essas unidades de processamento acelerado (APUs), como a AMD as chama, atendem e até superam os níveis de desempenho esperados de estações de trabalho típicas orientadas à produtividade. Mais notavelmente, eles complementam designs de processadores familiares com muitas, muitas ALUs normalmente usadas para acelerar gráficos 3D. Esses recursos programáveis ​​não precisam ser usados ​​para jogos, no entanto.

    Historicamente, as soluções gráficas on-board eram habilitadas pela lógica na ponte norte do chipset. Paralisado por gargalos e latências graves, em um certo ponto, simplesmente se tornou mais difícil aumentar o desempenho usando componentes de plataforma tão distantes uns dos outros. Como resultado, vimos que a funcionalidade migra para o norte na CPU, criando uma nova geração de produtos capazes não apenas de oferecer um desempenho de jogo significativamente melhor, mas também de lidar com tarefas mais gerais que aproveitam a natureza híbrida de SoCs com CPU e funcionalidade GPU. 

    Para a AMD, isso marca o ponto culminante da iniciativa Fusion da empresa, que provavelmente foi o impulsionador por trás da aquisição da ATI Technologies pela AMD em 2006. A AMD viu o potencial de suas CPUs e a tecnologia gráfica da ATI para suplantar as CPUs puras em uma fatia cada vez maior do mercado, e a empresa estava determinada a estar na vanguarda dessa transição. A Intel, é claro, emprega sua própria tecnologia gráfica interna, mas para um fim diferente. Decididamente, sua ênfase tem sido mais focada em seus núcleos de processamento e menos em tecnologia gráfica.

    O início de 2011 testemunhou a chegada da primeira família de APUs das séries C e E da AMD, fabricadas em um processo de 40 nm. O uso da integração possibilitou modelos de 9 e 18 W de baixo consumo que entraram em notebooks ultraportáteis. Hoje, temos a família de APUs da série A baseada em Llano. O uso da fabricação de 32 nm torna possível reunir recursos suficientes para uma verdadeira arquitetura de classe de desktop a um preço orientado para o valor.

    Embora haja uma variedade de especificações em jogo aqui, talvez o maior diferencial entre os modelos listados abaixo sejam seus respectivos mecanismos gráficos. O A8 emprega uma configuração que a AMD chama de Radeon HD 6550D. Ele consiste em 400 processadores de fluxo, núcleos Radeon ou shaders, qualquer nome que você goste de usar. A A6 desce para a Radeon HD 6530, com 320 processadores stream. E o A4 é redimensionado para uma Radeon HD 6410D com 160 processadores stream.

    Já rodamos CPUs e APUs abaixo de US$ 200 em vários de nossos benchmarks de jogos favoritos, então sabemos como os chips mais recentes sobem ou afundam em títulos modernos. Agora, queremos dar uma olhada em algumas das outras maneiras pelas quais os entusiastas podem aproveitar os recursos de computação, usando cargas de trabalho que sobrecarregam os núcleos de CPU convencionais e os processadores programáveis ​​encontrados em produtos orientados a gráficos.

    Nesta parte inicial do que será uma série de nove partes, estamos colocando o pós-processamento de vídeo sob o microscópio. Antigamente, esse seria um modelo de uso demorado, mesmo com uma CPU multi-core sob o capô. Por ser uma carga de trabalho amplamente paralela, porém, acelerá-la com os muitos núcleos de um processador gráfico tornou-se uma ótima maneira de aumentar a produtividade e melhorar o desempenho.

    Contamos com a ajuda da AMD para montar esta série, então vamos nos concentrar no hardware da empresa para criar algumas comparações bem básicas. Como uma CPU por conta própria funciona em software habilitado para OpenCL? Que tal uma das APUs baseadas em Llano por conta própria? Em seguida, combinaremos as APUs mais baratas e as CPUs mais caras até algumas placas discretas diferentes para traçar como o desempenho aumenta e diminui em cada configuração.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x