Vai al contenuto

OpenCL in azione: app di post-elaborazione, accelerate

    1652144343

    Cosa promette davvero l’informatica eterogenea?

    Nessuno è pronto a dichiarare finita l’età delle CPU. Dopotutto, aziende come Xilinx vendono ancora dispositivi logici programmabili specifici per applicazioni che sono molto meno integrati dal punto di vista funzionale e multiuso rispetto alle moderne unità di elaborazione centrale. A volte, più semplice è più efficace. È probabile che i processori specializzati continueranno a riscuotere successo in determinati segmenti di mercato, soprattutto dove le grandi prestazioni sono la preoccupazione principale. In una gamma sempre più diversificata di ambienti tradizionali, tuttavia, prevediamo che l’elaborazione eterogenea, con molti tipi di risorse di calcolo racchiuse in un unico dispositivo integrato, continuerà a diventare più popolare. E come dispositivi di produzione, anche questi dispositivi diventeranno più complessi.

    L’endgame logico dell’elaborazione eterogenea è un system-on-a-chip (SoC), in cui tutti (o almeno molti) i principali sistemi di circuiti sono integrati in un unico pacchetto. Ad esempio, i chip Geode di AMD (che attualmente alimentano il progetto One Laptop Per Child) si sono evoluti dai progetti SoC degli anni ’90. Sebbene molti prodotti SoC non abbiano ancora la potenza per alimentare un PC desktop mainstream moderno, sia AMD che Intel vendono architetture che combinano core CPU, risorse grafiche e controllo della memoria. Queste unità di elaborazione accelerata (APU), come le chiama AMD, soddisfano e addirittura superano i livelli di prestazioni attesi dalle tipiche workstation orientate alla produttività. In particolare, integrano i progetti di processori familiari con molte, molte ALU generalmente utilizzate per accelerare la grafica 3D. Tuttavia, queste risorse programmabili non devono essere utilizzate per i giochi.

    Storicamente, le soluzioni grafiche integrate erano abilitate dalla logica nel Northbridge del chipset. Bloccato da gravi colli di bottiglia e latenze, a un certo punto è semplicemente diventato più difficile aumentare le prestazioni utilizzando componenti della piattaforma così lontani l’uno dall’altro. Di conseguenza, abbiamo visto che le funzionalità migrano verso nord nella CPU, creando una nuova generazione di prodotti in grado non solo di offrire prestazioni di gioco significativamente migliori, ma anche di affrontare attività più generiche che sfruttano la natura ibrida dei SoC con la CPU e funzionalità GPU. 

    Per AMD, questo segna il culmine a lungo ricercato dell’iniziativa Fusion dell’azienda, che presumibilmente è stata il motore dell’acquisizione di ATI Technologies da parte di AMD nel 2006. AMD ha visto il potenziale per le sue CPU e la tecnologia grafica di ATI di soppiantare le CPU pure in una quota di mercato sempre crescente e l’azienda era determinata a essere all’avanguardia in quella transizione. Intel, ovviamente, utilizza la propria tecnologia grafica interna, ma con un fine diverso. Decisamente, la sua enfasi è stata più concentrata sui suoi core di elaborazione e meno sulla tecnologia grafica.

    All’inizio del 2011 è arrivata la prima famiglia di APU AMD serie C ed E, prodotte con un processo a 40 nm. L’uso dell’integrazione ha consentito modelli a basso consumo da 9 e 18 W che sono stati inseriti nei notebook ultraportatili. Oggi abbiamo la famiglia di APU della serie A basata su Llano. L’uso della produzione a 32 nm consente di accumulare risorse sufficienti per una vera architettura di classe desktop a un prezzo orientato al valore.

    Sebbene ci siano una varietà di specifiche in gioco qui, forse il più grande elemento di differenziazione tra i modelli elencati di seguito sono i rispettivi motori grafici. L’A8 utilizza una configurazione che AMD chiama Radeon HD 6550D. È composto da 400 stream processor, core Radeon o shader, qualunque sia il nome che preferisci. L’A6 passa alla Radeon HD 6530, che vanta 320 stream processor. E l’A4 torna a una Radeon HD 6410D con 160 stream processor.

    Abbiamo già eseguito CPU e APU sotto i $ 200 attraverso una serie dei nostri benchmark di gioco preferiti, quindi sappiamo come i chip più recenti salgono o affondano nei titoli moderni. Ora vogliamo dare un’occhiata ad alcuni degli altri modi in cui gli appassionati sono in grado di sfruttare le risorse di calcolo, tuttavia, utilizzando carichi di lavoro che tassano i core CPU convenzionali e i processori programmabili che si trovano nei prodotti orientati alla grafica.

    In questa puntata iniziale di quella che sarà una serie in nove parti, stiamo esaminando al microscopio la post-elaborazione dei video. In passato, questo sarebbe stato un modello di utilizzo che richiedeva molto tempo, anche con una CPU multi-core sotto il cofano. Poiché si tratta di un carico di lavoro in gran parte parallelo, accelerarlo con i numerosi core di un processore grafico è diventato un ottimo modo per aumentare la produttività e migliorare le prestazioni.

    Abbiamo chiesto l’aiuto di AMD per mettere insieme questa serie, quindi ci concentreremo sull’hardware dell’azienda per creare alcuni confronti piuttosto basilari. Come funziona una CPU da sola in un software abilitato per OpenCL? Che ne dici di una delle APU basate su Llano da sola? Quindi abbineremo le APU più economiche e le CPU più costose a un paio di diverse schede discrete per tracciare il modo in cui le prestazioni aumentano e diminuiscono in ogni configurazione.

    0 0 votes
    Rating post
    Subscribe
    Notificami
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x