Aller au contenu

OpenCL en action : applications de post-traitement accélérées

    1652144343

    Que promet vraiment l’informatique hétérogène ?

    Personne n’est prêt à déclarer l’âge des processeurs terminé. Après tout, des entreprises comme Xilinx vendent encore des dispositifs logiques programmables spécifiques à l’application qui sont beaucoup moins intégrés fonctionnellement et polyvalents que les unités centrales de traitement modernes. Parfois, plus simple est plus efficace. Il est probable que les processeurs spécialisés continueront de connaître du succès dans certains segments de marché, en particulier là où les performances sont la principale préoccupation. Cependant, dans une gamme de plus en plus diversifiée d’environnements grand public, nous nous attendons à ce que l’informatique hétérogène (ayant de nombreux types de ressources de calcul regroupées sur un seul appareil intégré) continue de gagner en popularité. Et en tant que dispositifs de fabrication, ces dispositifs deviendront également plus complexes.

    La fin de partie logique de l’informatique hétérogène est un système sur puce (SoC), dans lequel tous (ou au moins plusieurs) systèmes de circuits majeurs sont intégrés dans un seul boîtier. Par exemple, les puces Geode d’AMD (alimentant actuellement le projet One Laptop Per Child) ont évolué à partir des conceptions SoC des années 1990. Alors que de nombreux produits SoC manquent encore de puissance pour alimenter un ordinateur de bureau moderne et grand public, AMD et Intel vendent des architectures qui combinent des cœurs de processeur, des ressources graphiques et un contrôle de la mémoire. Ces unités de traitement accéléré (APU), comme les appelle AMD, atteignent et même dépassent les niveaux de performances attendus des stations de travail typiques axées sur la productivité. Plus particulièrement, ils complètent les conceptions de processeurs familières avec de très nombreuses ALU généralement utilisées pour accélérer les graphiques 3D. Ces ressources programmables ne doivent cependant pas être utilisées pour les jeux.

    Historiquement, les solutions graphiques embarquées étaient activées par la logique du northbridge du chipset. Paralysé par de graves goulots d’étranglement et des latences, à un certain moment, il est simplement devenu plus difficile d’augmenter les performances en utilisant des composants de plate-forme si éloignés les uns des autres. En conséquence, nous avons vu que les fonctionnalités migrent vers le nord dans le CPU, créant une nouvelle génération de produits capables non seulement d’offrir des performances de jeu nettement meilleures, mais également de s’attaquer à des tâches plus générales qui tirent parti de la nature hybride des SoC avec le CPU. et la fonctionnalité GPU. 

    Pour AMD, cela marque l’aboutissement tant attendu de l’initiative Fusion de l’entreprise, qui a probablement été le moteur de l’acquisition d’ATI Technologies par AMD en 2006. AMD a vu le potentiel de ses processeurs et de la technologie graphique d’ATI pour supplanter les processeurs purs dans une part toujours croissante du marché, et la société était déterminée à être à l’avant-garde de cette transition. Intel, bien sûr, utilise sa propre technologie graphique interne, mais à une fin différente. Décidément, son accent a été davantage porté sur ses cœurs de traitement et moins sur la technologie graphique.

    Début 2011, la première famille d’APU AMD des séries C et E est arrivée, fabriquée selon un processus de 40 nm. L’utilisation de l’intégration a permis des modèles basse consommation de 9 et 18 W qui sont entrés dans des ordinateurs portables ultra-portables. Aujourd’hui, nous avons la famille APU de la série A basée sur Llano. L’utilisation de la fabrication en 32 nm permet d’entasser suffisamment de ressources pour une véritable architecture de bureau à un prix axé sur la valeur.

    Bien qu’il existe une variété de spécifications en jeu ici, le plus grand différenciateur parmi les modèles répertoriés ci-dessous est peut-être leurs moteurs graphiques respectifs. L’A8 utilise une configuration qu’AMD appelle Radeon HD 6550D. Il se compose de 400 processeurs de flux, cœurs Radeon ou shaders, quel que soit le nom que vous souhaitez utiliser. L’A6 passe à la Radeon HD 6530, dotée de 320 processeurs de flux. Et l’A4 revient à une Radeon HD 6410D avec 160 processeurs de flux.

    Nous avons déjà exécuté des processeurs et des APU à moins de 200 $ via un certain nombre de nos références de jeu préférées, nous savons donc comment les dernières puces montent ou coulent dans les titres modernes. Nous voulons maintenant examiner certaines des autres façons dont les passionnés peuvent tirer parti des ressources de calcul, en utilisant des charges de travail qui taxent les cœurs de processeur conventionnels et les processeurs programmables que l’on trouve dans les produits orientés graphiques.

    Dans ce premier épisode de ce qui sera une série en neuf parties, nous examinons le post-traitement vidéo sous le microscope. À l’époque, cela aurait été un modèle d’utilisation chronophage, même avec un processeur multicœur sous le capot. Cependant, comme il s’agit d’une charge de travail largement parallèle, l’accélérer avec les nombreux cœurs d’un processeur graphique est devenu un excellent moyen d’augmenter la productivité et d’améliorer les performances.

    Nous avons demandé l’aide d’AMD pour assembler cette série, nous allons donc nous concentrer sur le matériel de l’entreprise pour créer des comparaisons assez basiques. Comment un processeur fonctionne-t-il seul dans un logiciel compatible OpenCL ? Que diriez-vous de l’un des APU basés sur Llano ? Ensuite, nous associerons les APU les moins chers et les processeurs les plus chers à quelques cartes discrètes différentes pour déterminer comment les performances augmentent et diminuent dans chaque configuration.

    0 0 votes
    Rating post
    S’abonner
    Notification pour
    guest
    0 comments
    Commentaires en ligne
    Afficher tous les commentaires
    0
    Nous aimerions avoir votre avis, veuillez laisser un commentaire.x