コンテンツへスキップ

OpenCLの動作:後処理アプリ、高速化

    1652144343

    ヘテロジニアスコンピューティングは本当に何を約束しますか?

    CPUの時代を超えたと宣言する準備ができている人は誰もいません。結局のところ、ザイリンクスのような企業は、最新の中央処理装置よりも機能的に統合されておらず、多目的であるアプリケーション固有のプログラマブルロジックデバイスを販売しています。場合によっては、単純な方が効果的です。特殊なプロセッサは、特に多くのパフォーマンスが最大の関心事である特定の市場セグメントで引き続き成功を収める可能性があります。しかし、ますます多様化する主流環境では、単一の統合デバイスに多くの種類の計算リソースが詰め込まれているヘテロジニアスコンピューティングの人気が高まると予想されます。そして、デバイスを製造するにつれて、これらのデバイスもより複雑になります。

    ヘテロジニアスコンピューティングの論理的なエンドゲームは、システムオンチップ(SoC)であり、すべての(または少なくとも多くの)主要な回路システムが1つのパッケージに統合されています。一例として、AMDのGeodeチップ(現在、One Laptop Per Childプロジェクトに電力を供給している)は、1990年代のSoC設計から進化しました。多くのSoC製品は、最新の主流のデスクトップPCに燃料を供給するための馬力をまだ欠いていますが、AMDとIntelはどちらも、CPUコア、グラフィックスリソース、およびメモリ制御を組み合わせたアーキテクチャを販売しています。これらの高速処理ユニット(APU)は、AMDが呼んでいるように、一般的な生産性指向のワークステーションに期待されるパフォーマンスレベルを満たし、さらには超えています。最も注目すべきは、3Dグラフィックスを高速化するために通常使用される多くのALUで、使い慣れたプロセッサ設計を補完することです。ただし、これらのプログラム可能なリソースをゲームに使用する必要はありません。

    歴史的に、オンボードグラフィックスソリューションは、チップセットのノースブリッジのロジックによって実現されていました。深刻なボトルネックと遅延に悩まされていたある時点で、プラットフォームコンポーネントを互いに遠く離れた場所で使用してパフォーマンスをスケールアップすることがより困難になりました。その結果、機能がCPUに移行し、大幅に優れたゲームパフォーマンスを提供するだけでなく、CPUとSoCのハイブリッドな性質を活用するより汎用的なタスクに取り組むことができる新しい種類の製品を作成することがわかりました。およびGPU機能。 

    AMDにとって、これは同社のFusionイニシアチブの長年の集大成であり、おそらくAMDによる2006年のATITechnologiesの買収の背後にある原動力でした。AMDは、CPUとATIのグラフィックステクノロジーが純粋なCPUに取って代わる可能性を見出し、市場でのシェアを拡大​​し続けており、同社はその移行の先駆者となることを決意しました。もちろん、Intelは独自の社内グラフィックステクノロジーを採用していますが、目的は異なります。明らかに、その重点は、グラフィックステクノロジーではなく、処理コアに重点が置かれています。

    2011年の初めに、40nmプロセスで製造されたAMDCおよびEシリーズAPUの最初のファミリーが登場しました。統合を使用することで、ウルトラポータブルノートブックに搭載された低電力の9および18Wモデルが可能になりました。現在、LlanoベースのAシリーズAPUファミリがあります。32 nmの製造を使用すると、真のデスクトップクラスのアーキテクチャに十分なリソースを価値志向の価格で詰め込むことができます。

    ここではさまざまな仕様が使用されていますが、以下にリストされているモデルの最大の差別化要因は、それぞれのグラフィックエンジンです。A8は、AMDがRadeonHD6550Dと呼ぶ構成を採用しています。400のストリームプロセッサ、Radeonコア、またはシェーダーのいずれかを使用する名前で構成されています。A6は、320のストリームプロセッサを搭載したRadeonHD6530にステップダウンします。また、A4は160ストリームプロセッサを搭載したRadeonHD6410Dにスケールバックします。

    私たちはすでに200ドル未満のCPUとAPUをいくつかのお気に入りのゲームベンチマークで実行しているので、最新のチップが現代のタイトルでどのように急上昇または沈下するかを知っています。ここで、従来のCPUコアとグラフィックス指向の製品に見られるプログラム可能なプロセッサに負担をかけるワークロードを使用して、愛好家がコンピューティングリソースを活用できる他の方法のいくつかを見ていきたいと思います。

    9部構成のシリーズのこの最初の記事では、ビデオの後処理を顕微鏡下に置きます。当時は、マルチコアCPUが内部にある場合でも、これは時間のかかる使用モデルでした。ただし、これはほぼ並列のワークロードであるため、グラフィックプロセッサの多くのコアを使用して高速化することは、生産性を向上させ、パフォーマンスを向上させるための優れた方法になりました。

    このシリーズをまとめるのにAMDの助けを借りたので、会社のハードウェアに焦点を当てて、かなり基本的な比較を作成します。OpenCL対応ソフトウェアでCPU自体はどのように機能しますか?LlanoベースのAPUの1つはどうですか?次に、より安価なAPUとより高価なCPUを、いくつかの異なるディスクリートカードと照合して、各構成でパフォーマンスがどのようにスケールアップおよびスケールダウンするかをグラフ化します。

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x