Lompat ke konten

OpenCL In Action: Apl Pasca Pemprosesan, Dipercepat

    1652144343

    Apakah yang Dijanjikan Pengkomputeran Heterogen?

    Tiada siapa yang bersedia untuk mengisytiharkan umur CPU tamat. Lagipun, syarikat seperti Xilinx masih menjual peranti logik boleh atur cara khusus aplikasi yang jauh kurang bersepadu dari segi fungsi dan pelbagai guna berbanding unit pemprosesan pusat moden. Kadang-kadang, lebih mudah adalah lebih berkesan. Kemungkinan besar pemproses khusus akan terus menikmati kejayaan dalam segmen pasaran tertentu, terutamanya di mana banyak prestasi menjadi perhatian utama. Walau bagaimanapun, dalam julat persekitaran arus perdana yang semakin pelbagai, kami menjangkakan pengkomputeran heterogen—mempunyai pelbagai jenis sumber pengiraan yang dibungkus pada satu peranti bersepadu—akan terus menjadi lebih popular. Dan sebagai peranti pembuatan, peranti ini akan menjadi lebih kompleks juga.

    Permainan akhir logik pengkomputeran heterogen ialah sistem-pada-cip (SoC), di mana semua (atau sekurang-kurangnya banyak) sistem litar utama disepadukan ke dalam satu pakej. Sebagai contoh, cip Geode AMD (kini menjanakan projek One Laptop Per Child) telah berkembang daripada reka bentuk SoC era 1990-an. Walaupun banyak produk SoC masih kekurangan kuasa kuda untuk memacu PC desktop arus perdana yang moden, kedua-dua AMD dan Intel menjual seni bina yang menggabungkan teras CPU, sumber grafik dan kawalan memori. Unit pemprosesan dipercepat (APU) ini, seperti yang dipanggil AMD, memenuhi dan bahkan melebihi tahap prestasi yang dijangkakan daripada stesen kerja berorientasikan produktiviti biasa. Terutama sekali, mereka melengkapkan reka bentuk pemproses yang biasa dengan banyak, banyak ALU yang biasanya digunakan untuk mempercepatkan grafik 3D. Sumber boleh atur cara ini tidak perlu digunakan untuk permainan, walaupun.

    Dari segi sejarah, penyelesaian grafik on-board didayakan oleh logik dalam northbridge chipset. Diganggu oleh kesesakan dan kependaman yang teruk, pada satu ketika ia menjadi lebih sukar untuk meningkatkan prestasi menggunakan komponen platform yang berjauhan antara satu sama lain. Hasilnya, kami telah melihat bahawa kefungsian berhijrah ke utara ke dalam CPU, mencipta satu jenis produk baharu yang bukan sahaja mampu menawarkan prestasi permainan yang jauh lebih baik, tetapi juga untuk menangani lebih banyak tugas tujuan umum yang memanfaatkan sifat hibrid SoC dengan CPU. dan kefungsian GPU. 

    Bagi AMD, ini menandakan kemuncak inisiatif Fusion syarikat yang telah lama dicari, yang mungkin merupakan pemacu di sebalik pengambilalihan ATI Technologies oleh AMD pada 2006. AMD melihat potensi untuk CPU dan teknologi grafik ATI untuk menggantikan CPU tulen dalam bahagian pasaran yang semakin meningkat, dan syarikat itu berazam untuk berada di barisan hadapan peralihan itu. Intel, sudah tentu, menggunakan teknologi grafik dalaman sendiri, tetapi untuk tujuan yang berbeza. Sudah tentu, penekanannya lebih tertumpu pada teras pemprosesannya dan kurang pada teknologi grafik.

    Awal 2011 menyaksikan keluarga pertama AMD C- dan APU siri E tiba, dihasilkan pada proses 40 nm. Penggunaan penyepaduan mendayakan model 9 dan 18 W berkuasa rendah yang dimasukkan ke dalam komputer riba ultra mudah alih. Hari ini, kami mempunyai keluarga APU siri A berasaskan Llano. Penggunaan pembuatan 32 nm memungkinkan untuk menjejalkan sumber yang mencukupi untuk seni bina kelas desktop sebenar pada titik harga berorientasikan nilai.

    Walaupun terdapat pelbagai spesifikasi yang dimainkan di sini, mungkin pembezaan terbesar antara model yang disenaraikan di bawah ialah enjin grafik masing-masing. A8 menggunakan konfigurasi yang AMD rujuk sebagai Radeon HD 6550D. Ia terdiri daripada 400 pemproses strim, teras Radeon atau shader, mana-mana nama yang anda suka gunakan. A6 turun ke Radeon HD 6530, dengan 320 pemproses aliran. Dan skala A4 kembali kepada Radeon HD 6410D dengan pemproses strim 160.

    Kami telah pun menjalankan CPU dan APU di bawah $200 melalui beberapa penanda aras permainan kegemaran kami, jadi kami tahu cara cip terkini melonjak atau tenggelam dalam tajuk moden. Sekarang kita ingin melihat beberapa cara lain yang peminat boleh memanfaatkan sumber pengiraan, walaupun, menggunakan beban kerja yang mengenakan cukai kepada teras CPU konvensional dan pemproses boleh atur cara yang terdapat dalam produk berorientasikan grafik.

    Dalam ansuran awal siri sembilan bahagian ini, kami meletakkan pemprosesan pasca video di bawah mikroskop. Pada zaman dahulu, ini akan menjadi model penggunaan yang memakan masa, walaupun dengan CPU berbilang teras di bawah hud. Oleh kerana ia adalah beban kerja yang selari, namun, mempercepatkannya dengan banyak teras pemproses grafik telah menjadi cara terbaik untuk meningkatkan produktiviti dan meningkatkan prestasi.

    Kami meminta bantuan AMD dalam menyusun siri ini, jadi kami akan menumpukan pada perkakasan syarikat untuk mencipta beberapa perbandingan yang cukup asas. Bagaimanakah CPU sendiri berfungsi dalam perisian berdaya OpenCL? Bagaimana pula dengan salah satu APU berasaskan Llano sendiri? Kemudian kami akan memadankan APU yang lebih murah dan CPU yang lebih mahal sehingga beberapa kad diskret yang berbeza untuk mencatatkan cara prestasi meningkat dan turun merentas setiap konfigurasi.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x