Lompat ke konten

Kajian AMD Radeon RX 480 8GB

    1650103202

    Temui Polaris 10

    Enam bulan lalu, AMD mula mengusik ciri yang akan ditawarkan oleh GPU generasi seterusnya, bermula dengan pengawal paparan yang dirombak untuk menyokong HDMI 2.0b dan DisplayPort 1.3 HBR3, FreeSync melalui HDMI dan saluran paip berkemampuan HDR. Potongan-potongan lain muncul dalam minggu-minggu berikutnya, menunjuk kepada pelancaran yang akan menyertakan dua GPU berbeza yang sengaja dibina untuk menuntut semula bahagian pasaran dalam pasaran desktop arus perdana dan mempersembahkan penyelesaian mudah alih yang menawarkan prestasi kelas konsol dalam faktor bentuk nipis dan ringan.

    Reka bentuk terakhir itu termasuk 16 Unit Pengiraan AMD yang dipadankan dengan bas memori 128-bit dan pecutan pengekodan/nyahkod video 4K. Ia masih akan datang. Radeon RX 480 yang kami miliki hari ini adalah berdasarkan reka bentuk Polaris 10 yang lebih besar. Tetapi ia tidak besar dalam erti kata bahawa pemproses GP100 15.3 bilion-transistor Nvidia adalah besar. Sebaliknya, GPU cukup kompleks untuk memacu set kepala realiti maya terkini, meletakkannya sekurang-kurangnya dalam liga AMD Radeon R9 290 dan GeForce GTX 970 Nvidia.

    Prestasi jarak pertengahan tidak akan menjejaskan stoking sesiapa sahaja, terutamanya sebulan selepas GP104 mentakrifkan semula model mewah itu. Tetapi dengan meletakkan harga Radeon RX 480 jauh di bawah papan pantas yang sama dan mengehadkan penggunaan kuasa kepada 150W, AMD berharap untuk menjadikan VR boleh diakses oleh lebih ramai pemain (jika hanya syarikat yang menjual $600 dan $800 HMD akan bermain bersama).

    Kami menjangkakan dua versi Radeon RX 480: model $200 dengan 4GB GDDR5 on-board yang beroperasi pada 7 Gb/s dan versi $240 dengan 8GB 8 Gb/s GDDR5. Sememangnya, kami mempunyai 8GB di tangan.

    Di dalam Polaris 10

    Polaris 10 terdiri daripada 5.7 bilion transistor pada dadu 230mm². Bandingkan dengan 6.2 bilion transistor Hawaii pada dadu 438mm². Seperti yang anda akan lihat di seluruh halaman penanda aras kami, RX 480 biasanya mendarat di suatu tempat antara R9 290 dan 390…dengan lebih sedikit transistor dan kira-kira 55% daripada belanjawan kuasa. Sebahagian besar daripada itu secara semula jadi dikaitkan dengan proses FinFET 14nm GlobalFoundries, yang dikreditkan oleh AMD untuk menyampaikan prestasi asas dan faedah kuasa ke atas transistor satah nod 28nm. Pada mana-mana tahap kuasa tertentu, FinFET mendayakan jam yang lebih tinggi. Pada frekuensi yang dipilih, peranti 14nm menggunakan kurang kuasa. Untuk Polaris, AMD merebut dari kedua-dua tong untuk menaikkan kadar jam dan mengurangkan penggunaan. Begitulah caranya ia dapat mengatasi lebih banyak GPU yang kaya sumber seperti Hawaii pada siling 150W (walaupun ukuran kami menunjukkan RX 480 fudges sedikit pada TDPnya).

    Walaupun dengan nama kod baharu, Polaris 10 adalah berdasarkan pelaksanaan generasi keempat seni bina AMD Graphics Core Next. Dengan mengambil kira perkara ini, kebanyakan peminat yang sudah biasa dengan GCN akan mengenali blok binaan reka bentuk Polaris, menjadikan langkah kami dalam reka bentuk agak mudah.

    Spesifikasi

    AMD Radeon RX 480

    AMD Radeon R9 390

    AMD Radeon R9 290

    Satu Pemproses Perintah Grafik di hadapan masih bertanggungjawab untuk menghantar baris gilir grafik ke Enjin Shader. Begitu juga Enjin Pengiraan Asynchronous yang ditugaskan untuk mengendalikan baris gilir pengiraan. Hanya sekarang AMD mengatakan logik pemprosesan arahannya terdiri daripada empat ACE dan bukannya lapan, dengan dua unit Penjadual Perkakasan disediakan untuk baris gilir yang diutamakan, pengurusan sumber temporal/spatial dan pemunggahan tugas penjadualan pemacu mod kernel CPU. Ini bukan blok berasingan atau baharu semata-mata, sebaliknya merupakan mod pilihan saluran paip sedia ada boleh dijalankan. Dave Nalasco, pengurus teknologi kanan untuk grafik di AMD, membantu menjelaskan tujuan mereka:

    “HWS (Kumpulan Kerja Perkakasan/Penjadual Wavefront) pada asasnya ialah saluran paip ACE yang dikonfigurasikan tanpa pengawal penghantaran. Tugas mereka adalah untuk memunggah CPU dengan mengendalikan penjadualan baris gilir pengguna/pemandu pada slot baris gilir perkakasan yang tersedia. Mereka adalah pemproses boleh atur cara mikrokod yang boleh melaksanakan pelbagai dasar penjadualan. Kami menggunakannya untuk melaksanakan baris Gilir Respons Pantas dan ciri Tempahan CU dalam Polaris, dan kami dapat mengalihkan perubahan tersebut kepada produk GCN generasi ketiga dengan kemas kini pemacu.”

    Baris Gilir Respons Pantas membolehkan pembangun mengutamakan tugas tertentu yang dijalankan secara tidak segerak tanpa mendahului proses lain sepenuhnya. Sekiranya anda terlepas catatan blog Dave tentang ciri ini, anda boleh menyemaknya di sini. Pendek kata, fleksibiliti adalah perkara yang ingin dipacu oleh AMD. Seni binanya membolehkan pelbagai pendekatan untuk meningkatkan penggunaan dan meminimumkan kependaman, kedua-duanya sangat penting dalam aplikasi seperti VR.

    Unit Pengiraan yang kami kenali dengan baik terdiri daripada 64 pelorek yang mematuhi IEEE 754-2008 dipecah antara empat unit vektor, unit skalar dan 16 unit beban/simpan pengambilan tekstur. Setiap CU juga menempatkan empat unit tekstur, 16KB cache L1, bahagian data tempatan 64KB dan ruang daftar untuk vektor dan unit skalar. AMD berkata ia membuat beberapa tweak untuk meningkatkan kecekapan CU, termasuk penambahan sokongan FP16 (dan Int16) asli, akses cache yang ditala dan prefetching arahan yang lebih baik. Secara keseluruhannya, perubahan itu dikatakan menghasilkan sehingga 15% lebih prestasi setiap CU berbanding GPU Hawaii Radeon R9 290, yang berdasarkan seni bina GCN generasi kedua.

    Sembilan CU disusun menjadi Enjin Shader, dan Polaris 10 menawarkan empat SE sedemikian, selaras dengan apa yang kita ketahui sebagai maksimum seni bina. Matematik (64 shader * sembilan CU * empat SE) menambah sehingga 2304 pemproses Strim dan 144 unit tekstur.

    Setiap Enjin Shader dikaitkan dengan Enjin Geometri, yang menurut AMD ia bertambah baik dengan menambahkan pemecut buang primitif untuk melontar mana-mana primitif yang tidak akan rasterize kepada piksel sebelum penukaran imbasan, sekali gus meningkatkan daya pemprosesan. Ini ialah fungsi automatik peringkat pra-rasterisasi saluran paip grafik, dan baharu sepenuhnya kepada Polaris. Terdapat juga cache indeks untuk geometri contoh, walaupun kami tidak pasti berapa besar ini, atau betapa ketara kesannya apabila contoh digunakan.

    Sama seperti Hawaii, Polaris 10 mampu menghasilkan sehingga empat primitif setiap kitaran jam. Tetapi manakala GPU berasaskan Hawaii/Grenada terpantas berjalan sehingga 1050MHz (dalam kes R9 390X), AMD menolak Radeon RX 480 kepada kadar jam asas 1120MHz dan penarafan “boost” sebanyak 1266MHz, mengimbangi sebahagian daripada apa yang ia kalah dalam sumber on-die menggunakan frekuensi yang lebih tinggi. Manakala Radeon R9 290X menawarkan 5.6 TFLOPS prestasi titik terapung ketepatan tunggal, RX 480 mencapai sehingga 5.8 TFLOPS menggunakan spesifikasi “rangsangan” itu.

    Betapa realistiknya nombor 1266MHz itu? Hawaii mempunyai isu besar yang nyata mengekalkan spesifikasi kadar jam AMD apabila ia menjadi panas, dan kami ingin memastikan tingkah laku yang sama tidak menjejaskan Polaris. Menggunakan Metro: Penanda aras terbina dalam Last Light Redux bergelung 10 kali, kami merekodkan frekuensi menggunakan GPU-Z dan mendapat graf berikut:

    Terdapat tepat 148MHz antara titik terendah dan tertinggi pada carta baris ini. Lantainya ialah 1118MHz dan silingnya ialah 1265MHz. Kami akan mengatakan AMD memakukan asasnya dan meningkatkan penilaian hampir tepat, walaupun jika apa yang berlaku di antaranya tertakluk kepada pelarasan berterusan. Sekurang-kurangnya purata 1208MHz lebih dekat ke bahagian atas daripada bahagian bawah.

    Hawaii dan Fiji SE mempunyai empat bahagian belakang pemaparan setiap satu, berkeupayaan 16 piksel setiap jam (atau 64 merentasi GPU). Polaris 10 memotong angka itu separuh. Dua hujung belakang render bagi setiap SE, setiap satu dengan empat ROP, berjumlah 32 piksel setiap jam. Ini adalah pengurangan yang ketara berbanding Radeon R9 290 AMD yang berpangkalan di Hawaii yang perlu dikalahkan dengan RX 480. Untuk menambah masalah, Polaris 10 menggunakan bas memori 256-bit—jauh lebih sempit daripada laluan agregat 512-bit Hawaii. Versi 4GB Radeon RX 480 akan termasuk 7 Gb/s GDDR5, mendayakan 224 GB/s lebar jalur, manakala model 8GB yang kami uji hari ini menggunakan memori 8 Gb/s, meningkatkan daya pemprosesan kepada 256 GB/s. Namun, itu jauh lebih rendah daripada 320 GB/s R9 290.

    Sebahagian daripada defisit diimbangi dengan pemampatan warna delta yang lebih baik, yang mengurangkan jumlah maklumat yang dipindahkan ke seluruh bas. AMD kini menyokong nisbah tanpa kehilangan 2/4/8:1, serupa dengan seni bina Pascal Nvidia. Polaris 10 juga mendapat manfaat daripada cache L2 2MB yang lebih besar yang pertama kali dilihat di Fiji. Ini boleh membantu mendail kembali perjalanan ke GDDR5, seterusnya mengurangkan pergantungan GPU pada bas yang luas dan kadar data yang tinggi.

    Namun, menyandarkan bahagian belakang GPU mesti mempunyai kesan ke atas prestasi apabila resolusi dan penggunaan anti-aliasing meningkat. Ingin tahu tentang cara Polaris dibandingkan dengan Hawaii apabila beban kerja semakin meningkat, kami melancarkan Grand Theft Auto V pada 1920×1080 sederhana dengan tetapan perincian Sangat Tinggi, kemudian mula meningkatkan anti-aliasing.

    Sudah tentu, anda boleh melihat Radeon RX 480 berdarah daripada kadar bingkai purata jauh lebih cepat daripada R9 390 kerana MSAA ditogol daripada Mati kepada 2x kepada 4x. Dengan AA dilumpuhkan, 480 mencapai 97.3 FPS kepada 90.4 390. Tetapi pada akhirnya, Radeon RX 480 AMD turun kepada 57.5 bingkai sesaat manakala 390 purata 62.9.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x