Lompat ke konten

Mod Permainan AMD Ryzen Threadripper 1950X, Ditanda Aras

    1645560003

    Menguji Subsistem Fabrik & Memori Infiniti Ryzen

    Kependaman Fabrik Infiniti Dan Lebar Jalur

    Palang silang Infinity Fabric 256-bit mengikat sumber di dalam die Zeppelin bersama-sama. Menekap pada Zeppelin die kedua untuk mencipta Threadripper memperkenalkan satu lagi lapisan fabrik, walaupun. Akses cache kekal setempat untuk setiap CCX, tetapi sejumlah besar memori, I/O dan trafik benang ke benang masih mengalir merentasi lapisan kedua itu.

    Penggemar tidak mengambil masa yang lama untuk mengetahui bahawa Fabrik Infinity AMD terikat pada domain frekuensi yang sama dengan pengawal memori, jadi overclock memori mengurangkan kependaman dan meningkatkan lebar jalur melalui palang silang. Prestasi dalam aplikasi sensitif kependaman (seperti permainan) seterusnya bertambah baik.

    Ujian Kecekapan Berbilang Teras Pemproses SiSoftware Sandra membantu kami menggambarkan prestasi Infinity Fabric. Kami menggunakan metrik Berbilang Benang dengan tetapan “padanan pasangan terbaik” (pendaman terendah). Utiliti mengukur masa ping antara benang untuk mengukur kependaman fabrik dalam setiap konfigurasi yang mungkin.

    Pengukuran kependaman intra-teras mewakili komunikasi antara dua utas logik yang bermastautin pada teras fizikal yang sama, dan seperti yang dapat kita lihat, melumpuhkan SMT menghapuskan pengukuran itu sepenuhnya. Untuk persediaan yang selebihnya, penalaan mengurangkan kependaman beberapa nanosaat. Tetapi ini disebabkan oleh kadar jam yang lebih tinggi. Seperti yang telah kita lihat pada masa lalu, peningkatan frekuensi memori mempunyai sedikit kesan pada kependaman intra-teras.

    Pengukuran Intra-CCX mengukur kependaman antara utas pada CCX yang sama yang tidak bermastautin pada teras yang sama. Meningkatkan kadar jam menghasilkan pengurangan kependaman ~6ns yang lebih besar.

    Cross-CCX mengukur kependaman antara utas yang terletak pada dua CCX yang berasingan, dan kami melihat pengurangan yang sama terima kasih kepada overclocking. Terutamanya, Ryzen 7 1800X menampilkan kependaman Cross-CCX yang jauh lebih rendah daripada Threadripper stok dan kebanyakan konfigurasi overclocked. Ini mungkin disebabkan oleh beberapa bentuk peruntukan, mungkin dalam algoritma penjadualan, untuk lapisan fabrik tambahan Threadripper.

    Seperti yang dapat kita lihat, CPU Threadripper overclocked dalam mod Permainan, yang tidak mempunyai pautan fabrik aktif ke die yang lain, mempunyai kependaman Cross-CCX yang paling rendah.

    Die-To-Die mengukur komunikasi antara dua mati Zeppelin yang berasingan. Mod permainan secara berkesan melumpuhkan mati Zeppelin kedua pada tahap sistem pengendalian, menghapuskan kependaman mati-untuk-mati sepenuhnya. Uncore die kedua masih aktif, yang diperlukan untuk memastikan pengawal I/O dan memori masih boleh diakses.

    Mod pencipta mengalami kependaman mati-ke-mati yang paling teruk, tetapi penalaan mengurangkannya dengan ketara. Kedua-dua pilihan SMT (hidup dan mati) menerima pengurangan besar daripada usaha overclocking kami juga.

    Utiliti mengukur lebar jalur fabrik juga, yang penting untuk prestasi kerana pengambilan data dari memori jauh juga mengalir merentasi fabrik. Oleh yang demikian, AMD terlalu memperuntukkan fabrik dan subsistem memori untuk mengoptimumkan seni bina memori yang diedarkan.

    Kedua-dua mod Pencipta dan konfigurasi Setempat/SMT menawarkan lebar jalur fabrik terbaik, menikmati peningkatan besar daripada overclocking. Ryzen 7 1800X berada di tengah-tengah carta bersama mod Permainan Threadripper, yang logik memandangkan kedua-duanya adalah pemproses 8C/16T yang berkesan. Melumpuhkan SMT tetapi membiarkan kedua-dua dies aktif (Tempatan/SMT dimatikan) menghasilkan profil unik yang memberikan prestasi yang lebih tinggi dengan akses yang lebih besar dan prestasi yang lebih rendah dengan akses yang lebih kecil.

    Cache Dan Kependaman Memori

    Kami menguji dengan memori DDR4-2666 pada tetapan stok dan meningkat kepada DDR4-3200 untuk konfigurasi overclocked kami.

    Penampan Terjemahan Look Aside ialah cache yang mengurangkan masa capaian dengan menyimpan alamat memori yang diakses baru-baru ini. Seperti semua cache, TLB mempunyai kapasiti terhad, jadi alamat permintaan yang mendarat di TLB adalah “hits”, manakala permintaan yang mendarat di luar cache adalah “miss”. Sudah tentu, hits adalah lebih diingini, dan prestasi prefetcher yang kukuh menghasilkan kadar hit yang lebih tinggi.

    Corak capaian berjujukan hampir dipraambil sepenuhnya ke dalam TLB, jadi ujian berjujukan ialah ukuran prestasi prefetcher yang baik. Ujian rawak dalam halaman mengukur akses rawak dalam halaman memori yang sama. Ia juga mengukur prestasi TLB dan mewakili prestasi rawak kes terbaik (ini ialah ukuran yang digunakan oleh vendor untuk helaian spesifikasi rasmi). Ujian rawak penuh menampilkan gabungan pukulan dan tersasar TLB, dengan kemungkinan tersasar yang tinggi, jadi ia mengukur kependaman kes terburuk.

    Tanpa mengira corak capaian memori, ketulan data terkecil sesuai dengan cache L1. Dan apabila saiz data bertambah, ia mengisi cache yang lebih besar.

    L1L2L3Memori Utama

    Julat
    2KB – 32KB
    32KB – 512KB
    512KB – 8MB
    8MB – 1GB

    Threadripper 1950X menampilkan kependaman L2 dan L3 yang lebih baik daripada Ryzen 7 1800X dengan setiap jenis corak akses. Selain itu, kami melihat pengurangan kependaman yang ketara melalui overclocking untuk cache L1, L2, dan L3 Threadripper.

    Itu berubah apabila beban kerja mengalir keluar ke memori utama. Mod Pencipta Threadripper (tetapan lalai) mempunyai kependaman tertinggi dengan setiap corak akses. Ini adalah hasil langsung daripada akses memori yang mendarat dalam memori jauh. Pengukuran dalam halaman kami mencerminkan spesifikasi 86.9ns AMD, tetapi akses rawak penuh kes terburuk melebihi 120ns. Overclocking pemproses dan memori merendahkan kependaman, tetapi mod Pencipta masih tidak mengatasi mana-mana konfigurasi yang kami bandingkan dengannya. 

    Beralih ke mod NUMA dengan tetapan Setempat meningkatkan akses memori utama secara mendadak untuk konfigurasi lain. Kami mengukur ~60ns untuk akses memori dekat dalam halaman, sekali lagi selaras dengan spesifikasi AMD, manakala kependaman kes terburuk ialah 100ns.

    Lebar Jalur Cache

    Setiap CCX mempunyai cache sendiri, jadi CPU Threadripper menampilkan empat kelompok memori L1, L2 dan L3 yang berbeza. Penanda aras lebar jalur kami menggambarkan prestasi agregat peringkat ini. 

    Semasa ujian satu-benang, Ryzen 7 1800X menunjukkan daya pemprosesan yang lebih rendah daripada pemproses Threadripper. Konfigurasi lain berkumpul bersama dalam stok biasa dan kumpulan overclocked.

    Ujian berbilang benang lebih menarik; kita lihat Ryzen 7 1800X dan dua mod Permainan Threadripper jatuh ke bahagian bawah carta. Oleh kerana mod Permainan melumpuhkan teras pada satu dadu, ia secara berkesan mengeluarkan cache yang sepadan daripada komisen.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x