İçeriğe geç

AMD Ryzen Threadripper 1950X Oyun Modu, Karşılaştırmalı

    1645560003

    Ryzen’in Infinity Fabric ve Bellek Alt Sistemini Test Etme

    Infinity Fabric Gecikmesi ve Bant Genişliği

    256-bit Infinity Fabric çapraz çubuğu, bir Zeppelin kalıbının içindeki kaynakları birbirine bağlar. Threadripper’ı oluşturmak için ikinci bir Zeppelin kalıbını tutturmak, kumaşın başka bir katmanını tanıtıyor. Önbellek erişimleri her CCX için yerel kalır, ancak büyük miktarda bellek, G/Ç ve iş parçacığından iş parçacığına trafik bu ikinci katman boyunca akmaya devam eder.

    Meraklıların AMD’nin Infinity Fabric’inin bellek denetleyicisi ile aynı frekans alanına bağlı olduğunu anlamaları uzun sürmedi, bu nedenle bellek hız aşırtması gecikmeyi azaltır ve çapraz çubuk boyunca bant genişliğini artırır. Sonuç olarak gecikmeye duyarlı uygulamalardaki (oyunlar gibi) performans artar.

    SiSoftware Sandra’nın İşlemci Çok Çekirdekli Verimlilik testi, Infinity Fabric’in performansını göstermemize yardımcı olur. “En iyi çift eşleşme” ayarıyla (en düşük gecikme süresi) Çok İş parçacıklı metriği kullanıyoruz. Yardımcı program, olası her yapılandırmada yapı gecikmesini ölçmek için iş parçacıkları arasındaki ping sürelerini ölçer.

    Çekirdek içi gecikme ölçümleri, aynı fiziksel çekirdekte bulunan iki mantıksal iş parçacığı arasındaki iletişimi temsil eder ve gördüğümüz gibi, SMT’yi devre dışı bırakmak bu ölçümü tamamen ortadan kaldırır. Kalan kurulumlar için ayarlama, gecikmeyi birkaç nanosaniye azaltır. Ancak bu, daha yüksek saat hızlarına bağlanabilir. Geçmişte gördüğümüz gibi, artan bellek frekanslarının çekirdek içi gecikme üzerinde çok az etkisi vardır.

    CCX içi ölçümler, aynı çekirdekte yerleşik olmayan aynı CCX üzerindeki iş parçacıkları arasındaki gecikmeyi ölçer. Saat hızını artırmak, ~6ns gecikme süresinde daha büyük azalmalar sağlar.

    Cross-CCX, iki ayrı CCX’te bulunan iş parçacıkları arasındaki gecikmeyi ölçer ve hız aşırtma sayesinde benzer bir azalma görüyoruz. Özellikle Ryzen 7 1800X, stok Threadripper’dan ve çoğu hız aşırtmalı konfigürasyondan çok daha düşük Cross-CCX gecikmesine sahiptir. Bu, muhtemelen Threadripper’ın ekstra kumaş katmanı için muhtemelen zamanlama algoritmalarında bulunan bir tür provizyondan kaynaklanmaktadır.

    Gördüğümüz gibi, Oyun modunda diğer kalıba aktif bir yapı bağlantısı olmayan hız aşırtmalı Threadripper CPU, en düşük Cross-CCX gecikmesine sahip.

    Die-To-Die, iki ayrı Zeppelin kalıbı arasındaki iletişimi ölçer. Oyun modu, ikinci Zeppelin kalıbını işletim sistemi düzeyinde etkin bir şekilde devre dışı bırakarak, kalıplar arası gecikmeyi tamamen ortadan kaldırır. İkinci kalıbın çekirdeksiz kısmı hala aktif, bu da G/Ç ve bellek kontrolörlerinin hala erişilebilir olmasını sağlamak için gerekli.

    Oluşturucu modu, en kötü ölümden ölüme gecikmeye maruz kalır, ancak ayarlama bunu önemli ölçüde azaltır. İki SMT seçeneği (açık ve kapalı), hız aşırtma çabalarımızdan da büyük düşüşler alıyor.

    Yardımcı program, yapı bant genişliğini de ölçer; bu, uzak bellekten alınan veriler de yapı boyunca aktığından performans için kritiktir. Bu nedenle AMD, dağıtılmış bellek mimarisini optimize etmek için yapı ve bellek alt sistemini gereğinden fazla sağlar.

    Hem Oluşturucu modu hem de Yerel/SMT yapılandırmaları, hız aşırtmanın sağladığı büyük artışların keyfini çıkararak en iyi yapı bant genişliğini sunar. Ryzen 7 1800X, Threadripper’ın Oyun modunun yanı sıra, her ikisinin de etkili bir şekilde 8C/16T işlemcileri olduğu düşünüldüğünde, grafiğin ortasına düşüyor. SMT’yi devre dışı bırakmak, ancak her iki kalıbı da etkin bırakmak (Yerel/SMT kapalı), daha büyük erişimlerle daha yüksek performans ve daha küçük erişimlerle daha düşük performans sağlayan benzersiz bir profil verir.

    Önbellek ve Bellek Gecikmesi

    DDR4-2666 bellek ile stok ayarlarında test ettik ve hız aşırtmalı yapılandırmalarımız için DDR4-3200’e yükselttik.

    Çeviri Ara Arabelleği, son erişilen bellek adreslerini depolayarak erişim sürelerini azaltan bir önbellektir. Tüm önbellekler gibi TLB’nin de sınırlı bir kapasitesi vardır, bu nedenle TLB’ye ulaşan adres istekleri “isabet”, önbelleğin dışına çıkan istekler ise “ıskarta”dır. Elbette, isabetler daha çok arzu edilir ve sağlam ön getirici performansı daha yüksek isabet oranları sağlar.

    Sıralı erişim modelleri neredeyse tamamen TLB’ye önceden getirilir, bu nedenle sıralı test, önceden getirici performansının iyi bir ölçüsüdür. Sayfa içi rastgele test, aynı bellek sayfasındaki rastgele erişimleri ölçer. Ayrıca TLB performansını ölçer ve en iyi durum rastgele performansını temsil eder (bu, resmi özellik sayfaları için kullanılan ölçüm satıcılarıdır). Tam rastgele test, güçlü bir ıskalama olasılığıyla birlikte TLB isabetlerinin ve ıskalarının bir karışımını içerir, bu nedenle en kötü durum gecikmesini ölçer.

    Bellek erişim düzeninden bağımsız olarak, en küçük veri parçaları L1 önbelleğine sığar. Ve verilerin boyutu arttıkça, daha büyük önbellekleri doldurur.

    L1L2L3Ana Bellek

    Menzil
    2KB – 32KB
    32KB – 512KB
    512KB – 8MB
    8MB – 1GB

    Threadripper 1950X, her tür erişim modeliyle Ryzen 7 1800X’ten daha iyi L2 ve L3 gecikme süresi sunar. Ayrıca, Threadripper’ın L1, L2 ve L3 önbellekleri için hız aşırtma yoluyla kayda değer gecikme azalmaları tespit ettik.

    Bu, iş yükü ana belleğe akarken değişir. Threadripper’ın Oluşturucu modu (varsayılan ayar), her erişim modelinde en yüksek gecikmeye sahiptir. Bu, uzak belleğe inen bellek erişimlerinin doğrudan bir sonucudur. Sayfa içi ölçümlerimiz AMD’nin 86.9ns spesifikasyonunu yansıtır, ancak en kötü durumda tam rastgele erişim 120ns’yi aşar. İşlemciye ve belleğe hız aşırtmak gecikmeyi azaltır, ancak Oluşturucu modu hala karşılaştırdığımız yapılandırmaların hiçbirini geçmiyor. 

    Yerel ayar ile NUMA moduna geçiş, diğer konfigürasyonlar için ana bellek erişimini önemli ölçüde iyileştirir. Sayfa içi yakın belleğe erişim için yine AMD’nin özelliklerine uygun olarak ~60ns ölçüyoruz, en kötü durum gecikmesi ise 100ns ağırlığında.

    Önbellek Bant Genişliği

    Her CCX’in kendi önbellekleri vardır, bu nedenle Threadripper CPU, dört ayrı L1, L2 ve L3 bellek kümesine sahiptir. Bant genişliği karşılaştırmamız, bu katmanların toplam performansını gösterir. 

    Tek iş parçacıklı test sırasında Ryzen 7 1800X, Threadripper işlemcilerden daha düşük verim gösterir. Diğer konfigürasyonlar, tanıdık stok ve hız aşırtmalı gruplarda bir araya toplanır.

    Çok iş parçacıklı testler daha ilginçtir; Ryzen 7 1800X’i görüyoruz ve iki Threadripper Oyun modu grafiğin en altına düşüyor. Oyun modu, bir kalıptaki çekirdekleri devre dışı bıraktığından, karşılık gelen önbelleği etkin bir şekilde devre dışı bırakır.

    0 0 votes
    Rating post
    Subscribe
    Bildir
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x