Skip to content

AMD Ryzen Threadripper 1950X गेम मोड, बेंचमार्क

    1645560003

    रेजेन के इन्फिनिटी फैब्रिक और मेमोरी सबसिस्टम का परीक्षण

    इन्फिनिटी फैब्रिक लेटेंसी और बैंडविड्थ

    256-बिट इन्फिनिटी फैब्रिक क्रॉसबार एक ज़ेपेलिन डाई के अंदर के संसाधनों को एक साथ जोड़ता है। थ्रेडिपर बनाने के लिए एक दूसरे ज़ेपेलिन डाई पर टैकिंग कपड़े की एक और परत का परिचय देती है, हालाँकि। कैश एक्सेस प्रत्येक CCX के लिए स्थानीय रहता है, लेकिन बड़ी मात्रा में मेमोरी, I/O, और थ्रेड-टू-थ्रेड ट्रैफ़िक अभी भी उस दूसरी परत में प्रवाहित होता है।

    उत्साही लोगों को यह पता लगाने में देर नहीं लगी कि AMD का इन्फिनिटी फैब्रिक मेमोरी कंट्रोलर के समान आवृत्ति डोमेन में बंधा हुआ है, इसलिए मेमोरी ओवरक्लॉक विलंबता को कम करता है और क्रॉसबार के माध्यम से बैंडविड्थ बढ़ाता है। विलंबता-संवेदनशील अनुप्रयोगों (जैसे गेम) में प्रदर्शन में परिणामतः सुधार होता है।

    SiSoftware सैंड्रा का प्रोसेसर मल्टी-कोर दक्षता परीक्षण हमें इन्फिनिटी फैब्रिक के प्रदर्शन को स्पष्ट करने में मदद करता है। हम “सर्वश्रेष्ठ जोड़ी मिलान” सेटिंग (न्यूनतम विलंबता) के साथ मल्टी-थ्रेडेड मीट्रिक का उपयोग करते हैं। उपयोगिता हर संभव विन्यास में कपड़े विलंबता को मापने के लिए धागे के बीच पिंग समय को मापती है।

    इंट्रा-कोर लेटेंसी माप एक ही भौतिक कोर पर रहने वाले दो तार्किक धागे के बीच संचार का प्रतिनिधित्व करते हैं, और जैसा कि हम देख सकते हैं, एसएमटी को अक्षम करने से वह माप पूरी तरह से समाप्त हो जाता है। शेष सेटअप के लिए, ट्यूनिंग कुछ नैनोसेकंड से विलंबता को कम कर देता है। लेकिन यह उच्च घड़ी दरों के कारण है। जैसा कि हमने अतीत में देखा है, बढ़ी हुई मेमोरी फ़्रीक्वेंसी का इंट्रा-कोर लेटेंसी पर बहुत कम प्रभाव पड़ता है।

    इंट्रा-सीसीएक्स माप एक ही सीसीएक्स पर थ्रेड्स के बीच विलंबता को मापते हैं जो एक ही कोर पर निवासी नहीं हैं। घड़ी की दर बढ़ाने से ~ 6ns विलंबता में कमी आती है।

    क्रॉस-सीसीएक्स दो अलग-अलग सीसीएक्स पर स्थित थ्रेड्स के बीच विलंबता को मापता है, और हम ओवरक्लॉकिंग के लिए एक समान कमी देखते हैं। विशेष रूप से, Ryzen 7 1800X में स्टॉक थ्रेडिपर और अधिकांश ओवरक्लॉक्ड कॉन्फ़िगरेशन की तुलना में बहुत कम क्रॉस-सीसीएक्स विलंबता है। थ्रेड्रिपर के कपड़े की अतिरिक्त परत के लिए, संभवतः शेड्यूलिंग एल्गोरिदम में किसी प्रकार के प्रावधान के कारण यह संभव है।

    जैसा कि हम देख सकते हैं, गेम मोड में ओवरक्लॉक किया गया थ्रेडिपर सीपीयू, जिसमें दूसरे डाई के लिए एक सक्रिय फैब्रिक लिंक नहीं है, में सबसे कम क्रॉस-सीसीएक्स विलंबता है।

    डाई-टू-डाई दो अलग-अलग ज़ेपेलिन के बीच संचार को मापता है। गेम मोड ऑपरेटिंग सिस्टम स्तर पर दूसरे ज़ेपेलिन डाई को प्रभावी ढंग से निष्क्रिय कर देता है, जिससे डाई-टू-डाई विलंबता पूरी तरह से समाप्त हो जाती है। हालांकि दूसरे डाई का अनकोर अभी भी सक्रिय है, जो यह सुनिश्चित करने के लिए आवश्यक है कि इसके I/O और मेमोरी कंट्रोलर अभी भी पहुंच योग्य हैं।

    क्रिएटर मोड में सबसे खराब डाई-टू-डाई लेटेंसी होती है, लेकिन ट्यूनिंग इसे काफी कम कर देता है। दो एसएमटी विकल्प (चालू और बंद) हमारे ओवरक्लॉकिंग प्रयासों से भी बड़ी कटौती प्राप्त करते हैं।

    उपयोगिता फैब्रिक बैंडविड्थ को भी मापती है, जो प्रदर्शन के लिए महत्वपूर्ण है क्योंकि रिमोट मेमोरी से डेटा प्राप्त होता है जो पूरे कपड़े में भी प्रवाहित होता है। जैसे, एएमडी वितरित मेमोरी आर्किटेक्चर को अनुकूलित करने के लिए कपड़े और मेमोरी सबसिस्टम को अधिक प्रावधान करता है।

    क्रिएटर मोड और लोकल/एसएमटी कॉन्फिगरेशन दोनों ही बेहतरीन फैब्रिक बैंडविड्थ की पेशकश करते हैं, ओवरक्लॉकिंग से बड़े बूस्ट का आनंद लेते हैं। Ryzen 7 1800X थ्रेड्रिपर के गेम मोड के साथ चार्ट के बीच में आता है, जो तार्किक है क्योंकि वे दोनों प्रभावी रूप से 8C/16T प्रोसेसर हैं। SMT को अक्षम करना लेकिन दोनों को सक्रिय छोड़ देना (लोकल/SMT बंद) एक अद्वितीय प्रोफ़ाइल देता है जो बड़ी पहुंच के साथ उच्च प्रदर्शन और छोटी पहुंच के साथ कम प्रदर्शन प्रदान करता है।

    कैशे और मेमोरी विलंबता

    हमने स्टॉक सेटिंग्स में DDR4-2666 मेमोरी के साथ परीक्षण किया और हमारे ओवरक्लॉक किए गए कॉन्फ़िगरेशन के लिए DDR4-3200 तक बढ़ गया।

    ट्रांसलेशन लुक असाइड बफर एक कैश है जो हाल ही में एक्सेस किए गए मेमोरी एड्रेस को स्टोर करके एक्सेस टाइम को कम करता है। सभी कैश की तरह, टीएलबी की एक सीमित क्षमता है, इसलिए पता अनुरोध है कि टीएलबी में भूमि “हिट” है, जबकि अनुरोध है कि कैश के बाहर की भूमि “मिस” है। बेशक, हिट अधिक वांछनीय हैं, और ठोस प्रीफ़ेचर प्रदर्शन उच्च हिट दर देता है।

    अनुक्रमिक पहुंच पैटर्न लगभग पूरी तरह से टीएलबी में प्रीफ़ेच किए गए हैं, इसलिए अनुक्रमिक परीक्षण प्रीफ़ेचर प्रदर्शन का एक अच्छा उपाय है। इन-पेज रैंडम टेस्ट उसी मेमोरी पेज के भीतर रैंडम एक्सेस को मापता है। यह टीएलबी प्रदर्शन को भी मापता है और सर्वश्रेष्ठ-केस यादृच्छिक प्रदर्शन का प्रतिनिधित्व करता है (यह माप विक्रेता आधिकारिक स्पेस शीट के लिए उपयोग करते हैं)। पूर्ण यादृच्छिक परीक्षण में टीएलबी हिट और मिस का मिश्रण होता है, जिसमें चूक की प्रबल संभावना होती है, इसलिए यह सबसे खराब स्थिति विलंबता को निर्धारित करता है।

    मेमोरी एक्सेस पैटर्न के बावजूद, सबसे छोटा डेटा हिस्सा L1 कैश में फिट होता है। और जैसे-जैसे डेटा का आकार बढ़ता है, यह बड़े कैश को पॉप्युलेट करता है।

    L1L2L3मुख्य मेमोरी

    श्रेणी
    2KB – 32KB
    32KB – 512KB
    512KB – 8MB
    8 एमबी – 1 जीबी

    थ्रेड्रिपर 1950X में हर प्रकार के एक्सेस पैटर्न के साथ Ryzen 7 1800X की तुलना में बेहतर L2 और L3 लेटेंसी है। साथ ही, हम थ्रेड्रिपर के L1, L2 और L3 कैश के लिए ओवरक्लॉकिंग के माध्यम से उल्लेखनीय विलंबता में कमी पाते हैं।

    जैसे ही कार्यभार मुख्य मेमोरी में प्रवाहित होता है, यह बदल जाता है। थ्रेड्रिपर के क्रिएटर मोड (डिफ़ॉल्ट सेटिंग) में प्रत्येक एक्सेस पैटर्न के साथ उच्चतम विलंबता है। यह रिमोट मेमोरी में मेमोरी एक्सेस के उतरने का सीधा परिणाम है। हमारे इन-पेज मापन एएमडी के 86.9ns विनिर्देश को दर्शाते हैं, लेकिन सबसे खराब स्थिति में पूर्ण यादृच्छिक अभिगम 120ns से अधिक है। प्रोसेसर और मेमोरी को ओवरक्लॉक करने से विलंबता कम हो जाती है, लेकिन क्रिएटर मोड अभी भी हमारे द्वारा तुलना किए जाने वाले किसी भी कॉन्फ़िगरेशन से आगे नहीं निकल पाता है। 

    स्थानीय सेटिंग के साथ NUMA मोड में स्विच करने से अन्य कॉन्फ़िगरेशन के लिए मुख्य मेमोरी एक्सेस में नाटकीय रूप से सुधार होता है। हम मेमोरी एक्सेस के पास इन-पेज के लिए ~ 60ns मापते हैं, फिर से AMD के विनिर्देशों के अनुरूप, जबकि सबसे खराब स्थिति में विलंबता का वजन 100ns होता है।

    कैश बैंडविड्थ

    प्रत्येक CCX का अपना कैश होता है, इसलिए एक थ्रेडिपर CPU में L1, L2, और L3 मेमोरी के चार अलग-अलग क्लस्टर होते हैं। हमारा बैंडविड्थ बेंचमार्क इन स्तरों के समग्र प्रदर्शन को दर्शाता है। 

    सिंगल-थ्रेडेड टेस्ट के दौरान, Ryzen 7 1800X थ्रेड्रिपर प्रोसेसर की तुलना में कम थ्रूपुट प्रदर्शित करता है। अन्य कॉन्फ़िगरेशन परिचित स्टॉक और ओवरक्लॉक किए गए समूहों में एक साथ टकराते हैं।

    बहु-थ्रेडेड परीक्षण अधिक दिलचस्प हैं; हम Ryzen 7 1800X देखते हैं और दो थ्रेडिपर गेम मोड चार्ट के निचले भाग में आते हैं। क्योंकि गेम मोड एक बार में कोर को निष्क्रिय कर देता है, यह प्रभावी रूप से संबंधित कैश को कमीशन से बाहर कर देता है।

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x