रेजेन के इन्फिनिटी फैब्रिक और मेमोरी सबसिस्टम का परीक्षण
इन्फिनिटी फैब्रिक लेटेंसी और बैंडविड्थ
256-बिट इन्फिनिटी फैब्रिक क्रॉसबार एक ज़ेपेलिन डाई के अंदर के संसाधनों को एक साथ जोड़ता है। थ्रेडिपर बनाने के लिए एक दूसरे ज़ेपेलिन डाई पर टैकिंग कपड़े की एक और परत का परिचय देती है, हालाँकि। कैश एक्सेस प्रत्येक CCX के लिए स्थानीय रहता है, लेकिन बड़ी मात्रा में मेमोरी, I/O, और थ्रेड-टू-थ्रेड ट्रैफ़िक अभी भी उस दूसरी परत में प्रवाहित होता है।
उत्साही लोगों को यह पता लगाने में देर नहीं लगी कि AMD का इन्फिनिटी फैब्रिक मेमोरी कंट्रोलर के समान आवृत्ति डोमेन में बंधा हुआ है, इसलिए मेमोरी ओवरक्लॉक विलंबता को कम करता है और क्रॉसबार के माध्यम से बैंडविड्थ बढ़ाता है। विलंबता-संवेदनशील अनुप्रयोगों (जैसे गेम) में प्रदर्शन में परिणामतः सुधार होता है।
SiSoftware सैंड्रा का प्रोसेसर मल्टी-कोर दक्षता परीक्षण हमें इन्फिनिटी फैब्रिक के प्रदर्शन को स्पष्ट करने में मदद करता है। हम “सर्वश्रेष्ठ जोड़ी मिलान” सेटिंग (न्यूनतम विलंबता) के साथ मल्टी-थ्रेडेड मीट्रिक का उपयोग करते हैं। उपयोगिता हर संभव विन्यास में कपड़े विलंबता को मापने के लिए धागे के बीच पिंग समय को मापती है।
इंट्रा-कोर लेटेंसी माप एक ही भौतिक कोर पर रहने वाले दो तार्किक धागे के बीच संचार का प्रतिनिधित्व करते हैं, और जैसा कि हम देख सकते हैं, एसएमटी को अक्षम करने से वह माप पूरी तरह से समाप्त हो जाता है। शेष सेटअप के लिए, ट्यूनिंग कुछ नैनोसेकंड से विलंबता को कम कर देता है। लेकिन यह उच्च घड़ी दरों के कारण है। जैसा कि हमने अतीत में देखा है, बढ़ी हुई मेमोरी फ़्रीक्वेंसी का इंट्रा-कोर लेटेंसी पर बहुत कम प्रभाव पड़ता है।
इंट्रा-सीसीएक्स माप एक ही सीसीएक्स पर थ्रेड्स के बीच विलंबता को मापते हैं जो एक ही कोर पर निवासी नहीं हैं। घड़ी की दर बढ़ाने से ~ 6ns विलंबता में कमी आती है।
क्रॉस-सीसीएक्स दो अलग-अलग सीसीएक्स पर स्थित थ्रेड्स के बीच विलंबता को मापता है, और हम ओवरक्लॉकिंग के लिए एक समान कमी देखते हैं। विशेष रूप से, Ryzen 7 1800X में स्टॉक थ्रेडिपर और अधिकांश ओवरक्लॉक्ड कॉन्फ़िगरेशन की तुलना में बहुत कम क्रॉस-सीसीएक्स विलंबता है। थ्रेड्रिपर के कपड़े की अतिरिक्त परत के लिए, संभवतः शेड्यूलिंग एल्गोरिदम में किसी प्रकार के प्रावधान के कारण यह संभव है।
जैसा कि हम देख सकते हैं, गेम मोड में ओवरक्लॉक किया गया थ्रेडिपर सीपीयू, जिसमें दूसरे डाई के लिए एक सक्रिय फैब्रिक लिंक नहीं है, में सबसे कम क्रॉस-सीसीएक्स विलंबता है।
डाई-टू-डाई दो अलग-अलग ज़ेपेलिन के बीच संचार को मापता है। गेम मोड ऑपरेटिंग सिस्टम स्तर पर दूसरे ज़ेपेलिन डाई को प्रभावी ढंग से निष्क्रिय कर देता है, जिससे डाई-टू-डाई विलंबता पूरी तरह से समाप्त हो जाती है। हालांकि दूसरे डाई का अनकोर अभी भी सक्रिय है, जो यह सुनिश्चित करने के लिए आवश्यक है कि इसके I/O और मेमोरी कंट्रोलर अभी भी पहुंच योग्य हैं।
क्रिएटर मोड में सबसे खराब डाई-टू-डाई लेटेंसी होती है, लेकिन ट्यूनिंग इसे काफी कम कर देता है। दो एसएमटी विकल्प (चालू और बंद) हमारे ओवरक्लॉकिंग प्रयासों से भी बड़ी कटौती प्राप्त करते हैं।
उपयोगिता फैब्रिक बैंडविड्थ को भी मापती है, जो प्रदर्शन के लिए महत्वपूर्ण है क्योंकि रिमोट मेमोरी से डेटा प्राप्त होता है जो पूरे कपड़े में भी प्रवाहित होता है। जैसे, एएमडी वितरित मेमोरी आर्किटेक्चर को अनुकूलित करने के लिए कपड़े और मेमोरी सबसिस्टम को अधिक प्रावधान करता है।
क्रिएटर मोड और लोकल/एसएमटी कॉन्फिगरेशन दोनों ही बेहतरीन फैब्रिक बैंडविड्थ की पेशकश करते हैं, ओवरक्लॉकिंग से बड़े बूस्ट का आनंद लेते हैं। Ryzen 7 1800X थ्रेड्रिपर के गेम मोड के साथ चार्ट के बीच में आता है, जो तार्किक है क्योंकि वे दोनों प्रभावी रूप से 8C/16T प्रोसेसर हैं। SMT को अक्षम करना लेकिन दोनों को सक्रिय छोड़ देना (लोकल/SMT बंद) एक अद्वितीय प्रोफ़ाइल देता है जो बड़ी पहुंच के साथ उच्च प्रदर्शन और छोटी पहुंच के साथ कम प्रदर्शन प्रदान करता है।
कैशे और मेमोरी विलंबता
हमने स्टॉक सेटिंग्स में DDR4-2666 मेमोरी के साथ परीक्षण किया और हमारे ओवरक्लॉक किए गए कॉन्फ़िगरेशन के लिए DDR4-3200 तक बढ़ गया।
ट्रांसलेशन लुक असाइड बफर एक कैश है जो हाल ही में एक्सेस किए गए मेमोरी एड्रेस को स्टोर करके एक्सेस टाइम को कम करता है। सभी कैश की तरह, टीएलबी की एक सीमित क्षमता है, इसलिए पता अनुरोध है कि टीएलबी में भूमि “हिट” है, जबकि अनुरोध है कि कैश के बाहर की भूमि “मिस” है। बेशक, हिट अधिक वांछनीय हैं, और ठोस प्रीफ़ेचर प्रदर्शन उच्च हिट दर देता है।
अनुक्रमिक पहुंच पैटर्न लगभग पूरी तरह से टीएलबी में प्रीफ़ेच किए गए हैं, इसलिए अनुक्रमिक परीक्षण प्रीफ़ेचर प्रदर्शन का एक अच्छा उपाय है। इन-पेज रैंडम टेस्ट उसी मेमोरी पेज के भीतर रैंडम एक्सेस को मापता है। यह टीएलबी प्रदर्शन को भी मापता है और सर्वश्रेष्ठ-केस यादृच्छिक प्रदर्शन का प्रतिनिधित्व करता है (यह माप विक्रेता आधिकारिक स्पेस शीट के लिए उपयोग करते हैं)। पूर्ण यादृच्छिक परीक्षण में टीएलबी हिट और मिस का मिश्रण होता है, जिसमें चूक की प्रबल संभावना होती है, इसलिए यह सबसे खराब स्थिति विलंबता को निर्धारित करता है।
मेमोरी एक्सेस पैटर्न के बावजूद, सबसे छोटा डेटा हिस्सा L1 कैश में फिट होता है। और जैसे-जैसे डेटा का आकार बढ़ता है, यह बड़े कैश को पॉप्युलेट करता है।
L1L2L3मुख्य मेमोरी
श्रेणी
2KB – 32KB
32KB – 512KB
512KB – 8MB
8 एमबी – 1 जीबी
थ्रेड्रिपर 1950X में हर प्रकार के एक्सेस पैटर्न के साथ Ryzen 7 1800X की तुलना में बेहतर L2 और L3 लेटेंसी है। साथ ही, हम थ्रेड्रिपर के L1, L2 और L3 कैश के लिए ओवरक्लॉकिंग के माध्यम से उल्लेखनीय विलंबता में कमी पाते हैं।
जैसे ही कार्यभार मुख्य मेमोरी में प्रवाहित होता है, यह बदल जाता है। थ्रेड्रिपर के क्रिएटर मोड (डिफ़ॉल्ट सेटिंग) में प्रत्येक एक्सेस पैटर्न के साथ उच्चतम विलंबता है। यह रिमोट मेमोरी में मेमोरी एक्सेस के उतरने का सीधा परिणाम है। हमारे इन-पेज मापन एएमडी के 86.9ns विनिर्देश को दर्शाते हैं, लेकिन सबसे खराब स्थिति में पूर्ण यादृच्छिक अभिगम 120ns से अधिक है। प्रोसेसर और मेमोरी को ओवरक्लॉक करने से विलंबता कम हो जाती है, लेकिन क्रिएटर मोड अभी भी हमारे द्वारा तुलना किए जाने वाले किसी भी कॉन्फ़िगरेशन से आगे नहीं निकल पाता है।
स्थानीय सेटिंग के साथ NUMA मोड में स्विच करने से अन्य कॉन्फ़िगरेशन के लिए मुख्य मेमोरी एक्सेस में नाटकीय रूप से सुधार होता है। हम मेमोरी एक्सेस के पास इन-पेज के लिए ~ 60ns मापते हैं, फिर से AMD के विनिर्देशों के अनुरूप, जबकि सबसे खराब स्थिति में विलंबता का वजन 100ns होता है।
कैश बैंडविड्थ
प्रत्येक CCX का अपना कैश होता है, इसलिए एक थ्रेडिपर CPU में L1, L2, और L3 मेमोरी के चार अलग-अलग क्लस्टर होते हैं। हमारा बैंडविड्थ बेंचमार्क इन स्तरों के समग्र प्रदर्शन को दर्शाता है।
सिंगल-थ्रेडेड टेस्ट के दौरान, Ryzen 7 1800X थ्रेड्रिपर प्रोसेसर की तुलना में कम थ्रूपुट प्रदर्शित करता है। अन्य कॉन्फ़िगरेशन परिचित स्टॉक और ओवरक्लॉक किए गए समूहों में एक साथ टकराते हैं।
बहु-थ्रेडेड परीक्षण अधिक दिलचस्प हैं; हम Ryzen 7 1800X देखते हैं और दो थ्रेडिपर गेम मोड चार्ट के निचले भाग में आते हैं। क्योंकि गेम मोड एक बार में कोर को निष्क्रिय कर देता है, यह प्रभावी रूप से संबंधित कैश को कमीशन से बाहर कर देता है।