Skip to content

अपडेट: एनवीडिया टाइटन एक्स पास्कल 12GB रिव्यू

    1650133802

    मिलिए GP102

    संपादक का नोट: हमने पृष्ठ सात और आठ पर शक्ति, गर्मी और शोर माप शामिल करने के लिए लेख को अपडेट किया है, और हमने उन मापों को प्रतिबिंबित करने के लिए अपने निष्कर्ष में संपादन किया है (पृष्ठ 10 देखें)।

    जापानी येन के खिलाफ ब्रिटिश पाउंड का व्यापार करने के लिए आपके पास एक आदत है। आपके पास एक किलर हॉट सॉस रेसिपी है, और यह दुनिया भर में वितरण में है। आपने अभी-अभी अपने ससुर की फर्म में पार्टनर बनाया है। जो भी हो, आप उस संभ्रांत समूह में हैं जो वास्तव में पैसे की चिंता नहीं करता है। आपके पास बीच हाउस, बेंटले और बुलगारी है। और अब एनवीडिया के पास आपके गेमिंग पीसी के लिए एक ग्राफिक्स कार्ड है: टाइटन एक्स। यह एक नए GP102 ग्राफिक्स प्रोसेसर पर बनाया गया है जिसमें 3584 CUDA कोर हैं, जो 384-बिट बस में 12GB GDDR5X मेमोरी द्वारा समर्थित है, और $ 1200 पर अप्राप्य रूप से पेश किया गया है।

    एकल बेंचमार्क प्रकाशित होने से पहले, एनवीडिया को इतने महीनों में तीसरा पास्कल-आधारित जीपीयू लॉन्च करने के लिए प्रशंसा मिली और इसके फ्लैगशिप की कीमत बढ़ाने के लिए आलोचना की गई – एक दृष्टिकोण जिसने इंटेल को जला दिया जब उसने कोर i7-6950X को अभूतपूर्व $ 1700+ पर पेश किया। . हालाँकि, यहाँ एक बात है: जो लोग सबसे अच्छी खरीदारी करते हैं, वे रेंगने वाले विलासिता कर से प्रभावित नहीं होते हैं। और जो लोग वास्तव में अपने पीसी के साथ पैसा कमाते हैं वे अपनी आय में तेजी लाने में सक्षम हार्डवेयर के लिए प्रीमियम का भुगतान करते हैं।

    यह सब हमारे समय को टाइटन एक्स के साथ थोड़ा कम अजीब बनाता है, हमें लगता है। कोई सुबह के बाद मूल्य विचार नहीं है। आप 40% अधिक CUDA कोर और 50% मेमोरी बैंडविड्थ बूस्ट के लिए GeForce GTX 1080 की लागत से 70% अधिक भुगतान करते हैं। हम कार्ड प्राप्त करने से पहले ही जानते थे कि प्रदर्शन लागत के साथ नहीं होगा। फिर भी, हम बेंचमार्क चलाने के लिए इंतजार नहीं कर सके। क्या टाइटन एक्स 4K पर फ्रेम दर में सुधार करता है ताकि अधिकतम-गुणवत्ता वाले गेमिंग के लिए 1080 अपर्याप्त कॉल करने के लिए आर्मचेयर क्वार्टरबैक को तुरंत संतुष्ट किया जा सके? पता लगाने का केवल एक ही तरीका है।

    GP102: यह GP104 की तरह है, बड़े को छोड़कर

    अपने GeForce GTX 1080 के साथ, Nvidia ने हमें GP104 (हाई-एंड पास्कल) प्रोसेसर से परिचित कराया। भावना में, वह GPU GM204 (हाई-एंड मैक्सवेल) से सफल हुआ, जिसे पिछली बार GeForce GTX 980 के केंद्र में देखा गया था। लेकिन क्योंकि पास्कल आर्किटेक्चर को 16nm FinFET निर्माण और तेज GDDR5X मेमोरी के साथ मेल खाने के लिए समय दिया गया था, जिसके परिणामस्वरूप GTX 1080 को डालने में कोई परेशानी नहीं हुई। जीटीएक्स 980 टीआई और टाइटन एक्स की तुलना में 30%+ अधिक औसत फ्रेम दर, दोनों जीएम200 (अल्ट्रा-हाई-एंड मैक्सवेल) द्वारा संचालित हैं। इससे अगले चरण के बारे में भूलना आसान हो गया, खासकर जब से हम जानते थे कि 15.3-बिलियन-ट्रांजिस्टर जीपी100 (अल्ट्रा-हाई-एंड पास्कल) गणना-उन्मुख था और शायद डेस्कटॉप के लिए नियत नहीं था।

    अब, पहली बार, हमारे पास ‘ट्वीनर जीपीयू’ है, जो एनवीडिया के उच्चतम-अंत प्रोसेसर और जीपी104 से घिरा हुआ है। इसे GP102 कहा जाता है, और वास्तुशिल्प रूप से यह GP104 के समान है, केवल बड़ा है। चार ग्राफिक्स प्रोसेसिंग क्लस्टर छह हो जाते हैं। बदले में, 20 स्ट्रीमिंग मल्टीप्रोसेसर 30 हो जाते हैं। और 128 FP32 CUDA कोर प्रति SM के साथ, GP102 प्रोग्रामेबल बिल्डिंग ब्लॉक्स के 3840 तक का उत्पादन करता है। GP102 अविश्वसनीय रूप से जटिल है, हालांकि (यह 12 बिलियन ट्रांजिस्टर से बना है)। पैदावार में सुधार के साधन के रूप में, एनवीडिया अपने टाइटन एक्स के लिए प्रोसेसर के दो एसएम को निष्क्रिय कर देता है, जिससे बोर्ड की सीयूडीए कोर की गिनती 3584 हो जाती है। और क्योंकि प्रत्येक एसएम आठ बनावट इकाइयों को भी होस्ट करता है, उनमें से दो को बंद करने से 224 बनावट इकाइयां सक्षम हो जाती हैं।

    टाइटन एक्स के विनिर्देशन में 1417 मेगाहर्ट्ज बेस क्लॉक का हवाला दिया गया है, जिसमें 1531 मेगाहर्ट्ज रेंज में विशिष्ट जीपीयू बूस्ट फ़्रीक्वेंसी हैं। यह कार्ड को 10.1+ TFLOPS की FP32 दर देता है, जो कि GeForce GTX 1080 से लगभग 23% अधिक है।

    इसमें कोई संदेह नहीं है, GP104 को और भी व्यापक मेमोरी इंटरफ़ेस से लाभ होता, विशेष रूप से 4K पर। लेकिन GP102 की अधिक से अधिक छायांकन/बनावट क्षमता निश्चित रूप से एक प्रकार के पुनर्संतुलन की मांग करती है। जैसे, प्रोसेसर के बैक-एंड में 12 32-बिट मेमोरी कंट्रोलर शामिल होते हैं, जिनमें से प्रत्येक आठ ROP और 256KB L2 (GP104 के साथ) के लिए बाध्य होता है, कुल 96 ROP और 3MB साझा कैश प्रदान करता है। इसका परिणाम 384-बिट कुल पथ में होता है, जो एनवीडिया जीटीएक्स 1080 पर पाए गए 10 जीबी / एस जीडीडीआर 5 एक्स के 12 जीबी के साथ पॉप्युलेट करता है।

    कार्ड की सैद्धांतिक मेमोरी बैंडविड्थ 480 GB/s (बनाम 1080’s 320 GB/s—एक 50% वृद्धि) है, हालांकि पास्कल आर्किटेक्चर के डेल्टा रंग संपीड़न सुधारों को ध्यान में रखते हुए प्रभावी थ्रूपुट अधिक होना चाहिए।

    GDDR5-व्युत्पन्न तकनीक का निरंतर उपयोग क्यों जारी रखा जब AMD ने हमें एक वर्ष से अधिक समय पहले HBM के कई लाभ दिखाए? हम केवल कल्पना कर सकते हैं कि GP102 के डिज़ाइन चरण के दौरान, Nvidia को यकीन नहीं था कि HBM2 की आपूर्ति कैसे हिल जाएगी, और इसके बजाय GDDR5X-आधारित सबसिस्टम के साथ इसे सुरक्षित रूप से खेला। GP100 HBM2 के साथ लाइन-अप में एकमात्र GPU है।

    GPUTitan X (GP102) GeForce GTX 1080 (GP104) टाइटन X (GM100) SMs CUDA कोर बेस क्लॉक GPU बूस्ट क्लॉक GFLOPs (बेस क्लॉक) टेक्सचर यूनिट्स टेक्सल फिल रेट मेमोरी डेटा रेट मेमोरी बैंडविड्थ ROPs L2 कैश टीडीपी ट्रांजिस्टर डाई साइज प्रोसेस नोड

    28
    20
    24

    3584
    2560
    3072

    1417 मेगाहर्ट्ज
    1607 मेगाहर्ट्ज
    1000 मेगाहर्ट्ज

    1531 मेगाहर्ट्ज
    1733 मेगाहर्ट्ज
    1075 मेगाहर्ट्ज

    10,157
    8228
    6144

    224
    160
    192

    342.9 जीटी/एस
    277.3 जीटी/एस
    192 जीटी/एस

    10 जीबी/एस
    10 जीबी/एस
    7 जीबी/एस

    480 जीबी/सेक
    320 जीबी/एस
    336.5 जीबी/एस

    96
    64
    96

    3एमबी
    2 एमबी
    3एमबी

    250W
    180W
    250W

    12 अरब
    7.2 अरब
    8 अरब

    471 मिमी²
    314 मिमी²
    601 मिमी²

    16एनएम
    16एनएम
    28एनएम

    यह दिलचस्प है कि एनवीडिया, जाहिरा तौर पर अंतिम समय में, टाइटन एक्स को अपने GeForce परिवार से दूर करने के लिए चुना। geforce.com पर टाइटन एक्स लैंडिंग पेज इसे अंतिम ग्राफिक्स कार्ड कहता है। अंतिम गेमिंग ग्राफिक्स कार्ड नहीं। बल्कि, “परम। अवधि।” बेशक, यह देखते हुए कि हम एक बड़े GP104 के साथ काम कर रहे हैं, टाइटन एक्स को गेमिंग में अच्छा होना चाहिए।

    लेकिन स्टैनफोर्ड द्वारा आयोजित एआई मीट-अप में टाइटन एक्स का अनावरण करने का कंपनी का निर्णय यह दर्शाता है कि वह इस बार गहन सीखने पर ध्यान केंद्रित कर रहा है। उस अंत तक, जबकि FP16 और FP64 दरें GP104 (और विस्तार से, GP102 पर) पर निराशाजनक रूप से धीमी हैं, दोनों प्रोसेसर INT8 को 4:1 पर समर्थन करते हैं, टाइटन X की आधार आवृत्ति पर 40.6 TOPS प्राप्त करते हैं।

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x