मिलिए GP102
संपादक का नोट: हमने पृष्ठ सात और आठ पर शक्ति, गर्मी और शोर माप शामिल करने के लिए लेख को अपडेट किया है, और हमने उन मापों को प्रतिबिंबित करने के लिए अपने निष्कर्ष में संपादन किया है (पृष्ठ 10 देखें)।
जापानी येन के खिलाफ ब्रिटिश पाउंड का व्यापार करने के लिए आपके पास एक आदत है। आपके पास एक किलर हॉट सॉस रेसिपी है, और यह दुनिया भर में वितरण में है। आपने अभी-अभी अपने ससुर की फर्म में पार्टनर बनाया है। जो भी हो, आप उस संभ्रांत समूह में हैं जो वास्तव में पैसे की चिंता नहीं करता है। आपके पास बीच हाउस, बेंटले और बुलगारी है। और अब एनवीडिया के पास आपके गेमिंग पीसी के लिए एक ग्राफिक्स कार्ड है: टाइटन एक्स। यह एक नए GP102 ग्राफिक्स प्रोसेसर पर बनाया गया है जिसमें 3584 CUDA कोर हैं, जो 384-बिट बस में 12GB GDDR5X मेमोरी द्वारा समर्थित है, और $ 1200 पर अप्राप्य रूप से पेश किया गया है।
एकल बेंचमार्क प्रकाशित होने से पहले, एनवीडिया को इतने महीनों में तीसरा पास्कल-आधारित जीपीयू लॉन्च करने के लिए प्रशंसा मिली और इसके फ्लैगशिप की कीमत बढ़ाने के लिए आलोचना की गई – एक दृष्टिकोण जिसने इंटेल को जला दिया जब उसने कोर i7-6950X को अभूतपूर्व $ 1700+ पर पेश किया। . हालाँकि, यहाँ एक बात है: जो लोग सबसे अच्छी खरीदारी करते हैं, वे रेंगने वाले विलासिता कर से प्रभावित नहीं होते हैं। और जो लोग वास्तव में अपने पीसी के साथ पैसा कमाते हैं वे अपनी आय में तेजी लाने में सक्षम हार्डवेयर के लिए प्रीमियम का भुगतान करते हैं।
यह सब हमारे समय को टाइटन एक्स के साथ थोड़ा कम अजीब बनाता है, हमें लगता है। कोई सुबह के बाद मूल्य विचार नहीं है। आप 40% अधिक CUDA कोर और 50% मेमोरी बैंडविड्थ बूस्ट के लिए GeForce GTX 1080 की लागत से 70% अधिक भुगतान करते हैं। हम कार्ड प्राप्त करने से पहले ही जानते थे कि प्रदर्शन लागत के साथ नहीं होगा। फिर भी, हम बेंचमार्क चलाने के लिए इंतजार नहीं कर सके। क्या टाइटन एक्स 4K पर फ्रेम दर में सुधार करता है ताकि अधिकतम-गुणवत्ता वाले गेमिंग के लिए 1080 अपर्याप्त कॉल करने के लिए आर्मचेयर क्वार्टरबैक को तुरंत संतुष्ट किया जा सके? पता लगाने का केवल एक ही तरीका है।
GP102: यह GP104 की तरह है, बड़े को छोड़कर
अपने GeForce GTX 1080 के साथ, Nvidia ने हमें GP104 (हाई-एंड पास्कल) प्रोसेसर से परिचित कराया। भावना में, वह GPU GM204 (हाई-एंड मैक्सवेल) से सफल हुआ, जिसे पिछली बार GeForce GTX 980 के केंद्र में देखा गया था। लेकिन क्योंकि पास्कल आर्किटेक्चर को 16nm FinFET निर्माण और तेज GDDR5X मेमोरी के साथ मेल खाने के लिए समय दिया गया था, जिसके परिणामस्वरूप GTX 1080 को डालने में कोई परेशानी नहीं हुई। जीटीएक्स 980 टीआई और टाइटन एक्स की तुलना में 30%+ अधिक औसत फ्रेम दर, दोनों जीएम200 (अल्ट्रा-हाई-एंड मैक्सवेल) द्वारा संचालित हैं। इससे अगले चरण के बारे में भूलना आसान हो गया, खासकर जब से हम जानते थे कि 15.3-बिलियन-ट्रांजिस्टर जीपी100 (अल्ट्रा-हाई-एंड पास्कल) गणना-उन्मुख था और शायद डेस्कटॉप के लिए नियत नहीं था।
अब, पहली बार, हमारे पास ‘ट्वीनर जीपीयू’ है, जो एनवीडिया के उच्चतम-अंत प्रोसेसर और जीपी104 से घिरा हुआ है। इसे GP102 कहा जाता है, और वास्तुशिल्प रूप से यह GP104 के समान है, केवल बड़ा है। चार ग्राफिक्स प्रोसेसिंग क्लस्टर छह हो जाते हैं। बदले में, 20 स्ट्रीमिंग मल्टीप्रोसेसर 30 हो जाते हैं। और 128 FP32 CUDA कोर प्रति SM के साथ, GP102 प्रोग्रामेबल बिल्डिंग ब्लॉक्स के 3840 तक का उत्पादन करता है। GP102 अविश्वसनीय रूप से जटिल है, हालांकि (यह 12 बिलियन ट्रांजिस्टर से बना है)। पैदावार में सुधार के साधन के रूप में, एनवीडिया अपने टाइटन एक्स के लिए प्रोसेसर के दो एसएम को निष्क्रिय कर देता है, जिससे बोर्ड की सीयूडीए कोर की गिनती 3584 हो जाती है। और क्योंकि प्रत्येक एसएम आठ बनावट इकाइयों को भी होस्ट करता है, उनमें से दो को बंद करने से 224 बनावट इकाइयां सक्षम हो जाती हैं।
टाइटन एक्स के विनिर्देशन में 1417 मेगाहर्ट्ज बेस क्लॉक का हवाला दिया गया है, जिसमें 1531 मेगाहर्ट्ज रेंज में विशिष्ट जीपीयू बूस्ट फ़्रीक्वेंसी हैं। यह कार्ड को 10.1+ TFLOPS की FP32 दर देता है, जो कि GeForce GTX 1080 से लगभग 23% अधिक है।
इसमें कोई संदेह नहीं है, GP104 को और भी व्यापक मेमोरी इंटरफ़ेस से लाभ होता, विशेष रूप से 4K पर। लेकिन GP102 की अधिक से अधिक छायांकन/बनावट क्षमता निश्चित रूप से एक प्रकार के पुनर्संतुलन की मांग करती है। जैसे, प्रोसेसर के बैक-एंड में 12 32-बिट मेमोरी कंट्रोलर शामिल होते हैं, जिनमें से प्रत्येक आठ ROP और 256KB L2 (GP104 के साथ) के लिए बाध्य होता है, कुल 96 ROP और 3MB साझा कैश प्रदान करता है। इसका परिणाम 384-बिट कुल पथ में होता है, जो एनवीडिया जीटीएक्स 1080 पर पाए गए 10 जीबी / एस जीडीडीआर 5 एक्स के 12 जीबी के साथ पॉप्युलेट करता है।
कार्ड की सैद्धांतिक मेमोरी बैंडविड्थ 480 GB/s (बनाम 1080’s 320 GB/s—एक 50% वृद्धि) है, हालांकि पास्कल आर्किटेक्चर के डेल्टा रंग संपीड़न सुधारों को ध्यान में रखते हुए प्रभावी थ्रूपुट अधिक होना चाहिए।
GDDR5-व्युत्पन्न तकनीक का निरंतर उपयोग क्यों जारी रखा जब AMD ने हमें एक वर्ष से अधिक समय पहले HBM के कई लाभ दिखाए? हम केवल कल्पना कर सकते हैं कि GP102 के डिज़ाइन चरण के दौरान, Nvidia को यकीन नहीं था कि HBM2 की आपूर्ति कैसे हिल जाएगी, और इसके बजाय GDDR5X-आधारित सबसिस्टम के साथ इसे सुरक्षित रूप से खेला। GP100 HBM2 के साथ लाइन-अप में एकमात्र GPU है।
GPUTitan X (GP102) GeForce GTX 1080 (GP104) टाइटन X (GM100) SMs CUDA कोर बेस क्लॉक GPU बूस्ट क्लॉक GFLOPs (बेस क्लॉक) टेक्सचर यूनिट्स टेक्सल फिल रेट मेमोरी डेटा रेट मेमोरी बैंडविड्थ ROPs L2 कैश टीडीपी ट्रांजिस्टर डाई साइज प्रोसेस नोड
28
20
24
3584
2560
3072
1417 मेगाहर्ट्ज
1607 मेगाहर्ट्ज
1000 मेगाहर्ट्ज
1531 मेगाहर्ट्ज
1733 मेगाहर्ट्ज
1075 मेगाहर्ट्ज
10,157
8228
6144
224
160
192
342.9 जीटी/एस
277.3 जीटी/एस
192 जीटी/एस
10 जीबी/एस
10 जीबी/एस
7 जीबी/एस
480 जीबी/सेक
320 जीबी/एस
336.5 जीबी/एस
96
64
96
3एमबी
2 एमबी
3एमबी
250W
180W
250W
12 अरब
7.2 अरब
8 अरब
471 मिमी²
314 मिमी²
601 मिमी²
16एनएम
16एनएम
28एनएम
यह दिलचस्प है कि एनवीडिया, जाहिरा तौर पर अंतिम समय में, टाइटन एक्स को अपने GeForce परिवार से दूर करने के लिए चुना। geforce.com पर टाइटन एक्स लैंडिंग पेज इसे अंतिम ग्राफिक्स कार्ड कहता है। अंतिम गेमिंग ग्राफिक्स कार्ड नहीं। बल्कि, “परम। अवधि।” बेशक, यह देखते हुए कि हम एक बड़े GP104 के साथ काम कर रहे हैं, टाइटन एक्स को गेमिंग में अच्छा होना चाहिए।
लेकिन स्टैनफोर्ड द्वारा आयोजित एआई मीट-अप में टाइटन एक्स का अनावरण करने का कंपनी का निर्णय यह दर्शाता है कि वह इस बार गहन सीखने पर ध्यान केंद्रित कर रहा है। उस अंत तक, जबकि FP16 और FP64 दरें GP104 (और विस्तार से, GP102 पर) पर निराशाजनक रूप से धीमी हैं, दोनों प्रोसेसर INT8 को 4:1 पर समर्थन करते हैं, टाइटन X की आधार आवृत्ति पर 40.6 TOPS प्राप्त करते हैं।