กล่าวสวัสดีกับ GPU Pascal-Based ใหม่
สองเดือนหลังจากเปิดตัว สถาปัตยกรรม Pascal ของ Nvidia ค่อยๆ เติมเต็มพอร์ตโฟลิโอกราฟิกการ์ดเดสก์ท็อปของบริษัทจากบนลงล่าง อย่างแรกคือ GeForce GTX 1080 ซึ่งให้ประสิทธิภาพมากกว่า GeForce GTX 980 Ti ถึง 30%+ ด้วยเงินที่น้อยกว่า ผู้ขายออนไลน์ยังคงไม่สามารถเก็บไว้ในสต็อกได้ (Newegg ไม่มีข้อมูลใดๆ ในการเขียนนี้) จากนั้นเราก็ได้รับการแนะนำให้รู้จักกับ GeForce GTX 1070 ซึ่งมีประสิทธิภาพเหนือกว่า 980 Ti ด้วยราคาที่ถูกกว่าหลายร้อยดอลลาร์
ตอนนี้เราได้รับบอร์ด Pascal ตัวที่สามใน GeForce GTX 1060 ซึ่งประกาศเมื่อต้นเดือนนี้ เรารู้อยู่แล้วว่าพันธมิตรของ Nvidia จะมีเวอร์ชันเริ่มต้นที่ 250 ดอลลาร์ การใช้งาน Founders Edition จะขายในราคา $300 บน nvidia.com และในร้านค้า Best Buy ดังนั้นอย่าแปลกใจถ้าคุณไม่พบพวกเขาที่อื่นทางออนไลน์
GeForce GTX 1060 ใช้ GPU ใหม่ล่าสุดที่เรียกว่า GP106 ซึ่งแสดงคุณลักษณะหลายอย่างเช่นเดียวกับ GP104 แต่ในแพ็คเกจหลัก อย่าปล่อยให้คำนั้นเกลี้ยกล่อมคุณแม้ว่า 1060 อาจเป็นการ์ด 120W เท่านั้น แต่ Nvidia บอกว่ามันดีสำหรับอัตราเฟรมระดับ GeForce GTX 980 เมื่อสองปีก่อน ประสิทธิภาพระดับนั้นขายได้ในราคา 550 ดอลลาร์ เรามาไกลมากแล้ว เพื่อความแน่ใจ
พบกับ GP106
Nvidia สร้างเรือธง GeForce GTX 1080 โดยใช้โปรเซสเซอร์ GP104 ที่สมบูรณ์พร้อมเปิดใช้งานคลัสเตอร์การประมวลผลกราฟิกสี่กลุ่ม ได้การ์ดที่มีแกน CUDA 2560 และหน่วยพื้นผิว 160 หน่วย GTX 1070 มีศูนย์กลางอยู่ที่ GPU เดียวกันกับ GPC สามตัวที่เปิดใช้งานอยู่ เพิ่มได้มากถึง 1920 คอร์และ 120 หน่วยพื้นผิว
GeForce GTX 1060 ลดขนาดลงในลักษณะเดียวกันโดยใช้โครงสร้างทางสถาปัตยกรรมเดียวกัน จากการครอบคลุมการเปิดตัว GeForce GTX 1080 ของเรา:
“GPC แต่ละรายการประกอบด้วยคลัสเตอร์การประมวลผลเธรด/พื้นผิวและเอ็นจิ้นแรสเตอร์ห้ารายการ แยกย่อยออกไปอีก TPC รวมสตรีมมิ่งมัลติโปรเซสเซอร์หนึ่งตัวและเอ็นจิ้น PolyMorph SM รวมแกน CUDA ความแม่นยำเดียว 128 คอร์ ความจุไฟล์รีจิสเตอร์ 256KB หน่วยความจำที่ใช้ร่วมกัน 96KB แคช L1/พื้นผิว 48KB และหน่วยพื้นผิวแปดหน่วย ในขณะเดียวกัน เอ็นจิ้น PolyMorph รุ่นที่สี่นั้นรวมบล็อกของตรรกะใหม่ซึ่งอยู่ที่ส่วนท้ายของไปป์ไลน์เรขาคณิตและอยู่ข้างหน้ายูนิตแรสเตอร์สำหรับจัดการฟีเจอร์ Simultaneous Multi-Projection ของ Nvidia”
GPU
GeForce GTX 1060 (GP106)
GeForce GTX 980 (GM204)
ข้อความ
10
16
CUDA Cores
1280
2048
ฐานนาฬิกา
1506 MHz
1126 MHz
GPU Boost Clock
1708 MHz
1216 MHz
GFLOP (นาฬิกาฐาน)
3855
4612
หน่วยพื้นผิว
80
128
อัตราการเติมข้อความ
120.5 GT/วินาที
144.1 GT/วินาที
อัตราข้อมูลหน่วยความจำ
8 Gb/s
7 Gb/s
แบนด์วิดธ์หน่วยความจำ
192 GB/วินาที
224 GB/วินาที
ROPs
48
64
L2 Cache
1.5MB
2MB
TDP
120W
165W
ทรานซิสเตอร์
4.4 พันล้าน
5.2 พันล้าน
ขนาดตาย
200 มม²
398 มม²
โหนดกระบวนการ
16 นาโนเมตร
28 นาโนเมตร
GP106 มาพร้อมกับ GPC สองตัว ดังนั้นคุณจะได้แกน CUDA 1280 คอร์และหน่วยพื้นผิว 80 หน่วย ชิปนี้ได้รับประโยชน์จากการกำหนดเวลาที่เหมาะสมเช่นเดียวกันกับที่ทำให้ Nvidia เพิ่มอัตรานาฬิกาขึ้นบน GP104 ซึ่งอำนวยความสะดวกในความถี่พื้นฐานที่ 1506 MHz และอัตรา GPU Boost ทั่วไปที่ 1708 MHz
ส่วนแบ็คเอนด์ของโปรเซสเซอร์ก็ถูกตัดแต่งเช่นกัน ตัวควบคุมหน่วยความจำ 32 บิตหกตัวให้พาธข้อมูลรวม 192 บิต เช่นเดียวกับ GP104 ที่ใหญ่กว่า คอนโทรลเลอร์แต่ละตัวจะเชื่อมโยงกับ ROP แปดตัวและ L2 256KB ซึ่งเพิ่มได้มากถึง 48 ROP และแคช 1.5MB Nvidia ลด 8 GT/s GDDR5 ขนาด 6GB ลงบนบอร์ด โดยให้บริการทรูพุตสูงสุด 192 GB/s แม้ว่าตัวเลขนั้นจะต่ำกว่า 224 GB/s ของ GTX 980 ก็ตาม แต่อย่าลืมว่า Pascal ใช้เทคนิคแบบ lossless แบบใหม่เพื่อดึงการประหยัดในระบบย่อยหน่วยความจำ ซึ่งเพิ่มแบนด์วิดท์ที่ใช้งานได้อย่างมีประสิทธิภาพ ดัดแปลงจากความครอบคลุมของ GTX 1080 ของเรา “[GP106’s] การบีบอัดสีเดลต้าพยายามที่จะบรรลุการประหยัด 2: 1 และโหมดนี้ได้รับการปรับปรุงโดยอ้างว่าให้ใช้งานได้บ่อยขึ้น นอกจากนี้ยังมีโหมด 4: 1 ใหม่ที่ครอบคลุมกรณีที่มีความแตกต่างต่อพิกเซล มีขนาดเล็กมากและสามารถบีบอัดได้ในพื้นที่ที่น้อยลง ในที่สุด
แน่นอน GP106 ผลิตขึ้นโดยใช้กระบวนการ TSMC 16FF+ เดียวกันกับ GP104 ในขณะที่ GPU ที่ใหญ่กว่าประกอบด้วยทรานซิสเตอร์ 7.2 พันล้านตัวบนไดย์ขนาด 314 มม.² Nvidia บรรจุทรานซิสเตอร์ FinFET 4.4 พันล้านตัวลงใน 200 มม.² สำหรับ GP106 โปรเซสเซอร์ที่ไม่ซับซ้อน ประกอบกับหน่วยความจำที่น้อยลงใน PCA ที่ง่ายกว่า ส่งผลให้มี TDP 120W
อันดับแรก: ไม่มี SLI สำหรับกระแสหลักระดับบน
สังเกตเห็นการขาดตัวเชื่อมต่อ SLI ด้านบนหรือไม่? Nvidia แนะนำ GeForce GTX 1070 หรือ 1080 ให้กับนักเล่นเกมที่ต้องการประสิทธิภาพมากกว่า 1060 ที่ให้มา (แน่นอน) และไม่รองรับ SLI ใน 1060 โดยทั่วไปแล้วนี่คือบอร์ดระดับบนสุดที่เราจำได้โดยไม่ต้องใช้เทคโนโลยี แน่นอนว่า GeForce GTX 750 Ti ไม่มี แต่ 760 มี GeForce GTX 950 ก็เช่นกัน
อย่างเป็นทางการ Nvidia ตัดสินใจภายใน มีเกมเมอร์ไม่มากนักที่จับคู่ GPU กระแสหลัก และบริษัทไม่ต้องการกระจายทรัพยากรแบบบาง ดังนั้นจึงมุ่งเน้นไปที่การปรับ SLI ให้เหมาะสมบนการ์ด Pascal ที่เร็วขึ้น นอกเหนือจากคำอธิบายนั้นแล้ว การพัฒนาเกมเป็นไปในทิศทางที่แตกต่างกันด้วยเอฟเฟกต์หลังการประมวลผลและการประมวลผลเชิงคำนวณที่ไม่เป็นมิตรกับการเรนเดอร์เฟรมทางเลือก และด้วย DirectX 12 การควบคุมที่มากขึ้นจะเปลี่ยนไปใช้ ISV ที่ต้องการนำเนื้อหาออกมาโดยเร็วที่สุด นั่นหมายความว่างานส่วนใหญ่ที่ Nvidia เทลงในไดรเวอร์นั้นถูกหลีกเลี่ยง
เรามีเกมหนึ่งเกมในชุดของเราที่รองรับ GPU หลายตัวผ่าน DirectX 12: Ashes of the Singularity หลังจากเพิ่ม GeForce GTX 1060 ตัวที่สองและคลิกช่องทำเครื่องหมายหนึ่งช่อง เราจะเห็นการเร่งความเร็วดังต่อไปนี้:
แม้ว่าจะไม่ใช่การปรับขนาดแบบที่เราเคยเห็นจาก SLI แต่ ~50% ก็ไม่เลว ขออภัย เราไม่สามารถแม้แต่ทดลองกับเกม DirectX 11 และ DX12 โดยไม่รองรับอะแดปเตอร์หลายตัวในตัว
เนื่องจากการ์ดนี้เป็นการ์ดที่เน้น 1080p ทำให้ Nvidia สามารถเปิดใช้งาน SLI ย้อนหลังผ่าน PCI Express ผ่านการอัพเดตไดรเวอร์ และเราหวังว่าจะเป็นเช่นนั้น ไม่ว่านักเล่นเกมจะสนใจจับคู่การ์ด GTX 1060 สักเพียงใด แต่ก็ยังมีชื่อ DX11 มากมายที่ได้รับประโยชน์จากการกำหนดค่า mutli-GPU และปัญหาใดๆ ที่ GP106 ได้ตัดปัญหาการปรับขนาดที่กำหนดโดย DX12 จะมีผลกับการ์ดที่ใช้ GP104 ด้วยเช่นกัน ให้การเปรียบเทียบประสิทธิภาพเป็นตัวกำหนดว่า SLI’ed 1060s ที่น่าดึงดูดใจเพียงใด เราพูด
มองใกล้ขึ้นที่ GeForce GTX 1060 Founders Edition
Nvidia ยังคงใช้การออกแบบ 10 ซีรีส์ Founders Edition ที่ล้ำสมัยยิ่งขึ้น แม้ว่า GTX 1060 จะมีการใช้งานที่ถูกกว่าเมื่อเทียบกับรุ่น 1070 และ 1080
ไม่ได้หมายความว่าการ์ดใหม่มีขนาดเล็ก ยาว 25.4 ซม. (วัดจากฝาปิดช่องเสียบถึงปลายการ์ด) สูง 10.7 ซม. (วัดจากด้านบนของช่องเสียบเมนบอร์ดถึงด้านบนของการ์ด) และลึก 3.8 ซม. ในความเป็นจริง ความลึกของการ์ดเพียง 3.5 ซม. แต่ฝาครอบช่องจะยื่นออกมา 0.3 ซม.
ที่ 845g GeForce GTX 1060 Founders Edition ก็ไม่เบาเช่นกัน
การออกแบบ ความรู้สึก และตัวเชื่อมต่อ
เป็นอีกครั้งที่ Nvidia ใช้อะลูมิเนียมและพลาสติกผสมกันสำหรับห่อหุ้มการ์ด คราวนี้จะง่ายกว่าเล็กน้อย สามารถถอดฝาครอบรวมทั้งพัดลมออกได้ในชิ้นเดียว ที่ด้านบน เราจะพบโลโก้ GeForce GTX เรืองแสง พร้อมด้วยขั้วต่อสายไฟแบบหกพิน
แบ็คเอนด์ของ GeForce GTX 1060 นั้นแตกต่างจากการออกแบบก่อนหน้านี้เล็กน้อย การ์ดกราฟิกที่มี PCA สั้นมักมีช่องอากาศเข้าโดยที่ตัวทำความเย็นจะยื่นออกมาเหนือบอร์ด เพื่อให้บริการพัดลมเรเดียล 1060 มีฝาปิดแบบธรรมดาโดยไม่มีช่องเปิดแทน เนื่องจากความกังวลเรื่องราคาจึงทำให้ไม่มีแผ่นรองด้านหลัง
ด้านหลังของการ์ดแสดงภาพที่เราคุ้นเคย
แผง I/O คัดลอกมาจาก GeForce GTX 1080 และ 1070 ของ Nvidia โดยไม่มีการเปลี่ยนแปลงแม้แต่ครั้งเดียว โดดเด่นด้วยตัวเชื่อมต่อ DisplayPort สามตัว ซึ่งเข้ากันได้กับเวอร์ชัน 1.2 อย่างไรก็ตาม บริษัทเหล่านี้บอกเราว่าพวกเขาพร้อมสำหรับเวอร์ชัน 1.3 และ 1.4 ด้วยเช่นกัน ซึ่งตรงกับตัวควบคุมการแสดงผลของ GPU นอกจากนี้ยังมีขั้วต่อ HDMI 2.0 และขั้วต่อ DVI แบบดูอัลลิงค์ ไม่มีเอาต์พุตแบบอะนาล็อก
ดีไซน์คูลเลอร์ บอร์ด & พาวเวอร์ซัพพลาย
เมื่อหันความสนใจของเราเข้าไปข้างใน เราเอาผ้าห่อศพออกเพื่อแสดงโซลูชันการระบายความร้อนของ GeForce GTX 1060
ด้านบนเราสังเกตเห็นตำแหน่งแปลก ๆ ของขั้วต่อไฟในทันที มันตั้งอยู่ในส่วนหนึ่งของตัวทำความเย็นที่ยื่นออกมาเหนือ PCA จริง จำเป็นต้องใช้สายเคเบิลจำนวนหนึ่งเพื่อต่อเข้ากับบอร์ด
การนำไปใช้งานนั้นดูหรูหราและป้องกันไม่ให้พันธมิตรของ Nvidia สร้าง 1060 ที่สั้นลง แม้ว่าการ์ดจะมีความยาวเพียง 17.5 ซม. แต่ก็ไม่มีพื้นที่สำหรับเสียบปลั๊กไฟ
ถอดสกรูสี่ตัวที่ยึดตัวตัวทำความเย็นออกและหลุดออกมาทันที มีฮีตซิงก์ทองแดงขนาดใหญ่และโครงโลหะอยู่ข้างใต้ การออกแบบครีบระบายความร้อนแบบปิดทำให้เรานึกถึง GeForce GTX 1070 และควรให้ประสิทธิภาพเพียงพอกับ TDP 120W 1060 ของ 1060
กรอบการกักเก็บและระบายความร้อนขนาดใหญ่ทำหน้าที่สองหน้าที่โดยการรักษาทุกอย่างให้เข้าที่และทำให้วงจรควบคุมแรงดันไฟฟ้า/โมดูลหน่วยความจำเย็นลง
เมื่อปลดและถอดเฟรมแล้ว จะต้องพลิกขึ้นแล้วพลิกกลับ นี่เป็นเพราะสายเคเบิลที่เชื่อมต่อคอนเน็กเตอร์จ่ายไฟ PCIe แยกต่างหาก ซึ่งบัดกรีกับบอร์ดอย่างถาวร การทำเช่นนี้เผยให้เห็น PCA ที่เปลือยเปล่าในทุกความรุ่งโรจน์
ตามปกติแล้ว GPU จะอยู่ด้านหน้าและตรงกลาง GP106 นั้นค่อนข้างเล็กกว่า GP104 GPU ที่เราพบใน GeForce GTX 1080 และ 1070 ของ Nvidia เล็กน้อย ความแตกต่างระหว่างบอร์ดไม่ได้สิ้นสุดเพียงแค่นั้น
ใช้โมดูลหน่วยความจำเป็นตัวอย่าง มีสถานที่ตั้งเพียง 6 แห่งจาก 1060 แห่งที่ติดตั้ง Samsung K4G80325FB-HC25 GDDR5 มีความจุ 8Gb (32 x 256Mb) แต่ละตัวและทำงานได้ทุกที่ตั้งแต่ 1.305V ถึง 1.597V ขึ้นอยู่กับอัตรานาฬิกา ทั้งหมดนี้เป็นที่ที่เราได้รับข้อมูลจำเพาะ 6GB ของ 1060
ขออภัย ตัวควบคุม PWM ไม่ได้รับการบันทึก ผลิตโดย uPI Semiconductor และมีหมายเลขรุ่น uP9509 ซึ่งหมายความว่าน่าจะเป็นพี่น้องที่เล็กกว่าของ uP9511P (ตัวควบคุมหลังคือสิ่งที่เราพบว่าจับคู่กับโปรเซสเซอร์ GP104)
โมดูลหน่วยความจำและหนึ่งในเฟสของ GPU ได้รับพลังจากสล็อต PCIe ของเมนบอร์ด GPU สองเฟสที่เหลือและอุปกรณ์เสริมของการ์ดดึงพลังงานจากขั้วต่อไฟแบบหกพิน เราจะพิจารณาให้ละเอียดยิ่งขึ้นถึงความหมายในแง่ของการกระจายโหลดข้ามรางในหน้าถัดไป
เมื่อพูดถึงการควบคุมแรงดันไฟฟ้า Nvidia ใช้ Dual N-Channel MOSFET คือ E6930 ต่อเฟสสำหรับทั้งด้านสูงและต่ำ ไม่จำเป็นต้องใช้ไดรเวอร์เกทแยก ส่วนประกอบที่ผสานรวมอย่างดีนี้จะอธิบายพื้นที่ว่างบนกระดาน
สามเฟสของ GPU นั้นเพียงพอแล้ว และการกระจายของมันก็สมเหตุสมผลมากกว่า Radeon RX 480 ของ AMD
นอกเหนือจากคอนเน็กเตอร์จ่ายไฟแบบหกพินซึ่งดูเหมือนจะเลี้ยวผิดที่ใดที่หนึ่ง GeForce GTX 1060 อ้างอิงของ Nvidia ก็ดูดีทีเดียว และด้วยปริมาณความร้อนเหลือทิ้งที่ค่อนข้างต่ำ พัดลมแกนก็ไม่ใช่ตัวเลือกที่แย่เช่นกัน