คำตัดสินของเรา
ใช้โปรเซสเซอร์ TU116 เดียวกันกับ GeForce GTX 1660 Ti ทำให้ GeForce GTX 1660 ของ Nvidia สูญเสียสตรีมมิ่งมัลติโปรเซสเซอร์สองตัวและเปลี่ยนหน่วยความจำ GDDR6 เป็น GDDR5 ที่ช้ากว่า เป็นผลให้มันยังคงเป็นตัวเลือกที่ยอดเยี่ยมสำหรับการเล่นเกมที่ 1920×1080 แต่ไม่แนะนำสำหรับ 2560×1440 เพียงให้แน่ใจว่าได้เปรียบเทียบร้านค้าก่อนตัดสินใจซื้อ ข้อเสนอสุดฮอตสำหรับการ์ด Radeon RX 580 อาจรับประกันได้ แม้ว่าประสิทธิภาพจะต่ำกว่าก็ตาม
สำหรับ
ประสิทธิภาพ 1080p ที่ยอดเยี่ยม
ราคาน่าดึงดูดที่จุดเริ่มต้น 220 ดอลลาร์
การใช้พลังงาน 120W ที่เหมาะสมช่วยให้ความร้อนและเสียงรบกวนต่ำ
ขัดต่อ
ไม่เหมาะสำหรับการเล่นเกม 1440p
โปรไฟล์พลังงานใกล้เคียงกับ GeForce GTX 1660 Ti . ที่เร็วขึ้น
รีวิว Nvidia GeForce GTX 1660
เป็นเพียงเรื่องของเวลาก่อนที่ Nvidia จะใช้โปรเซสเซอร์กราฟิก TU116 ที่เก่าแก่ใน GeForce GTX 1660 Ti และแกะสลักขึ้นเล็กน้อยเพื่อสร้างอนุพันธ์ที่มีต้นทุนต่ำกว่า GeForce GTX 1660 ใหม่นั้นไม่น่าแปลกใจเลยที่คล้ายกับรุ่นไฮเอนด์เนื่องจากขาด RT และ Tensor cores อันเป็นเอกลักษณ์ของสถาปัตยกรรมทัวริง แต่มุ่งเป้าไปที่ทรัพยากรแบบ on-die เพื่อเร่งเกมแรสเตอร์ในปัจจุบัน
Nvidia ไม่ได้ตัดทรัพยากรกลุ่มทรัพยากรของ TU116 มากนักในการสร้าง GeForce GTX 1660: ตัวประมวลผลสตรีมมิงหลายตัวถูกตัดออกโดยใช้แกน CUDA 128 คอร์และหน่วยพื้นผิวแปดหน่วย แต่ GPU นั้นค่อนข้างสมบูรณ์ การสูญเสียครั้งใหญ่ที่สุดของการ์ดใบนี้คือการขาดหน่วยความจำ GDDR6 ด้วยการสลับเป็น 8 Gb/s GDDR5 แทน แบนด์วิดท์จะลดลงจาก 1660 Ti ที่ 288 GB/s เหลือเพียง 192 GB/s
Nvidia Geforce GTX 1660 (Nvidia) ที่ Amazon ราคา $605.32
โดยธรรมชาติแล้ว GeForce GTX 1660 มุ่งเป้าไปที่การเล่นเกม FHD เป็นหลัก โดยที่หน่วยความจำที่ช้ากว่า 6GB จะไม่กระทบต่อประสิทธิภาพการทำงานมากเท่ากับที่ความละเอียดที่สูงขึ้น บอร์ด $220/£200 สามารถรักษาอัตราเฟรมให้เร็วพอที่จะป้องกัน Radeon RX 590 ของ AMD ด้วย GDDR5 ที่มากกว่าบนบัสที่กว้างขึ้นได้หรือไม่?
สรุป TU116: ทัวริงที่ไม่มี RT และแกนเทนเซอร์
GPU ที่เป็นหัวใจสำคัญของ GeForce GTX 1660 มีชื่อว่า TU116-300-A1 โดยเฉพาะ เป็นญาติสนิทของ TU116-400-A1 ของ GeForce GTX 1660 Ti ที่ถูกตัดจาก 24 Streaming Multiprocessors เป็น 22 เห็นได้ชัดว่าเรายังคงจัดการกับโปรเซสเซอร์ที่ไม่มี RT และ Tensor core ในอนาคตของ Nvidia ซึ่งมีขนาด 284mm²และประกอบด้วย 6.6 พันล้านทรานซิสเตอร์ที่ผลิตขึ้นโดยใช้กระบวนการ 12nm FinFET ของ TSMC
แม้จะมีทรานซิสเตอร์ที่เล็กกว่า แต่ TU116 นั้นใหญ่กว่าโปรเซสเซอร์ GP106 ก่อนหน้าถึง 42 เปอร์เซ็นต์ การเติบโตบางส่วนนั้นเกิดจากเชดเดอร์ที่ซับซ้อนกว่าของสถาปัตยกรรมทัวริง เช่นเดียวกับการ์ด GeForce RTX 20 ระดับไฮเอนด์ GeForce GTX 1660 รองรับการดำเนินการคำสั่งเลขคณิต FP32 พร้อมกัน ซึ่งเป็นปริมาณงาน shader ส่วนใหญ่ และการทำงานของ INT32 (สำหรับการกำหนดที่อยู่/ดึงข้อมูล จุดลอยตัวต่ำสุด/สูงสุด เปรียบเทียบ ฯลฯ ). เมื่อคุณได้ยินว่าแกนทัวริงมีประสิทธิภาพที่ดีกว่า Pascal ที่อัตราสัญญาณนาฬิกาที่กำหนด ความสามารถนี้จะอธิบายได้มากว่าทำไม
มัลติโพรเซสเซอร์แบบสตรีมมิ่งของทัวริงประกอบด้วยคอร์ CUDA น้อยกว่าของ Pascal แต่การออกแบบจะชดเชยบางส่วนด้วยการกระจาย SMs ให้มากขึ้นใน GPU แต่ละตัว สถาปัตยกรรมที่ใหม่กว่ากำหนดหนึ่งตัวจัดกำหนดการให้กับแต่ละชุดของแกน CUDA 16 คอร์ (2x Pascal) พร้อมกับหนึ่งหน่วยการจัดส่งต่อ 16 คอร์ CUDA (เหมือนกับ Pascal) การจัดกลุ่ม 16 คอร์สี่กลุ่มประกอบด้วย SM พร้อมด้วยแคช 96KB ที่สามารถกำหนดค่าเป็นหน่วยความจำที่ใช้ร่วมกัน 64KB L1/32KB หรือในทางกลับกัน และหน่วยพื้นผิวสี่หน่วย เนื่องจากทัวริงเพิ่มตัวจัดกำหนดการเป็นสองเท่า จึงจำเป็นต้องออกคำสั่งไปยังแกน CUDA ทุกรอบนาฬิกาอื่น ๆ เพื่อให้เต็มเท่านั้น ในระหว่างนั้น ออกคำสั่งที่แตกต่างจากหน่วยอื่น ๆ ได้ฟรี รวมถึงคอร์ INT32
ใน TU116 Nvidia แทนที่คอร์เทนเซอร์ของทัวริงด้วยคอร์ FP16 เฉพาะ 128 คอร์ต่อ SM ซึ่งทำให้ GeForce GTX 1660 ประมวลผลการทำงานแบบครึ่งความแม่นยำที่อัตรา 2x ของ FP32 GPU ที่ใช้ทัวริงอื่นๆ มี FP16 ที่มีอัตราสองเท่าเช่นกันผ่านแกนเทนเซอร์ ดังนั้นการกำหนดค่าของ TU116 จึงทำหน้าที่รักษามาตรฐานนั้นผ่านฮาร์ดแวร์ที่ติดตั้งไว้สำหรับ GPU นี้โดยเฉพาะ แผนภูมิต่อไปนี้เป็นเวอร์ชันอัปเดตของรุ่นที่เผยแพร่ในการตรวจสอบ GeForce GTX 1660 Ti ของเรา ซึ่งแสดงให้เห็นถึงการปรับปรุงครั้งใหญ่ของ TU116 ในด้านปริมาณงานที่มีความแม่นยำเพียงครึ่งเดียว เมื่อเทียบกับ GeForce GTX 1060 และชิป GP106 ที่ใช้ Pascal
เมื่อเรารันโมดูลการวิเคราะห์ทางวิทยาศาสตร์ของ Sandra ซึ่งทดสอบการคูณเมทริกซ์ทั่วไป เราจะเห็นว่า Tensor Core ของ FP16 ที่รับส่งข้อมูล TU106 บรรลุผลได้มากเพียงใดเมื่อเทียบกับ TU116 GeForce GTX 1060 ซึ่งรองรับเฉพาะ FP16 แบบสัญลักษณ์ แทบไม่ลงทะเบียนบนแผนภูมิเลย
นอกเหนือจาก shaders ของสถาปัตยกรรมทัวริงและแคชแบบรวมแล้ว TU116 ยังสนับสนุนอัลกอริธึมคู่หนึ่งที่เรียกว่า Content Adaptive Shading และ Motion Adaptive Shading ซึ่งเรียกรวมกันว่า Variable Rate Shading เราครอบคลุมเทคโนโลยีนี้ใน Turing Architecture Explored ของ Nvidia: ภายใน GeForce RTX 2080 เรื่องราวดังกล่าวยังแนะนำความสามารถในการเข้ารหัสและถอดรหัสวิดีโอที่เร่งความเร็วของ Turing ซึ่งส่งต่อไปยัง GeForce GTX 1660 ด้วยเช่นกัน
วางมันทั้งหมดเข้าด้วยกัน…
Nvidia บรรจุ 24 SMs ลงใน TU116 โดยแยกออกเป็นสามกลุ่มการประมวลผลกราฟิก ด้วย 64 FP32 คอร์ต่อ SM นั่นคือ 1,536 CUDA คอร์และ 96 หน่วยพื้นผิวใน GPU ทั้งหมด ในการสูญเสีย SM สองตัว GeForce GTX 1660 จบลงด้วย 1,408 คอร์ที่ใช้งาน CUDA และหน่วยพื้นผิวที่ใช้งานได้ 88 หน่วย
พันธมิตรคณะกรรมการจะกำหนดเป้าหมายช่วงความถี่อย่างไม่ต้องสงสัยเพื่อสร้างความแตกต่างให้กับการ์ดของพวกเขา อย่างไรก็ตาม อัตรานาฬิกาพื้นฐานอย่างเป็นทางการคือ 1,530 MHz พร้อมข้อกำหนด GPU Boost ที่ 1,785 MHz ตัวเลขทั้งสองนั้นสูงกว่านาฬิกาของ GeForce GTX 1660 Ti เล็กน้อย แม้ว่าจะไม่สามารถชดเชย SM ที่หายไปได้ทั้งหมด
ตัวอย่าง Gigabyte GeForce GTX 1660 OC 6G ของเรารักษาความเร็วไว้ที่ 1,935 MHz ผ่าน Metro: Last Light สามรอบ ซึ่งทำงานเร็วกว่า 1660 Ti ที่เราตรวจสอบเมื่อไม่กี่สัปดาห์ก่อนประมาณ 90 MHz บนกระดาษ GeForce GTX 1660 ให้ประสิทธิภาพ FP32 สูงสุด 5 TFLOPS และปริมาณงาน FP16 10 TFLOPS
ตัวควบคุมหน่วยความจำ 32 บิตหกตัวทำให้ TU116 มีบัสรวม 192 บิต ซึ่งบรรจุโดยโมดูล GDDR5 8 Gb/s ที่พุชสูงสุด 192 GB/s ซึ่งเทียบได้กับ GeForce GTX 1060 6GB และลดลง 33% เมื่อเทียบกับ GeForce GTX 1660 Ti เมื่อรวมกับการสูญเสีย SM สองตัว การลดลงของหน่วยความจำจาก GDDR6 เป็น GDDR5 ทำให้ GeForce GTX 1660 มีประสิทธิภาพที่ต่ำกว่าเมื่อเทียบกับ 1660 Ti
ตัวควบคุมหน่วยความจำแต่ละตัวเชื่อมโยงกับ ROP แปดตัวและแคช L2 ขนาด 256KB โดยรวมแล้ว TU116 เปิดเผย 48 ROPs และ 1.5MB ของ L2 จำนวน ROP ของ GeForce GTX 1660 นั้นเปรียบเทียบได้ดีกับ RTX 2060 ซึ่งใช้เอาต์พุตการเรนเดอร์ 48 รายการด้วย แต่ชิ้นส่วนแคช L2 ของ TU116 นั้นใหญ่เป็นครึ่งหนึ่งเมื่อเทียบกับ TU106
เนื่องจากมีความคล้ายคลึงกันกับ GeForce GTX 1660 Ti จึงไม่น่าแปลกใจที่ GeForce GTX 1660 จะได้รับการจัดอันดับที่ 120W เท่ากัน ขออภัย การ์ดกราฟิกทั้งสองไม่รองรับ GPU หลายตัว Nvidia ยังคงผลักดันการบรรยายต่อไปว่า SLI มีขึ้นเพื่อขับเคลื่อนประสิทธิภาพที่สมบูรณ์ยิ่งขึ้น แทนที่จะให้เกมเมอร์มีวิธีการจับคู่การกำหนดค่า GPU เดียว
Gigabyte GeForce GTX 1660 OC 6GGeForce GTX 1660 TiGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FE Architecture (GPU) CUDA Cores Peak FP32 คำนวณ Tensor Cores RT Cores Texture Units อัตรานาฬิกาพื้นฐาน GPU Boost Rate ความจุหน่วยความจำ บัสหน่วยความจำ แบนด์วิดท์หน่วยความจำ ROPs L2 Cache TDP Transistor รองรับขนาด SLI ของ Count Die
ทัวริง (TU116)
ทัวริง (TU116)
ทัวริง (TU106)
ปาสกาล (GP106)
ปาสกาล (GP104)
1408
1536
1920
1280
1920
5 TFLOPS
5.4 TFLOPS
6.45 TLFOPS
4.4 TFLOPS
6.5 TFLOPS
ไม่มี
ไม่มี
240
ไม่มี
ไม่มี
ไม่มี
ไม่มี
30
ไม่มี
ไม่มี
88
96
120
80
120
1530 MHz
1500 MHz
1365 MHz
1506 MHz
1506 MHz
1785 MHz
1770 MHz
1680 MHz
1708 MHz
1683 MHz
6GB GDDR5
6GB GDDR6
6GB GDDR6
6GB GDDR5
8GB GDDR5
192 บิต
192 บิต
192 บิต
192 บิต
256 บิต
192 GB/วินาที
288 GB/วินาที
336 GB/วินาที
192 GB/วินาที
256 GB/วินาที
48
48
48
48
64
1.5MB
1.5MB
3MB
1.5MB
2MB
120W
120W
160W
120W
150W
6.6 พันล้าน
6.6 พันล้าน
10.8 พันล้าน
4.4 พันล้าน
7.2 พันล้าน
284 มม²
284 มม²
445 มม²
200 มม²
314 mm²
ไม่
ไม่
ไม่
ไม่
ใช่ (MIO)