Skip to content

รีวิว Nvidia GeForce GTX 1660: การโจมตีทัวริงยังคงดำเนินต่อไป

    1646061603

    คำตัดสินของเรา

    ใช้โปรเซสเซอร์ TU116 เดียวกันกับ GeForce GTX 1660 Ti ทำให้ GeForce GTX 1660 ของ Nvidia สูญเสียสตรีมมิ่งมัลติโปรเซสเซอร์สองตัวและเปลี่ยนหน่วยความจำ GDDR6 เป็น GDDR5 ที่ช้ากว่า เป็นผลให้มันยังคงเป็นตัวเลือกที่ยอดเยี่ยมสำหรับการเล่นเกมที่ 1920×1080 แต่ไม่แนะนำสำหรับ 2560×1440 เพียงให้แน่ใจว่าได้เปรียบเทียบร้านค้าก่อนตัดสินใจซื้อ ข้อเสนอสุดฮอตสำหรับการ์ด Radeon RX 580 อาจรับประกันได้ แม้ว่าประสิทธิภาพจะต่ำกว่าก็ตาม

    สำหรับ

    ประสิทธิภาพ 1080p ที่ยอดเยี่ยม
    ราคาน่าดึงดูดที่จุดเริ่มต้น 220 ดอลลาร์
    การใช้พลังงาน 120W ที่เหมาะสมช่วยให้ความร้อนและเสียงรบกวนต่ำ

    ขัดต่อ

    ไม่เหมาะสำหรับการเล่นเกม 1440p
    โปรไฟล์พลังงานใกล้เคียงกับ GeForce GTX 1660 Ti . ที่เร็วขึ้น

    รีวิว Nvidia GeForce GTX 1660

    เป็นเพียงเรื่องของเวลาก่อนที่ Nvidia จะใช้โปรเซสเซอร์กราฟิก TU116 ที่เก่าแก่ใน GeForce GTX 1660 Ti และแกะสลักขึ้นเล็กน้อยเพื่อสร้างอนุพันธ์ที่มีต้นทุนต่ำกว่า GeForce GTX 1660 ใหม่นั้นไม่น่าแปลกใจเลยที่คล้ายกับรุ่นไฮเอนด์เนื่องจากขาด RT และ Tensor cores อันเป็นเอกลักษณ์ของสถาปัตยกรรมทัวริง แต่มุ่งเป้าไปที่ทรัพยากรแบบ on-die เพื่อเร่งเกมแรสเตอร์ในปัจจุบัน

    Nvidia ไม่ได้ตัดทรัพยากรกลุ่มทรัพยากรของ TU116 มากนักในการสร้าง GeForce GTX 1660: ตัวประมวลผลสตรีมมิงหลายตัวถูกตัดออกโดยใช้แกน CUDA 128 คอร์และหน่วยพื้นผิวแปดหน่วย แต่ GPU นั้นค่อนข้างสมบูรณ์ การสูญเสียครั้งใหญ่ที่สุดของการ์ดใบนี้คือการขาดหน่วยความจำ GDDR6 ด้วยการสลับเป็น 8 Gb/s GDDR5 แทน แบนด์วิดท์จะลดลงจาก 1660 Ti ที่ 288 GB/s เหลือเพียง 192 GB/s

    Nvidia Geforce GTX 1660 (Nvidia) ที่ Amazon ราคา $605.32

    โดยธรรมชาติแล้ว GeForce GTX 1660 มุ่งเป้าไปที่การเล่นเกม FHD เป็นหลัก โดยที่หน่วยความจำที่ช้ากว่า 6GB จะไม่กระทบต่อประสิทธิภาพการทำงานมากเท่ากับที่ความละเอียดที่สูงขึ้น บอร์ด $220/£200 สามารถรักษาอัตราเฟรมให้เร็วพอที่จะป้องกัน Radeon RX 590 ของ AMD ด้วย GDDR5 ที่มากกว่าบนบัสที่กว้างขึ้นได้หรือไม่?

    สรุป TU116: ทัวริงที่ไม่มี RT และแกนเทนเซอร์

    GPU ที่เป็นหัวใจสำคัญของ GeForce GTX 1660 มีชื่อว่า TU116-300-A1 โดยเฉพาะ เป็นญาติสนิทของ TU116-400-A1 ของ GeForce GTX 1660 Ti ที่ถูกตัดจาก 24 Streaming Multiprocessors เป็น 22 เห็นได้ชัดว่าเรายังคงจัดการกับโปรเซสเซอร์ที่ไม่มี RT และ Tensor core ในอนาคตของ Nvidia ซึ่งมีขนาด 284mm²และประกอบด้วย 6.6 พันล้านทรานซิสเตอร์ที่ผลิตขึ้นโดยใช้กระบวนการ 12nm FinFET ของ TSMC

    แม้จะมีทรานซิสเตอร์ที่เล็กกว่า แต่ TU116 นั้นใหญ่กว่าโปรเซสเซอร์ GP106 ก่อนหน้าถึง 42 เปอร์เซ็นต์ การเติบโตบางส่วนนั้นเกิดจากเชดเดอร์ที่ซับซ้อนกว่าของสถาปัตยกรรมทัวริง เช่นเดียวกับการ์ด GeForce RTX 20 ระดับไฮเอนด์ GeForce GTX 1660 รองรับการดำเนินการคำสั่งเลขคณิต FP32 พร้อมกัน ซึ่งเป็นปริมาณงาน shader ส่วนใหญ่ และการทำงานของ INT32 (สำหรับการกำหนดที่อยู่/ดึงข้อมูล จุดลอยตัวต่ำสุด/สูงสุด เปรียบเทียบ ฯลฯ ). เมื่อคุณได้ยินว่าแกนทัวริงมีประสิทธิภาพที่ดีกว่า Pascal ที่อัตราสัญญาณนาฬิกาที่กำหนด ความสามารถนี้จะอธิบายได้มากว่าทำไม

    มัลติโพรเซสเซอร์แบบสตรีมมิ่งของทัวริงประกอบด้วยคอร์ CUDA น้อยกว่าของ Pascal แต่การออกแบบจะชดเชยบางส่วนด้วยการกระจาย SMs ให้มากขึ้นใน GPU แต่ละตัว สถาปัตยกรรมที่ใหม่กว่ากำหนดหนึ่งตัวจัดกำหนดการให้กับแต่ละชุดของแกน CUDA 16 คอร์ (2x Pascal) พร้อมกับหนึ่งหน่วยการจัดส่งต่อ 16 คอร์ CUDA (เหมือนกับ Pascal) การจัดกลุ่ม 16 คอร์สี่กลุ่มประกอบด้วย SM พร้อมด้วยแคช 96KB ที่สามารถกำหนดค่าเป็นหน่วยความจำที่ใช้ร่วมกัน 64KB L1/32KB หรือในทางกลับกัน และหน่วยพื้นผิวสี่หน่วย เนื่องจากทัวริงเพิ่มตัวจัดกำหนดการเป็นสองเท่า จึงจำเป็นต้องออกคำสั่งไปยังแกน CUDA ทุกรอบนาฬิกาอื่น ๆ เพื่อให้เต็มเท่านั้น ในระหว่างนั้น ออกคำสั่งที่แตกต่างจากหน่วยอื่น ๆ ได้ฟรี รวมถึงคอร์ INT32

    ใน TU116 Nvidia แทนที่คอร์เทนเซอร์ของทัวริงด้วยคอร์ FP16 เฉพาะ 128 คอร์ต่อ SM ซึ่งทำให้ GeForce GTX 1660 ประมวลผลการทำงานแบบครึ่งความแม่นยำที่อัตรา 2x ของ FP32 GPU ที่ใช้ทัวริงอื่นๆ มี FP16 ที่มีอัตราสองเท่าเช่นกันผ่านแกนเทนเซอร์ ดังนั้นการกำหนดค่าของ TU116 จึงทำหน้าที่รักษามาตรฐานนั้นผ่านฮาร์ดแวร์ที่ติดตั้งไว้สำหรับ GPU นี้โดยเฉพาะ แผนภูมิต่อไปนี้เป็นเวอร์ชันอัปเดตของรุ่นที่เผยแพร่ในการตรวจสอบ GeForce GTX 1660 Ti ของเรา ซึ่งแสดงให้เห็นถึงการปรับปรุงครั้งใหญ่ของ TU116 ในด้านปริมาณงานที่มีความแม่นยำเพียงครึ่งเดียว เมื่อเทียบกับ GeForce GTX 1060 และชิป GP106 ที่ใช้ Pascal

    เมื่อเรารันโมดูลการวิเคราะห์ทางวิทยาศาสตร์ของ Sandra ซึ่งทดสอบการคูณเมทริกซ์ทั่วไป เราจะเห็นว่า Tensor Core ของ FP16 ที่รับส่งข้อมูล TU106 บรรลุผลได้มากเพียงใดเมื่อเทียบกับ TU116 GeForce GTX 1060 ซึ่งรองรับเฉพาะ FP16 แบบสัญลักษณ์ แทบไม่ลงทะเบียนบนแผนภูมิเลย

    นอกเหนือจาก shaders ของสถาปัตยกรรมทัวริงและแคชแบบรวมแล้ว TU116 ยังสนับสนุนอัลกอริธึมคู่หนึ่งที่เรียกว่า Content Adaptive Shading และ Motion Adaptive Shading ซึ่งเรียกรวมกันว่า Variable Rate Shading เราครอบคลุมเทคโนโลยีนี้ใน Turing Architecture Explored ของ Nvidia: ภายใน GeForce RTX 2080 เรื่องราวดังกล่าวยังแนะนำความสามารถในการเข้ารหัสและถอดรหัสวิดีโอที่เร่งความเร็วของ Turing ซึ่งส่งต่อไปยัง GeForce GTX 1660 ด้วยเช่นกัน

    วางมันทั้งหมดเข้าด้วยกัน…

    Nvidia บรรจุ 24 SMs ลงใน TU116 โดยแยกออกเป็นสามกลุ่มการประมวลผลกราฟิก ด้วย 64 FP32 คอร์ต่อ SM นั่นคือ 1,536 CUDA คอร์และ 96 หน่วยพื้นผิวใน GPU ทั้งหมด ในการสูญเสีย SM สองตัว GeForce GTX 1660 จบลงด้วย 1,408 คอร์ที่ใช้งาน CUDA และหน่วยพื้นผิวที่ใช้งานได้ 88 หน่วย

    พันธมิตรคณะกรรมการจะกำหนดเป้าหมายช่วงความถี่อย่างไม่ต้องสงสัยเพื่อสร้างความแตกต่างให้กับการ์ดของพวกเขา อย่างไรก็ตาม อัตรานาฬิกาพื้นฐานอย่างเป็นทางการคือ 1,530 MHz พร้อมข้อกำหนด GPU Boost ที่ 1,785 MHz ตัวเลขทั้งสองนั้นสูงกว่านาฬิกาของ GeForce GTX 1660 Ti เล็กน้อย แม้ว่าจะไม่สามารถชดเชย SM ที่หายไปได้ทั้งหมด

    ตัวอย่าง Gigabyte GeForce GTX 1660 OC 6G ของเรารักษาความเร็วไว้ที่ 1,935 MHz ผ่าน Metro: Last Light สามรอบ ซึ่งทำงานเร็วกว่า 1660 Ti ที่เราตรวจสอบเมื่อไม่กี่สัปดาห์ก่อนประมาณ 90 MHz บนกระดาษ GeForce GTX 1660 ให้ประสิทธิภาพ FP32 สูงสุด 5 TFLOPS และปริมาณงาน FP16 10 TFLOPS

    ตัวควบคุมหน่วยความจำ 32 บิตหกตัวทำให้ TU116 มีบัสรวม 192 บิต ซึ่งบรรจุโดยโมดูล GDDR5 8 Gb/s ที่พุชสูงสุด 192 GB/s ซึ่งเทียบได้กับ GeForce GTX 1060 6GB และลดลง 33% เมื่อเทียบกับ GeForce GTX 1660 Ti เมื่อรวมกับการสูญเสีย SM สองตัว การลดลงของหน่วยความจำจาก GDDR6 เป็น GDDR5 ทำให้ GeForce GTX 1660 มีประสิทธิภาพที่ต่ำกว่าเมื่อเทียบกับ 1660 Ti

    ตัวควบคุมหน่วยความจำแต่ละตัวเชื่อมโยงกับ ROP แปดตัวและแคช L2 ขนาด 256KB โดยรวมแล้ว TU116 เปิดเผย 48 ROPs และ 1.5MB ของ L2 จำนวน ROP ของ GeForce GTX 1660 นั้นเปรียบเทียบได้ดีกับ RTX 2060 ซึ่งใช้เอาต์พุตการเรนเดอร์ 48 รายการด้วย แต่ชิ้นส่วนแคช L2 ของ TU116 นั้นใหญ่เป็นครึ่งหนึ่งเมื่อเทียบกับ TU106

    เนื่องจากมีความคล้ายคลึงกันกับ GeForce GTX 1660 Ti จึงไม่น่าแปลกใจที่ GeForce GTX 1660 จะได้รับการจัดอันดับที่ 120W เท่ากัน ขออภัย การ์ดกราฟิกทั้งสองไม่รองรับ GPU หลายตัว Nvidia ยังคงผลักดันการบรรยายต่อไปว่า SLI มีขึ้นเพื่อขับเคลื่อนประสิทธิภาพที่สมบูรณ์ยิ่งขึ้น แทนที่จะให้เกมเมอร์มีวิธีการจับคู่การกำหนดค่า GPU เดียว

    Gigabyte GeForce GTX 1660 OC 6GGeForce GTX 1660 TiGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1070 FE Architecture (GPU) CUDA Cores Peak FP32 คำนวณ Tensor Cores RT Cores Texture Units อัตรานาฬิกาพื้นฐาน GPU Boost Rate ความจุหน่วยความจำ บัสหน่วยความจำ แบนด์วิดท์หน่วยความจำ ROPs L2 Cache TDP Transistor รองรับขนาด SLI ของ Count Die

    ทัวริง (TU116)
    ทัวริง (TU116)
    ทัวริง (TU106)
    ปาสกาล (GP106)
    ปาสกาล (GP104)

    1408
    1536
    1920
    1280
    1920

    5 TFLOPS
    5.4 TFLOPS
    6.45 TLFOPS
    4.4 TFLOPS
    6.5 TFLOPS

    ไม่มี
    ไม่มี
    240
    ไม่มี
    ไม่มี

    ไม่มี
    ไม่มี
    30
    ไม่มี
    ไม่มี

    88
    96
    120
    80
    120

    1530 MHz
    1500 MHz
    1365 MHz
    1506 MHz
    1506 MHz

    1785 MHz
    1770 MHz
    1680 MHz
    1708 MHz
    1683 MHz

    6GB GDDR5
    6GB GDDR6
    6GB GDDR6
    6GB GDDR5
    8GB GDDR5

    192 บิต
    192 บิต
    192 บิต
    192 บิต
    256 บิต

    192 GB/วินาที
    288 GB/วินาที
    336 GB/วินาที
    192 GB/วินาที
    256 GB/วินาที

    48
    48
    48
    48
    64

    1.5MB
    1.5MB
    3MB
    1.5MB
    2MB

    120W
    120W
    160W
    120W
    150W

    6.6 พันล้าน
    6.6 พันล้าน
    10.8 พันล้าน
    4.4 พันล้าน
    7.2 พันล้าน

    284 มม²
    284 มม²
    445 มม²
    200 มม²
    314 mm²

    ไม่
    ไม่
    ไม่
    ไม่
    ใช่ (MIO)

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x