Skip to content

รีวิว AMD Radeon RX 480 8GB

    1650103202

    พบกับ Polaris 10

    เมื่อ 6 เดือนที่แล้ว AMD เริ่มล้อเล่นฟีเจอร์ที่ GPU รุ่นต่อไปจะนำเสนอ โดยเริ่มจากตัวควบคุมการแสดงผลที่ปรับปรุงใหม่เพื่อรองรับ HDMI 2.0b และ DisplayPort 1.3 HBR3, FreeSync ผ่าน HDMI และไปป์ไลน์ที่รองรับ HDR สิ่งเล็กๆ น้อยๆ ปรากฏขึ้นในช่วงหลายสัปดาห์ต่อมา โดยชี้ไปที่การเปิดตัวซึ่งรวมถึง GPU สองตัวที่แตกต่างกันซึ่งสร้างขึ้นโดยเจตนาเพื่อเรียกคืนส่วนแบ่งการตลาดในตลาดเดสก์ท็อปหลัก และนำเสนอโซลูชันมือถือที่นำเสนอประสิทธิภาพระดับคอนโซลในรูปแบบที่บางและเบา

    การออกแบบหลังนั้นประกอบด้วยหน่วยประมวลผลของ AMD 16 ตัวที่จับคู่กับบัสหน่วยความจำ 128 บิตและการเร่งความเร็วการเข้ารหัส/ถอดรหัสวิดีโอ 4K มันยังคงเตรียมพร้อม Radeon RX 480 ที่เรามีในวันนี้นั้นใช้การออกแบบ Polaris 10 ที่ใหญ่ขึ้น แต่ก็ไม่ได้ใหญ่มากในแง่ที่ว่าโปรเซสเซอร์ GP100 ทรานซิสเตอร์ 15.3 พันล้านตัวของ Nvidia นั้นมีขนาดใหญ่ แต่ GPU นั้นซับซ้อนพอที่จะขับเคลื่อนชุดหูฟังเสมือนจริงระดับไฮเอนด์ในปัจจุบัน อย่างน้อยก็ในกลุ่ม Radeon R9 290 ของ AMD และ GeForce GTX 970 ของ Nvidia

    ประสิทธิภาพระดับกลางจะไม่ทำให้ใครผิดหวังโดยเฉพาะอย่างยิ่งหนึ่งเดือนหลังจาก GP104 กำหนดระดับไฮเอนด์ใหม่ แต่ด้วยการกำหนดราคา Radeon RX 480 ซึ่งต่ำกว่าบอร์ดแบบเร็วที่ใกล้เคียงกันและการจำกัดการใช้พลังงานไว้ที่ 150W, AMD หวังว่าจะทำให้ VR สามารถเข้าถึงเกมเมอร์ได้มากขึ้น

    เราคาดว่า Radeon RX 480 สองเวอร์ชัน: รุ่น 200 ดอลลาร์พร้อม GDDR5 ออนบอร์ด 4GB ที่ทำงานที่ 7 Gb/s และรุ่น 240 ดอลลาร์พร้อม GDDR5 8GB 8 Gb/s แน่นอนว่าเรามี 8GB ในมืออยู่แล้ว

    ด้านในของ Polaris 10

    Polaris 10 ประกอบด้วยทรานซิสเตอร์ 5.7 พันล้านตัวบนไดย์ขนาด 230 มม.² เปรียบเทียบกับทรานซิสเตอร์ 6.2 พันล้านของฮาวายบนไดย์ขนาด 438 มม.² ดังที่คุณเห็นในหน้ามาตรฐานของเรา โดยทั่วไปแล้ว RX 480 จะอยู่ระหว่าง R9 290 ถึง 390…โดยมีทรานซิสเตอร์น้อยกว่าและประมาณ 55% ของงบประมาณด้านพลังงาน สิ่งเหล่านี้ส่วนใหญ่มาจากกระบวนการ FinFET ขนาด 14 นาโนเมตรของ GlobalFoundries ซึ่ง AMD ให้เครดิตในการส่งมอบประสิทธิภาพพื้นฐานและประโยชน์ด้านพลังงานเหนือทรานซิสเตอร์ระนาบของโหนด 28 นาโนเมตร ที่ระดับพลังงานที่กำหนด FinFET เปิดใช้งานนาฬิกาที่สูงขึ้น ที่ความถี่ที่เลือก อุปกรณ์ 14nm จะใช้พลังงานน้อยกว่า สำหรับ Polaris เอเอ็มดีกำลังคว้าจากทั้งสองถังขยะเพื่อเพิ่มอัตรานาฬิกาและลดการบริโภค นั่นเป็นวิธีที่มีประสิทธิภาพเหนือกว่า GPU ที่มีทรัพยากรมากเช่นฮาวายที่เพดาน 150W (แม้ว่าการวัดของเราจะแสดง RX 480 เหลวไหลเล็กน้อยบน TDP)

    แม้จะมีชื่อรหัสใหม่ แต่ Polaris 10 ก็มีพื้นฐานมาจากการนำสถาปัตยกรรมกราฟิก Core Next ของ AMD ไปใช้ในเจนเนอเรชั่นที่สี่ เมื่อคำนึงถึงสิ่งนี้ ผู้ที่ชื่นชอบ GCN ส่วนใหญ่อยู่แล้วจะรู้จักโครงสร้างพื้นฐานของการออกแบบ Polaris ซึ่งทำให้ขั้นตอนการออกแบบของเราค่อนข้างตรงไปตรงมา

    ข้อมูลจำเพาะ

    AMD Radeon RX 480

    AMD Radeon R9 390

    AMD Radeon R9 290

    ตัวประมวลผลคำสั่งกราฟิกตัวเดียวยังคงรับผิดชอบในการจัดส่งคิวกราฟิกไปยัง Shader Engines เช่นเดียวกับ Asynchronous Compute Engines ที่ได้รับมอบหมายให้จัดการคิวการประมวลผล เฉพาะตอนนี้ AMD เท่านั้นที่กล่าวว่าตรรกะการประมวลผลคำสั่งประกอบด้วย ACE สี่ตัวแทนที่จะเป็นแปดหน่วย โดยมีอุปกรณ์จัดกำหนดการฮาร์ดแวร์สองหน่วยสำหรับคิวที่มีลำดับความสำคัญ การจัดการทรัพยากรชั่วคราว/เชิงพื้นที่ และการปิดงานการจัดกำหนดการโปรแกรมควบคุมโหมดเคอร์เนลของ CPU สิ่งเหล่านี้ไม่ใช่บล็อกที่แยกจากกันหรือสร้างใหม่โดยลำพัง แต่เป็นโหมดทางเลือกที่ไปป์ไลน์ที่มีอยู่สามารถเรียกใช้ได้ Dave Nalasco ผู้จัดการฝ่ายเทคโนโลยีอาวุโสสำหรับกราฟิกที่ AMD ช่วยชี้แจงวัตถุประสงค์:

    “HWS (Hardware Workgroup/Wavefront Schedulers) เป็นไพพ์ไลน์ ACE ที่ได้รับการกำหนดค่าโดยไม่มีตัวควบคุมการจัดส่ง หน้าที่ของพวกเขาคือออฟโหลด CPU โดยจัดการการจัดกำหนดการของคิวผู้ใช้/ไดรเวอร์บนสล็อตคิวฮาร์ดแวร์ที่มีอยู่ พวกมันคือตัวประมวลผลแบบไมโครโค้ดที่ตั้งโปรแกรมได้ ที่สามารถใช้นโยบายการตั้งเวลาได้หลากหลาย เราใช้ Quick Response Queue และ CU Reservation คุณสมบัติใน Polaris และเราสามารถพอร์ตการเปลี่ยนแปลงเหล่านั้นไปยังผลิตภัณฑ์ GCN รุ่นที่สามด้วยการอัปเดตไดรเวอร์”

    คิวการตอบสนองด่วนช่วยให้นักพัฒนาจัดลำดับความสำคัญของงานบางอย่างที่ทำงานแบบอะซิงโครนัสโดยไม่ต้องจองกระบวนการอื่นทั้งหมด ในกรณีที่คุณพลาดโพสต์บล็อกของ Dave เกี่ยวกับคุณลักษณะนี้ คุณสามารถตรวจสอบได้ที่นี่ กล่าวโดยย่อ ความยืดหยุ่นเป็นจุดที่ AMD ต้องการขับเคลื่อนกลับบ้าน สถาปัตยกรรมช่วยให้มีหลายวิธีในการปรับปรุงการใช้งานและลดเวลาแฝง ซึ่งทั้งสองวิธีนี้มีความสำคัญอย่างมากในแอปพลิเคชันเช่น VR

    Compute Units ที่เรารู้จักเป็นอย่างดีประกอบด้วย shader ที่เข้ากันได้กับ IEEE 754-2008 64 ตัว ซึ่งแยกระหว่างหน่วยเวกเตอร์สี่หน่วย หน่วยสเกลาร์ และหน่วยการดึงข้อมูลพื้นผิว 16 หน่วย แต่ละ CU ยังโฮสต์หน่วยพื้นผิวสี่หน่วย, แคช L1 16KB, การแชร์ข้อมูลในเครื่อง 64KB และพื้นที่ลงทะเบียนสำหรับหน่วยเวกเตอร์และสเกลาร์ AMD กล่าวว่าได้ปรับแต่งหลายอย่างเพื่อปรับปรุงประสิทธิภาพของ CU รวมถึงการเพิ่มการสนับสนุน FP16 ดั้งเดิม (และ Int16) การเข้าถึงแคชที่ปรับแต่งแล้วและการดึงข้อมูลคำสั่งล่วงหน้าที่ดีขึ้น การเปลี่ยนแปลงทั้งหมดโดยอ้างว่าให้ประสิทธิภาพต่อ CU เพิ่มขึ้นถึง 15% เมื่อเทียบกับ GPU Hawaii ของ Radeon R9 290 ซึ่งใช้สถาปัตยกรรม GCN รุ่นที่สอง

    CUs เก้าแห่งจัดอยู่ใน Shader Engine และ Polaris 10 มี SEs สี่ตัวซึ่งสอดคล้องกับสิ่งที่เรารู้ว่าเป็นสถาปัตยกรรมสูงสุด คณิตศาสตร์ (64 เชดเดอร์ * เก้า CU * สี่ SEs) รวมตัวประมวลผลสตรีม 2304 สูงสุดและหน่วยพื้นผิว 144 หน่วย

    Shader Engine แต่ละอันเชื่อมโยงกับ Geometry Engine ซึ่ง AMD กล่าวว่าจะปรับปรุงโดยการเพิ่มตัวเร่งการทิ้งแบบพื้นฐานสำหรับการโยน primitive ใด ๆ ที่จะไม่แรสเตอร์เป็นพิกเซลก่อนการแปลงการสแกน ซึ่งจะเป็นการเพิ่มปริมาณงาน นี่เป็นฟังก์ชันอัตโนมัติของขั้นตอนการ pre-rasterization ของท่อกราฟิก และเป็นฟังก์ชันใหม่สำหรับ Polaris นอกจากนี้ยังมีแคชดัชนีสำหรับเรขาคณิตแบบอินสแตนซ์ด้วย แม้ว่าเราจะไม่แน่ใจว่าข้อมูลนี้มีขนาดใหญ่เพียงใด หรือมีผลกระทบอย่างมีนัยสำคัญเพียงใดเมื่อใช้อินสแตนซ์

    เช่นเดียวกับฮาวาย Polaris 10 มีความสามารถพื้นฐานสูงสุดสี่ตัวต่อรอบสัญญาณนาฬิกา แต่ในขณะที่ GPU ที่ใช้ฮาวาย/เกรเนดาที่เร็วที่สุดทำงานที่ความเร็วสูงสุด 1050MHz (ในกรณีของ R9 390X) AMD ดัน Radeon RX 480 เป็นอัตรานาฬิกาพื้นฐานที่ 1120MHz และอัตรา “เร่ง” ที่ 1266MHz เพื่อชดเชยบางสิ่ง มันสูญเสียทรัพยากรแบบ on-die โดยใช้ความถี่ที่สูงขึ้น ในขณะที่ Radeon R9 290X นำเสนอ 5.6 TFLOPS ของประสิทธิภาพจุดทศนิยมแบบ single-precision, RX 480 ถึง 5.8 TFLOPS โดยใช้ข้อกำหนด “เพิ่ม” นั้น

    ตัวเลข 1266MHz สมจริงแค่ไหน? ฮาวายมีปัญหาใหญ่มากในการรักษาสเป็คอัตรานาฬิกาของ AMD เมื่อมันร้อน และเราต้องการให้แน่ใจว่าพฤติกรรมเดียวกันนี้จะไม่ส่งผลกระทบต่อ Polaris เมื่อใช้ Metro: เกณฑ์มาตรฐานในตัวของ Last Light Redux วนซ้ำ 10 ครั้ง เราบันทึกความถี่โดยใช้ GPU-Z และได้กราฟต่อไปนี้

    มี 148MHz ตรงระหว่างจุดต่ำสุดและสูงสุดในแผนภูมิเส้นนี้ พื้นคือ 1118MHz และเพดานคือ 1265MHz เราอาจกล่าวว่า AMD ตอกย้ำฐานของตนและเพิ่มเรตติ้งเกือบจะทุกประการ แม้ว่าสิ่งที่เกิดขึ้นระหว่างนั้นจะขึ้นอยู่กับการปรับอย่างต่อเนื่องก็ตาม อย่างน้อยค่าเฉลี่ย 1208MHz อยู่ใกล้กับด้านบนมากกว่าด้านล่าง

    SEs ของฮาวายและฟิจิมีแบ็กเอนด์การเรนเดอร์สี่ส่วนต่อหนึ่งนาฬิกา (หรือ 64 พิกเซลใน GPU) Polaris 10 ผ่าครึ่ง แบ็กเอนด์การเรนเดอร์สองรายการต่อ SE โดยแต่ละรายการมี ROP สี่รายการ รวม 32 พิกเซลต่อนาฬิกา นี่เป็นการลดลงอย่างมีนัยสำคัญเมื่อเทียบกับ Radeon R9 290 AMD ที่ใช้ฮาวายซึ่งจำเป็นต้องเอาชนะด้วย RX 480 ในการรวมเรื่อง Polaris 10 ใช้บัสหน่วยความจำ 256 บิตซึ่งแคบกว่าเส้นทาง 512 บิตรวมของฮาวายมาก Radeon RX 480 รุ่น 4GB จะรวม GDDR5 7 Gb/s ทำให้แบนด์วิดธ์ 224 GB/s ในขณะที่รุ่น 8GB ที่เรากำลังทดสอบใช้หน่วยความจำ 8 Gb/s ช่วยเพิ่มปริมาณงานเป็น 256 GB/s ยังคงน้อยกว่า 320 GB/s ของ R9 290 มาก

    การขาดดุลบางส่วนถูกชดเชยด้วยการบีบอัดสีเดลต้าที่ได้รับการปรับปรุง ซึ่งช่วยลดปริมาณข้อมูลที่ถ่ายโอนข้ามบัส AMD รองรับอัตราส่วน lossless 2/4/8:1 ซึ่งคล้ายกับสถาปัตยกรรม Pascal ของ Nvidia Polaris 10 ยังได้รับประโยชน์จากแคช L2 ขนาด 2MB ที่ใหญ่ขึ้นซึ่งพบเห็นครั้งแรกในฟิจิ วิธีนี้สามารถช่วยโทรกลับในการเดินทางไปยัง GDDR5 ได้ ซึ่งช่วยลดการพึ่งพา GPU ในบัสที่กว้างและอัตราข้อมูลสูง

    อย่างไรก็ตาม การดึงแบ็คเอนด์ของ GPU ออกมาจะต้องมีผลกระทบต่อประสิทธิภาพการทำงาน เนื่องจากความละเอียดและการใช้งานการลบรอยหยักเพิ่มขึ้น อยากรู้ว่า Polaris เปรียบเทียบกับฮาวายอย่างไรในขณะที่ปริมาณงานเพิ่มขึ้น เราจึงเริ่ม Grand Theft Auto V ที่ 1920×1080 เจียมเนื้อเจียมตัวด้วยการตั้งค่ารายละเอียดที่สูงมาก จากนั้นจึงเริ่มปรับขนาดการป้องกันรอยหยัก

    คุณสามารถเห็น Radeon RX 480 ไหลออกจากอัตราเฟรมเฉลี่ยได้เร็วกว่า R9 390 มาก เนื่องจาก MSAA ถูกสลับจาก Off เป็น 2x เป็น 4x เมื่อปิดใช้งาน AA 480 จะได้รับ 97.3 FPS ถึง 390’s 90.4 แต่ในตอนท้าย Radeon RX 480 ของ AMD ลดลงเหลือ 57.5 เฟรมต่อวินาทีในขณะที่ 390 เฉลี่ย 62.9

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x