Skip to content

การดำเนินการของ OpenCL: แอปหลังการประมวลผล เร่งความเร็ว

    1652144343

    Heterogeneous Computing ให้คำมั่นสัญญาอะไรจริงๆ?

    ไม่มีใครพร้อมที่จะประกาศอายุของซีพียูที่หมดไป ท้ายที่สุด บริษัทอย่าง Xilinx ยังคงขายอุปกรณ์ลอจิกแบบตั้งโปรแกรมได้เฉพาะแอปพลิเคชันที่มีการผสานการทำงานและเอนกประสงค์น้อยกว่าหน่วยประมวลผลกลางที่ทันสมัย บางครั้งง่ายกว่าก็มีประสิทธิภาพมากกว่า มีแนวโน้มว่าโปรเซสเซอร์เฉพาะทางจะยังคงประสบความสำเร็จในตลาดบางกลุ่ม โดยเฉพาะอย่างยิ่งเมื่อต้องคำนึงถึงประสิทธิภาพจำนวนมาก แม้ว่าในสภาพแวดล้อมกระแสหลักที่หลากหลายมากขึ้น เราคาดหวังว่าการประมวลผลแบบต่างๆ—ที่มีทรัพยากรการคำนวณหลายประเภทรวมอยู่ในอุปกรณ์เดียวที่รวมเข้าด้วยกัน—จะยังคงได้รับความนิยมมากขึ้น และในฐานะอุปกรณ์การผลิต อุปกรณ์เหล่านี้จะมีความซับซ้อนมากขึ้นเช่นกัน

    endgame เชิงตรรกะของการคำนวณที่แตกต่างกันคือ system-on-a-chip (SoC) ซึ่งระบบวงจรหลักทั้งหมด (หรืออย่างน้อยหลายระบบ) ถูกรวมเข้าในแพ็คเกจเดียว ตัวอย่างเช่น ชิป Geode ของ AMD (ปัจจุบันสนับสนุนโปรเจ็กต์ One Laptop Per Child) มีวิวัฒนาการมาจากการออกแบบ SoC ในยุค 1990 แม้ว่าผลิตภัณฑ์ SoC จำนวนมากยังคงขาดแรงม้าในการขับเคลื่อนเดสก์ท็อปพีซีกระแสหลักที่ทันสมัย ​​ทั้ง AMD และ Intel ขายสถาปัตยกรรมที่รวมคอร์ของ CPU ทรัพยากรกราฟิก และการควบคุมหน่วยความจำ หน่วยประมวลผลแบบเร่งความเร็ว (APUs) เหล่านี้ตามที่ AMD เรียก ตอบสนองและกระทั่งเกินระดับประสิทธิภาพที่คาดหวังจากเวิร์กสเตชันที่เน้นผลิตภาพทั่วไป ที่โดดเด่นที่สุดคือ พวกมันเสริมการออกแบบโปรเซสเซอร์ที่คุ้นเคยด้วย ALU จำนวนมากซึ่งมักใช้ในการเร่งกราฟิก 3D ทรัพยากรที่ตั้งโปรแกรมได้เหล่านี้ไม่จำเป็นต้องใช้สำหรับการเล่นเกม

    ในอดีต โซลูชั่นกราฟิกออนบอร์ดเปิดใช้งานโดยลอจิกในนอร์ธบริดจ์ของชิปเซ็ต อุปสรรค์จากคอขวดและเวลาแฝงที่รุนแรง เมื่อถึงจุดหนึ่ง การเพิ่มขนาดประสิทธิภาพโดยใช้ส่วนประกอบของแพลตฟอร์มทำได้ยากยิ่งขึ้น ด้วยเหตุนี้ เราจึงเห็นว่าฟังก์ชันการทำงานย้ายไปทางเหนือสู่ CPU ทำให้เกิดผลิตภัณฑ์สายพันธุ์ใหม่ ซึ่งไม่เพียงแต่ให้ประสิทธิภาพการเล่นเกมที่ดีขึ้นอย่างมากเท่านั้น แต่ยังเพื่อจัดการกับงานทั่วไปที่ใช้ประโยชน์จากลักษณะไฮบริดของ SoC กับ CPU และการทำงานของ GPU 

    สำหรับ AMD ถือเป็นจุดสิ้นสุดของการริเริ่ม Fusion ของบริษัท ซึ่งอาจเป็นตัวขับเคลื่อนเบื้องหลังการเข้าซื้อกิจการ ATI Technologies ประจำปี 2549 ของ AMD AMD เล็งเห็นศักยภาพของซีพียูและเทคโนโลยีกราฟิกของ ATI ในการแทนที่ซีพียูบริสุทธิ์ในส่วนแบ่งตลาดที่เพิ่มมากขึ้นเรื่อยๆ และบริษัทก็มุ่งมั่นที่จะเป็นผู้นำของการเปลี่ยนแปลงดังกล่าว แน่นอนว่า Intel ใช้เทคโนโลยีกราฟิคของตัวเอง แต่ในอีกทางหนึ่ง การตัดสินใจเน้นไปที่แกนประมวลผลมากกว่าและเทคโนโลยีกราฟิกน้อยลง

    ต้นปี 2554 ได้เห็น APU ตระกูล AMD C และ E-series ชุดแรกมาถึง ซึ่งผลิตขึ้นด้วยกระบวนการ 40 นาโนเมตร การใช้การรวมทำให้รุ่น 9 และ 18 W ใช้พลังงานต่ำซึ่งเข้าสู่โน้ตบุ๊กแบบพกพาพิเศษ วันนี้ เรามีกลุ่ม APU ของ Llano-based A-series การใช้การผลิตแบบ 32 นาโนเมตรทำให้สามารถอัดทรัพยากรที่เพียงพอสำหรับสถาปัตยกรรมระดับเดสก์ท็อปที่แท้จริงได้ในราคาเชิงมูลค่า

    แม้ว่าจะมีข้อกำหนดหลากหลายในการเล่นที่นี่ แต่บางทีความแตกต่างที่ใหญ่ที่สุดในบรรดารุ่นต่างๆ ที่แสดงด้านล่างคือเอ็นจิ้นกราฟิกที่เกี่ยวข้อง A8 ใช้การกำหนดค่าที่ AMD เรียกว่า Radeon HD 6550D ประกอบด้วยสตรีมโปรเซสเซอร์ 400 ตัว, คอร์ Radeon หรือเชดเดอร์ แล้วแต่ว่าคุณต้องการใช้ชื่อใด A6 ก้าวลงมาสู่ Radeon HD 6530 ซึ่งมีโปรเซสเซอร์สตรีม 320 ตัว และ A4 จะปรับขนาดกลับไปเป็น Radeon HD 6410D ด้วย 160 สตรีมโปรเซสเซอร์

    เราได้เรียกใช้ CPU และ APU มูลค่าต่ำกว่า 200 ดอลลาร์ผ่านเกณฑ์มาตรฐานเกมที่เราโปรดปรานจำนวนมาก ดังนั้นเราจึงรู้ว่าชิปล่าสุดทะยานหรือจมลงในเกมสมัยใหม่ได้อย่างไร ตอนนี้ เราต้องการดูวิธีอื่นๆ ที่ผู้ชื่นชอบสามารถใช้ประโยชน์จากทรัพยากรการประมวลผล โดยใช้เวิร์กโหลดที่ต้องเสียภาษีกับคอร์ CPU ทั่วไปและโปรเซสเซอร์แบบตั้งโปรแกรมได้ที่พบในผลิตภัณฑ์ที่เน้นกราฟิก

    ในตอนแรกของสิ่งที่จะเป็นซีรีส์เก้าตอนนี้ เรากำลังวางวิดีโอหลังการประมวลผลไว้ใต้กล้องจุลทรรศน์ ย้อนกลับไปในสมัยนี้ โมเดลนี้น่าจะเป็นรูปแบบการใช้งานที่ใช้เวลานาน แม้ว่าจะมีซีพียูแบบมัลติคอร์อยู่ใต้ประทุนก็ตาม เนื่องจากเป็นงานขนานส่วนใหญ่ การเร่งความเร็วด้วยหลายคอร์ของโปรเซสเซอร์กราฟิกจึงกลายเป็นวิธีที่ยอดเยี่ยมในการเพิ่มประสิทธิภาพการทำงานและปรับปรุงประสิทธิภาพ

    เราขอความช่วยเหลือจาก AMD ในการรวบรวมซีรีส์นี้ ดังนั้นเราจะมุ่งเน้นไปที่ฮาร์ดแวร์ของบริษัทเพื่อสร้างการเปรียบเทียบพื้นฐานที่สวยงาม CPU ทำงานอย่างไรในซอฟต์แวร์ที่เปิดใช้งาน OpenCL แล้ว APU แบบ Llano ตัวใดตัวหนึ่งล่ะ? จากนั้นเราจะจับคู่ APU ที่ถูกกว่าและ CPU ที่มีราคาแพงกว่ากับการ์ดแบบแยกกันสองสามตัว เพื่อแสดงแผนภูมิประสิทธิภาพที่เพิ่มขึ้นและลดลงในแต่ละการกำหนดค่า

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x