Chuyển tới nội dung

OpenCL In Action: Ứng dụng xử lý sau, được tăng tốc

    1652144343

    Máy tính không đồng nhất thực sự hứa hẹn điều gì?

    Không ai sẵn sàng khai báo tuổi của CPU. Rốt cuộc, các công ty như Xilinx vẫn bán các thiết bị logic có thể lập trình dành riêng cho ứng dụng được tích hợp ít chức năng hơn và đa mục đích hơn so với các thiết bị xử lý trung tâm hiện đại. Đôi khi, đơn giản hơn là hiệu quả. Có khả năng các bộ vi xử lý chuyên dụng sẽ tiếp tục thành công trong các phân khúc thị trường nhất định, đặc biệt là nơi mà nhiều hiệu suất là mối quan tâm hàng đầu. Tuy nhiên, trong một loạt các môi trường chính ngày càng đa dạng, chúng tôi kỳ vọng rằng máy tính không đồng nhất — có nhiều loại tài nguyên tính toán được đóng gói trên một thiết bị tích hợp duy nhất — sẽ tiếp tục trở nên phổ biến hơn. Và khi sản xuất thiết bị, những thiết bị này cũng sẽ phức tạp hơn.

    Kết thúc hợp lý của tính toán không đồng nhất là một hệ thống trên chip (SoC), trong đó tất cả (hoặc ít nhất là nhiều) hệ thống mạch chính được tích hợp vào một gói. Ví dụ, chip Geode của AMD (hiện đang cung cấp năng lượng cho dự án Một máy tính xách tay cho mỗi trẻ em) đã phát triển từ các thiết kế SoC từ những năm 1990. Trong khi nhiều sản phẩm SoC vẫn thiếu mã lực để cung cấp năng lượng cho một máy tính để bàn hiện đại, phổ thông, cả AMD và Intel đều bán kiến ​​trúc kết hợp lõi CPU, tài nguyên đồ họa và điều khiển bộ nhớ. Các đơn vị xử lý tăng tốc (APU) này, như AMD gọi chúng, đáp ứng và thậm chí vượt quá mức hiệu suất mong đợi từ các máy trạm định hướng năng suất điển hình. Đáng chú ý nhất, chúng bổ sung cho các thiết kế bộ xử lý quen thuộc với rất nhiều ALU thường được sử dụng để tăng tốc đồ họa 3D. Tuy nhiên, các tài nguyên có thể lập trình này không cần phải được sử dụng để chơi game.

    Trước đây, các giải pháp đồ họa trên bo mạch được kích hoạt bằng logic trong chip cầu bắc của chipset. Bị ảnh hưởng bởi sự tắc nghẽn và độ trễ nghiêm trọng, tại một thời điểm nhất định, việc mở rộng quy mô hiệu suất trở nên khó khăn hơn bằng cách sử dụng các thành phần nền tảng quá xa nhau. Kết quả là, chúng tôi đã thấy rằng chức năng di chuyển về phía bắc vào CPU, tạo ra một loại sản phẩm mới có thể không chỉ mang lại hiệu suất chơi game tốt hơn đáng kể mà còn giải quyết các tác vụ có mục đích chung hơn, tận dụng tính chất kết hợp của SoC với CPU và chức năng GPU. 

    Đối với AMD, điều này đánh dấu đỉnh cao được mong đợi từ lâu của sáng kiến ​​Fusion của công ty, có lẽ là trình điều khiển đằng sau việc AMD mua lại ATI Technologies năm 2006. AMD nhận thấy tiềm năng của CPU và công nghệ đồ họa của ATI để thay thế CPU thuần túy trong thị phần ngày càng tăng và công ty quyết tâm đi tiên phong trong quá trình chuyển đổi đó. Tất nhiên, Intel sử dụng công nghệ đồ họa nội bộ của riêng mình, nhưng ở một mục đích khác. Rõ ràng, sự nhấn mạnh của nó đã tập trung nhiều hơn vào các lõi xử lý và ít tập trung hơn vào công nghệ đồ họa.

    Đầu năm 2011 chứng kiến ​​dòng APU AMD C và E-series đầu tiên xuất hiện, được sản xuất trên quy trình 40 nm. Việc sử dụng tích hợp cho phép các mẫu 9 và 18 W công suất thấp đã trở thành máy tính xách tay siêu di động. Ngày nay, chúng ta có dòng APU dòng A dựa trên Llano. Việc sử dụng sản xuất 32 nm cho phép bạn có đủ tài nguyên cho một kiến ​​trúc máy tính để bàn thực sự với mức giá định hướng theo giá trị.

    Mặc dù có nhiều thông số kỹ thuật đang chơi ở đây, nhưng có lẽ điểm khác biệt lớn nhất giữa các mô hình được liệt kê dưới đây là công cụ đồ họa tương ứng của chúng. A8 sử dụng một cấu hình mà AMD gọi là Radeon HD 6550D. Nó bao gồm 400 bộ xử lý luồng, lõi Radeon hoặc bộ đổ bóng, tùy theo tên bạn muốn sử dụng. A6 bước xuống Radeon HD 6530, tự hào với 320 bộ xử lý luồng. Và A4 quy mô trở lại Radeon HD 6410D với 160 bộ xử lý dòng.

    Chúng tôi đã chạy các CPU và APU dưới 200 đô la thông qua một số điểm chuẩn trò chơi yêu thích của chúng tôi, vì vậy chúng tôi biết cách các chip mới nhất tăng hay giảm trong các tựa game hiện đại. Tuy nhiên, bây giờ chúng tôi muốn xem xét một số cách khác mà những người đam mê có thể tận dụng tài nguyên máy tính, sử dụng khối lượng công việc đánh thuế lõi CPU thông thường và bộ xử lý có thể lập trình được trong các sản phẩm định hướng đồ họa.

    Trong phần đầu tiên của loạt bài gồm chín phần này, chúng tôi đang đặt quá trình xử lý hậu kỳ video dưới kính hiển vi. Trước đây, đây sẽ là một mô hình sử dụng tốn thời gian, ngay cả với CPU đa lõi. Tuy nhiên, vì đó là một khối lượng công việc song song nên việc tăng tốc nó với nhiều lõi của bộ xử lý đồ họa đã trở thành một cách tuyệt vời để tăng năng suất và cải thiện hiệu suất.

    Chúng tôi đã tranh thủ sự giúp đỡ của AMD trong việc kết hợp loạt sản phẩm này lại với nhau, vì vậy chúng tôi sẽ tập trung vào phần cứng của công ty để tạo ra một số so sánh khá cơ bản. Làm thế nào để CPU tự hoạt động trong phần mềm hỗ trợ OpenCL? Còn về một trong những APU dựa trên Llano thì sao? Sau đó, chúng tôi sẽ kết hợp các APU rẻ hơn và CPU đắt hơn với một vài thẻ rời khác nhau để lập biểu đồ cách hiệu suất tăng và giảm trên từng cấu hình.

    0 0 đánh giá
    Rating post
    Theo dõi
    Thông báo của
    guest
    0 comments
    Phản hồi nội tuyến
    Xem tất cả bình luận
    0
    Rất thích suy nghĩ của bạn, hãy bình luận.x