콘텐츠로 건너뛰기

OpenCL 실행: 앱 후처리, 가속화

    1652144343

    이기종 컴퓨팅은 실제로 무엇을 약속합니까?

    아무도 CPU의 시대가 끝났다고 선언할 준비가 되어 있지 않습니다. 결국 Xilinx와 같은 회사는 최신 중앙 처리 장치보다 기능적으로 훨씬 덜 통합되고 다목적인 응용 프로그램별 프로그래밍 가능 논리 장치를 여전히 판매하고 있습니다. 때로는 단순한 것이 더 효과적입니다. 특수 프로세서는 특정 시장 부문, 특히 많은 성능이 가장 중요한 부분에서 계속해서 성공을 거둘 가능성이 높습니다. 그러나 점점 더 다양한 범위의 주류 환경에서 단일 통합 장치에 많은 유형의 계산 리소스가 포함된 이기종 컴퓨팅이 계속해서 대중화될 것으로 예상합니다. 그리고 제조 장치로서 이러한 장치도 더욱 복잡해질 것입니다.

    이기종 컴퓨팅의 논리적 최종 게임은 모든(또는 적어도 많은) 주요 회로 시스템이 하나의 패키지에 통합된 SoC(System-on-a-Chip)입니다. 예를 들어 AMD의 Geode 칩(현재 One Laptop Per Child 프로젝트를 지원)은 1990년대 SoC 설계에서 발전했습니다. 많은 SoC 제품이 여전히 최신 주류 데스크탑 PC를 구동할 마력이 부족하지만 AMD와 Intel은 모두 CPU 코어, 그래픽 리소스 및 메모리 제어를 결합한 아키텍처를 판매합니다. AMD가 부르는 이러한 APU(가속 처리 장치)는 일반적인 생산성 지향 워크스테이션에서 기대되는 성능 수준을 충족하고 심지어 초과합니다. 특히 3D 그래픽을 가속화하는 데 일반적으로 사용되는 많은 ALU로 친숙한 프로세서 설계를 보완합니다. 하지만 이러한 프로그래밍 가능한 리소스는 게임에 사용할 필요가 없습니다.

    역사적으로 온보드 그래픽 솔루션은 칩셋의 노스브리지 로직에 의해 활성화되었습니다. 심각한 병목 현상과 대기 시간으로 인해 특정 지점에서 서로 멀리 떨어져 있는 플랫폼 구성 요소를 사용하여 성능을 확장하는 것이 더 어려워졌습니다. 결과적으로 우리는 기능이 CPU로 마이그레이션되어 훨씬 더 나은 게임 성능을 제공할 수 있을 뿐만 아니라 SoC와 CPU의 하이브리드 특성을 활용하는 보다 범용적인 작업을 처리할 수 있는 새로운 유형의 제품을 만드는 것을 보았습니다. 및 GPU 기능. 

    AMD의 경우, 이것은 AMD가 2006년 ATI Technologies를 인수하게 된 원동력이 되었던 회사의 Fusion 이니셔티브의 오랫동안 추구해 온 절정입니다. AMD는 계속 증가하는 시장 점유율에서 CPU와 ATI의 그래픽 기술이 순수 CPU를 대체할 가능성을 보았고 회사는 그 전환의 선봉에 서기로 결정했습니다. 물론 인텔은 자체 그래픽 기술을 사용하지만 목적은 다릅니다. 결정적으로, 그 강조점은 그래픽 기술보다는 처리 코어에 더 집중되었습니다.

    2011년 초에 40nm 공정에서 제조된 AMD C 및 E 시리즈 APU의 첫 번째 제품군이 도착하는 것을 목격했습니다. 통합 사용으로 초소형 노트북에 들어가는 저전력 9W 및 18W 모델이 가능해졌습니다. 오늘은 Llano 기반 A 시리즈 APU 제품군이 있습니다. 32nm 제조 방식을 사용하면 가치 지향적인 가격대에서 진정한 데스크탑급 아키텍처를 위한 충분한 리소스를 확보할 수 있습니다.

    여기에는 다양한 사양이 있지만 아래 나열된 모델 중 가장 큰 차이점은 아마도 각각의 그래픽 엔진일 것입니다. A8은 AMD가 Radeon HD 6550D라고 부르는 구성을 사용합니다. 400개의 스트림 프로세서, Radeon 코어 또는 셰이더로 구성되며 원하는 이름을 사용합니다. A6은 320개의 스트림 프로세서를 자랑하는 Radeon HD 6530으로 내려갑니다. 그리고 A4는 160개의 스트림 프로세서를 탑재한 Radeon HD 6410D로 다시 확장됩니다.

    우리는 이미 우리가 좋아하는 여러 게임 벤치마크를 통해 200달러 미만의 CPU와 APU를 실행했기 때문에 최신 칩이 현대 타이틀에서 어떻게 치솟거나 가라앉는지 알고 있습니다. 이제 우리는 그래픽 지향 제품에서 볼 수 있는 기존 CPU 코어와 프로그래밍 가능한 프로세서에 부담을 주는 워크로드를 사용하여 매니아가 컴퓨팅 리소스를 활용할 수 있는 다른 방법을 살펴보고자 합니다.

    9부작 시리즈의 첫 번째 기사에서 우리는 현미경으로 비디오 후처리를 할 것입니다. 예전에는 멀티 코어 CPU가 있더라도 시간이 많이 소요되는 사용 모델이었습니다. 하지만 대부분 병렬 워크로드이기 때문에 그래픽 프로세서의 많은 코어로 가속화하는 것이 생산성을 높이고 성능을 향상시키는 좋은 방법이 되었습니다.

    우리는 이 시리즈를 구성하는 데 AMD의 도움을 받았으므로 회사의 하드웨어에 집중하여 몇 가지 기본적인 비교를 생성할 것입니다. CPU 자체는 OpenCL 지원 소프트웨어에서 어떻게 작동합니까? 자체적으로 Llano 기반 APU 중 하나는 어떻습니까? 그런 다음 더 저렴한 APU와 더 비싼 CPU를 최대 몇 개의 개별 카드와 비교하여 각 구성에서 성능이 확장 및 축소되는 방식을 차트로 표시합니다.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x