콘텐츠로 건너뛰기

AMD A10-7850K 및 A8-7600: Kaveri는 우리에게 HSA의 맛을 제공합니다

    1647656402

    Steamroller, GCN, HSA, 28nm: 오 마이!

    올해 CES는 지금까지 가장 미친 것이었습니다. 나는 이틀 전에 라스베가스에 나타났고, 하루 늦게 머물렀고, 이른 아침에 시작하여 밤 늦게까지 끝나지 않는 일정에 거의 50개에 가까운 다른 회의를 맞출 수 있었습니다. 그러나 결국 2014년에 보게 될 기술에 대해 확실히 이해했습니다. 그 중 일부는 확실히 진화적입니다. Oculus의 Crystal Cove 프로토타입과 같은 다른 제품은 PC 게임을 근본적으로 개선할 것입니다.

    AMD 입장에서는 CES에서 Kaveri에 대해 이야기하는 데 시간을 보냈습니다. 문서상으로는 매니아들에게 흥미로운 소재여야 하는 디자인입니다. Steamroller 기반 x86 코어가 있어 새로운 프로세서 아키텍처에 대해 이야기할 수 있습니다. AMD의 자랑스러운 Graphics Core Next 디자인이 APU에 적용된 것은 이번이 처음입니다. 이 회사는 컴퓨팅 리소스와 소프트웨어 개발자 간의 더 나은 상호 작용을 위해 이기종 시스템 아키텍처 기능을 활성화하는 데 많은 노력을 기울였습니다. 그리고 GlobalFoundries의 새로운 28nm 제조 공정을 사용하고 있습니다.

    그러나 이번 주 소개는 최고급 95W A10-7850K에 초점을 맞추었지만 Kaveri의 진정한 강조점은 저전력 부문에 있습니다. 회사 관계자는 엔지니어가 35W에서 45W 범위에 맞게 설계되었으며 최대 95W, 최저 15W까지 확장할 수 있다고 말합니다. AMD는 데스크탑, 노트북, 임베디드 환경 및 서버에서 APU를 보기를 원합니다. 따라서 이러한 목표를 더 잘 최적화하기 위해 중도를 택했습니다. AMD는 또한 제조 측면에서 약간의 타협을 해야 했고, 궁극적으로 CPU 속도를 희생하면서 512-셰이더 Radeon 그래픽 코어를 활성화하기 위해 트랜지스터 밀도의 균형을 더 잘 조정해야 했습니다.

    물론 하루가 끝나면 아키텍처와 Kaveri에 대한 AMD의 비전을 주의 깊게 살펴보고 나면 가장 중요한 것은 이 APU 제품군이 이전 제품 및 동일한 공간에서 Intel의 최선의 노력과 어떻게 비교되는지입니다.

    더 나은 컴퓨팅 장치 구축

    통합은 종종 부정적인 의미를 내포하는 단어입니다. 음, 통합 그래픽이 맞죠? 그러나 통합은 복잡한 기술을 보다 저렴하게 만드는 중요한 부분입니다. 많은 경우에 성능 면에서 매우 좋습니다. 그리고 일반적으로 권력과도 양의 상관관계가 있습니다. 이제 우리는 AMD의 APU가 여러 하위 시스템을 결합하여 프로그래밍 가능 논리와 고정 기능 논리 간에 데이터를 빠르게 이동할 수 있도록 하여 유연성을 최대화하고 이상적으로는 저렴한 하드웨어에서 까다로운 워크로드를 실행할 수 있다는 것을 알고 있습니다.

    Kaveri에는 단일 실리콘 조각에 여러 x86 코어, 그래픽 처리, 메모리 제어, 캐시, 하드웨어 기반 가속기 및 PCI Express 연결이 포함되어 있습니다. 이전 제품도 유사하게 철저한 기능 목록을 제공했습니다. 그러나 Kaveri를 퍼즐로 생각한다면 AMD는 각 부분을 수정하여 완제품에 최신 기술, 보다 발전된 제조 및 가장 적절한 리소스를 활용한다는 회사의 비전을 향한 또 다른 단계를 반영하는 방식으로 수정했습니다. 작업량.

    이 접근 방식의 한 구성 요소는 리소그래피를 재고하는 것과 관련이 있습니다. AMD는 GlobalFoundries와 협력하여 32nm SOI에서 28nm 벌크 실리콘 공정으로 전환하고 있습니다. 이제 관련 장점과 단점이 있습니다. 이전에 AMD는 CPU에 최적화된 기술을 사용하여 APU를 구축했습니다. 이를 통해 A10-6800K와 같은 칩이 Turbo Core를 통해 최대 4.4GHz의 클럭 속도에 도달할 수 있었습니다. 그러나 저밀도, 저저항 및 궁극적으로 더 높은 주파수에 대한 조정은 AMD가 다이에 맞출 수 있는 트랜지스터 수에 부정적인 영향을 미치고 GPU의 복잡성을 제한합니다. x86 코어가 사용자 입력을 기다리는 워크로드에서 “충분히 빠른” 것으로 간주되는 세상에서 밀도를 향해 규모를 미루기로 결정했습니다. AMD는 이것을 APU 최적화라고 부르지만 결론은 더 느리게 사용한다는 것입니다.

    그 결과 저주파 x86 코어가 생성되며, 이는 Kaveri와 Richland의 비교에서 확인할 수 있습니다. AMD는 Piledriver 아키텍처에서 Steamroller로의 전환으로 이를 보완한다고 말합니다. IPC 또는 각 코어가 주기당 수행하는 작업량 개선에 초점을 맞추면 최대 20%의 이득을 얻을 수 있으며 대부분의 x86 워크로드에서 Kaveri는 긍정적인 결과를 얻을 수 있습니다.

    반면에 APU는 GCN 아키텍처를 기반으로 하는 최대 512개의 셰이더를 사용하는 보다 강력한 그래픽 하위 시스템을 자랑합니다. Richland는 이전 세대 VLIW4 ALU 중 384개로 1위를 차지했습니다. GPU를 위한 트랜지스터 부의 이러한 명확한 재분배는 AMD가 목표로 하는 성능에 민감한 워크로드(게임, 멀티미디어 및 콘텐츠 제작)를 보다 잘 처리하는 동시에 보다 일반적인 목적의 작업에서 현상을 유지합니다.

    전체적으로 Kaveri는 245제곱밀리미터에 24억 1천만 개의 트랜지스터 SoC를 집어넣었습니다. Richland는 거의 같은 크기(246mm²)였지만 13억 개의 트랜지스터로 구성되었습니다. 당신은 그것을 좋아합니까? 우리는 이제 수십억 개 이상의 트랜지스터 프로세서를 보행자로 치부하고 있습니다. 이 모든 것은 AMD가 GPU 중심 다이에 최적화된 28nm 벌크 실리콘으로 전환한 영향을 보여줍니다.

    오늘날 존재하는 Kaveri Family

    두 가지 모델(A10-7850K 및 A10-7700K)이 즉시 배송될 예정이며 세 번째 모델(A8-7600)은 2014년 1분기에 출시될 예정입니다. 플래그십의 가격은 $173입니다. 따라서 추가로 많은 이점을 얻을 수 있지만 A10-6800K에 비해 추가로 22%를 지불합니다. -7700K도 152달러로 지난 세대의 가장 빠른 제품보다 비쌉니다. 공식 데뷔를 앞두고 -7600은 119달러에 판매될 예정입니다.

    A10-7850KA10-7700KA8-7600 그래픽 레벨 TDP CPU 코어 CPU 기본 클럭 속도 Max. 터보 코어 클럭 속도 GPU 셰이더 GPU 클럭 속도 “컴퓨팅 코어” 가격

    라데온 R7
    라데온 R7
    라데온 R7

    95W
    95W
    65/45W

    4
    4
    4

    3.7GHz
    3.4GHz
    3.3/3.1GHz

    4GHz
    3.8GHz
    3.8/3.3GHz

    512
    384
    384

    720MHz
    720MHz
    720MHz

    12
    10
    10

    $173
    $152
    $119

    방금 출시된 Kaveri 기반 APU는 모두 95W 부품입니다(아이러니하게도 AMD는 열 천장에 가장 신경을 쓰지 않는 것으로 보입니다).

    A10-7850K는 2개의 Steamroller 모듈과 512개의 셰이더를 자랑합니다. 프로세서의 기본 클럭 속도는 3.7GHz이지만 스레드가 적은 앱에서는 최대 4GHz에 도달할 수 있습니다. 한편, R7 그래픽 엔진은 720MHz에서 작동합니다.

    실제로 3개의 Kaveri 모델 모두 720MHz에서 GPU를 사용합니다. A10-7850K와 다른 두 SKU의 가장 큰 차이점은 셰이더 수입니다. A10-7700K 및 A8-7600 모두 384와 함께 제공됩니다. -7700은 올바른 열 조건에서 최대 3.8GHz까지 상승하는 3.4GHz 기본 클록에서 작동합니다.

    A8-7600은 65W 또는 45W로 수동으로 구성할 수 있는 TDP를 제공한다는 점에서 독특합니다. 더 높은 열 상한선은 3.3GHz 기본 클럭과 3.8GHz 피크를 허용하는 반면 45W 설정은 APU 사이클링을 3.1 사이로 유지합니다. 및 3.3GHz.

    Kaveri 기반 APU는 Socket FM2+라는 새로운 인터페이스로 들어갑니다. 우리는 이미 AMD의 A88X, A78, A75 및 A55 Fusion Controller Hubs를 사용하는 호환 가능한 마더보드를 보았습니다. Socket FM2+로 적절한 가격대에 도달하는 것은 각 보드 공급업체에 달려 있습니다. FM2+가 장착된 보드에서 소켓 FM2 기반 APU를 사용할 수 있지만 그 반대는 불가능합니다. Kaveri 다이의 블록 다이어그램은 PCI Express 3.0 컨트롤러(지금까지 실험실에 있는 마더보드를 감안할 때 16레인 연결), 최대 4개의 디스플레이 출력 지원, AMD의 동일한 XDMA 엔진을 보여줍니다. CrossFire용 하와이 GPU(이 경우 듀얼 그래픽 기능 활성화). 우리는 오늘 이야기의 뒷부분에서 다중 GPU 렌더링에 대해 더 깊이 알아볼 것입니다.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x