콘텐츠로 건너뛰기

AMD Radeon R9 Fury X 4GB 검토

    1650150003

    소개

    AMD는 중요한 출시를 앞두고 팬들에게 거품을 일으키며 열광하는 것으로 유명합니다. Radeon R9 Fury X 플래그십 그래픽 카드에 대한 세부 정보를 천천히 공개한 후 과대 광고가 정당한지 여부를 결정할 때입니다. 더 복잡한 GPU, 획기적인 메모리 기술 및 폐쇄 루프 액체 냉각기가 GeForce GTX 980 Ti에서 Nvidia의 결정적으로 효율적인 Maxwell 아키텍처를 찬탈하기에 충분한 성능을 생성할 수 있습니까?

    AMD의 마지막 초고급 하드웨어가 등장한 지 1년이 넘었습니다. Radeon R9 295X2는 회사의 최고의 성과였습니다. 하나의 그래픽 카드에 두 개의 하와이 GPU가 들어갈 수 있으며 이전의 Radeon HD 7990 및 6990과 달리 비교적 조용하게 냉각될 수 있음을 보여주었습니다.

    AMD의 성공 비결은 폐쇄 루프 액체 냉각기였습니다. 대형 라디에이터와 120mm 팬은 섀시 후면에서 낭비되는 열을 효과적으로 배출합니다. 이 조합은 많은 소음을 발생시키지 않았지만 AMD가 레퍼런스 Radeon R9 290X를 능가하는 대형 프로세서를 오버클럭하기에 충분한 열 용량을 가능하게 했습니다.

    무엇보다도 이 제품은 1,500달러에 출시되었습니다. 이는 Nvidia가 불운한 GeForce GTX Titan Z에 대해 요청한 가격의 절반이라는 점입니다. 이 카드는 3개의 확장 슬롯을 먹어치웠지만 여전히 공랭식에서 작동하려면 Titan 혈통에서 상당한 조정이 필요했습니다.

    우리는 AMD가 Radeon R9 295X2에서 성취한 것에 대해 확실히 감탄했습니다. 그러나 시간이 지남에 따라 Nvidia의 점점 더 빨라지는 단일 GPU 보드에 직면하여 295X2는 경쟁에서 효율성보다는 무차별 대입을 지향하는 회사의 경향을 상기시켜주었습니다. 한편, 듀얼 GPU 보드의 가격은 600달러까지 떨어졌습니다. 물리적 크기와 때때로 좌절감을 주는 CrossFire 지원 상태에 기꺼이 대처하려는 사람이라면 누구나 훔칠 수 있습니다.

    기술 사양

    AMD 라데온 R9 퓨리 X

    라데온 R9 290X

    엔비디아 지포스 GTX 980 Ti

    과거로부터의 폭발

    Radeon R9 Fury X는 Graphics Core Next의 심장과 액체가 거대한 Fiji GPU에서 열 에너지를 끌어내는 동일한 DNA에서 태어났습니다. 그러나 단일 프로세서 보드이므로 특별히 긴 PCB에 상주할 필요가 없습니다. 또한 Fury X는 HBM을 특징으로 하는 AMD의 첫 번째 그래픽 카드로 피지 바로 옆에 있는 실리콘 인터포저에 4GB의 스택 다이를 배치하여 필요한 치수를 더욱 압축합니다.

    물론 우리가 약속한 것은 새로운 GPU의 더 큰 처리 리소스 풀과 전례 없는 양의 메모리 대역폭이 Nvidia의 GeForce GTX 980 Ti를 능가할 수 있는 그래픽 카드에 함께 제공된다는 것입니다. 도).

    AMD는 이 카드의 운명을 운에 맡기지 않습니다. 회사의 마케팅 기계는 과거의 브랜드를 불러일으키고 있습니다. 심지어는 Tom’s Hardware보다 앞선 브랜드입니다. Rage는 ATI가 PCI Express나 AGP 이전인 1995년에 최초의 3D 가속기라고 불렀던 것입니다. 그리고 네, 저는 오리지널 3D Rage 그래픽 카드를 소유했습니다. Rage Pro, Rage 128 Pro 및 Rage Fury MAXX도 제 다양한 PC에 사용되었습니다. 이것은 AMD가 2006년에 ATI를 50억 달러 이상에 인수하기를 원했던 회사로 만든 모조리의 일부를 떠올리게 하는 것입니다.

    피지가 형성되다

    Radeon R9 Fury X는 그러한 지정을 받을 가치가 있습니까? 그것은 확실히 유망한 사양을 휘두릅니다. 지난 주 미리 보기에서 대부분의 핵심을 다뤘습니다. 그러나 요약하자면 이 카드는 AMD의 새로운 피지 GPU를 중심으로 합니다.

    AMD와 Nvidia는 모두 28nm 제조가 장기적인 문제가 될 것이라는 것을 알고 있었습니다. 그러나 AMD는 더 빨리 발전하기 위해 프로세스 기술에 의존하고 있음을 인정합니다. 거의 확실히 Nvidia에도 동일하게 적용됩니다. 현실이 되자 두 회사는 최신 GPU를 설계하는 데 있어 서로 다른 길을 택하고 채택했습니다. GM200은 601mm²인 반면 피지는 596mm²로 거의 비슷합니다. AMD는 89억 개의 트랜지스터를 그 공간에 집어넣은 다음 1011mm² 실리콘 인터포저에 칩을 탑재하고 4개의 고대역폭 메모리 스택을 옆에 두고 있습니다.

    피지의 블록 다이어그램을 간단히 살펴보면 2013년에 시작된 하와이 디자인을 암시합니다. 둘 다 각각 고유한 지오메트리 프로세서와 래스터라이저가 있는 4개의 셰이더 엔진과 16픽셀을 처리할 수 있는 4개의 렌더 백엔드로 구성되어 있기 때문입니다. 클럭 사이클당. AMD는 그 어떤 것도 건드리지 않습니다. 그러나 이 회사는 각 셰이더 엔진에서 더 많은 컴퓨팅 유닛을 복제하여 11개가 아닌 16개를 배포합니다. CU당 64개의 셰이더를 사용하면 셰이더 엔진당 1024개, 전체 GPU에 걸쳐 4096개의 셰이더가 집계됩니다. 또한 AMD는 CU당 4개의 텍스처 필터 장치를 유지 관리하여 하와이의 176개에 비해 피지에서 총 256개를 생성합니다.

    분명히 피지의 이론적인 셰이딩, 컴퓨팅 및 텍스처 필터링 성능은 향상되었습니다. 그러나 지오메트리 엔진이나 ROP 수에 대한 상응하는 개선 없이 우리는 또 다른 큰 병목 현상의 배럴을 내려다보고 있지 않습니까? 작업량에 따라 다릅니다. 하와이를 소개했을 때 AMD는 4방향 셰이더 엔진 레이아웃으로 지오메트리 처리량을 늘리고 픽셀 채우기 속도를 높이기 위해 공동 노력을 기울였습니다. 대표자들은 넓은 512비트 버스에도 불구하고 메모리 대역폭이 GPU의 제한 요소라고 가정하기까지 했습니다. 오늘날 회사는 분석 결과 채널당 표준 8비트 래스터 작업이 성능에 병목 현상이 거의 발생하지 않는다고 밝혔습니다. 채널당 16비트 연산은 더 어려울 수 있습니다. 하지만, HBM과 색상 압축의 조합을 통해 피지는 이전 GPU가 실제로 병목 현상이 있었던 전체 속도 16bpc 래스터 작업을 지원하는 GCN의 능력을 실현할 수 있습니다. AMD는 더 큰 엔진을 만들 수 있기를 바랐습니까? 그게 계획이었던 것 같다. 그러나 인터포저 크기의 한계에 직면하여 AMD는 GPU의 한계까지 끌어올려 피지를 내놓았습니다.

    프로세서의 블록 다이어그램에서 볼 수 없는 것은 AMD의 Graphics Core Next 아키텍처에 대한 점진적 개선이며, 그 중 일부는 실제로 우리가 걱정하는 병목 현상을 완화하는 데 도움이 됩니다. 하와이는 GCN의 두 번째 반복을 사용했으며, 이후 Radeon R9 285의 Tonga GPU용으로 업데이트되었습니다. 피지는 AMD가 3세대 GCN 디자인이라고 부르는 이점을 물려받았습니다. 이러한 장점 중 하나는 테셀레이션 성능을 개선하는 업데이트된 지오메트리 프로세서입니다. 프레임 버퍼 읽기 및 쓰기를 위한 무손실 색상 압축, 새로운 16비트 정수/부동 소수점 명령어, L2 캐시를 2MB로 두 배로 늘리는 기능도 목록에 있습니다. 피지의 3D 파이프라인과 관련이 적은 것은 아니지만 고품질 디스플레이 스칼라와 가속화된 HEVC 재생을 지원하는 업데이트된 비디오 디코딩 엔진은 그다지 환영받지 못합니다.

    컴퓨팅 측면에서 피지는 하와이에서 가져온 8개의 비동기 컴퓨팅 엔진과 함께 개선된 작업 일정 및 몇 가지 새로운 데이터 병렬 처리 명령을 통합합니다. 이 GPU의 4096 셰이더와 1050MHz 최대 코어 주파수를 감안할 때 AMD는 8.6 TFLOP 단정밀도 계산 속도를 주장할 수 있습니다. 그러나 FP64를 1/16로 제한하여 DP 상한선이 537.6 MFLOP(하와이보다 작음)입니다. GM200의 핸디캡핑 이후, 이것은 하이엔드 게임 GPU의 특수 목적 특성에 대한 또 다른 끄덕임을 고려하십시오.

    HBM 연결

    AMD가 기반을 마련하는 곳은 R9 290X의 320GB/s에서 Fury X의 512GB/s까지 최대 처리량을 추진하는 고대역폭 메모리의 구현입니다. 낮은 수준의 세부 사항은 이미 잘 알려져 있지만 HBM은 DRAM을 수직으로 쌓아 큰 대역폭 수치를 달성합니다. 각 다이에는 한 쌍의 128비트 채널이 있으므로 4개는 총 1024비트 경로를 생성합니다.

    이 1세대 HBM은 비교적 보수적인 500MHz에서 실행되며 클록당 2비트를 전송합니다. 이에 비해 GDDR5는 현재 클록당 4비트에서 최대 1750MHz입니다(이전 Pentium 4 전면 버스 시대에서 용어를 빌리기 위해 쿼드 펌프라고 함). 이것이 1Gb/s와 7Gb/s의 차이입니다. 아야. 그러나 버스 너비를 고려하면 32비트 GDDR5 패키지의 28GB/s에 비해 HBM 스택당 128GB/s가 있습니다. GeForce GTX 980 Ti와 같은 카드는 6개의 64비트 메모리 컨트롤러를 사용합니다. 이 모든 것을 곱하면 336GB/s 사양을 얻을 수 있습니다. 한편, Radeon R9 Fury X는 4개의 HBM 스택을 사용하여 512GB/s를 제공합니다.

    이러한 도구 사양이 경쟁 제품보다 60%나 50% 이상 높은 경우는 흔하지 않습니다. HBM이 Fury X의 성능 이야기에서 큰 역할을 하거나 피지가 더 큰 칩이었다면 훨씬 더 영향력이 있었을 것이라는 데는 의심의 여지가 없습니다. 하지만 여기에서 약간의 커브볼을 던집니다. Radeon R9 290X와 GeForce GTX 980이 오늘날 거의 일치하는 성능 결과를 보게 될 것입니다. 우리는 이것이 피지 및 HBM과의 AMD의 첫 번째 외출이라는 것을 알고 있으며 회사의 드라이버 팀이 조합에서 더 많은 성능을 추출할 것이라고 가정하는 것이 논리적입니다. 그러나 AMD는 상당한 속도 향상이 예상되는 경우 특정 릴리스 목표를 계획하고 있습니다. Fury X가 어디에 착륙할지에 대한 추측으로 결론을 내릴 수는 없습니다. 그래도 AMD가 실현되지 않은 잠재력을 보고 있다는 것은 흥미롭습니다.

    4GB의 HBM을 감안할 때 Fury X의 장기 전망에 대한 불확실성이 있습니다. 실제로 6GB 980 Tis 및 12GB Titan Xes 앞에서 겁에 질리기 쉽습니다. 4K의 벤치마크 중 어느 것도 Radeon R9 Fury X가 4GB에서 문제가 될 것이라고 제안하지 않습니다. 우리는 Grand Theft Auto V에서 4GB의 메모리 사용을 날려버리고 프레임 속도를 한 자리 숫자로 떨어뜨리는 상당히 인위적인 설정 조합을 설정할 수 있었습니다. 하지만 그때까지 게임은 거의 플레이할 수 없었습니다. AMD는 Radeon R9 390X 및 390을 8GB로 무장하는 등 다소 이상한 위치에 있습니다. 그러나 우리는 플래그십의 절반 용량이 핸디캡이라고 생각하지 않습니다. 4GB를 초과하는 데 필요한 해상도와 설정에서 단일 피지는 이미 요소에서 벗어났습니다. 더구나, AMD는 이전에 발생하지 않았던 메모리를 관리하기 위해 할 수 있는 일이 훨씬 더 많다고 말합니다. 이제 문제가 단순히 GDDR5의 두 배를 버리는 것보다 더 복잡하므로 회사는 사용 가능한 용량을 더 잘 관리하도록 동기를 부여받습니다. 이것은 이제 자연스럽게 공학적인 관심을 받고 있습니다.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x