콘텐츠로 건너뛰기

Nvidia GeForce RTX 2080 Ti 파운더스 에디션 검토: Titan V 킬러

    1646058004

    우리의 평결

    Nvidia의 GeForce RTX 2080 Ti는 세부 설정을 최대로 한 상태에서 4K에서 부드러운 프레임 속도를 제공할 수 있도록 테스트한 첫 번째 카드입니다. 후광 기능은 아직 어떤 게임에서도 사용되지 않지만 온라인에 출시되면 Turing 아키텍처가 더욱 빛날 것으로 예상됩니다.

    을위한

    최고 품질 설정으로 4K에서 부드러운 성능
    향상된 열 솔루션 성능으로 더 높은 GPU 부스트 클록 유지
    레이 트레이싱 및 AI 지원으로 차세대 게임을 가속화하는 미래 지향적인 기술로 가득 차 있습니다.

    에 맞서

    $1200 가격표는 대부분의 게이머가 접근할 수 없습니다.
    이중 축 팬 디자인은 케이스로 열을 다시 배출합니다.

    지포스 RTX 2080 Ti 파운더스 에디션

    GeForce RTX 2080 Ti는 빠릅니다. 아무도 그것에 대해 이의를 제기하지 않을 것입니다. 게이머를 가장 괴롭히는 것은 가격표입니다. 파운더스 에디션 보드의 가격은 2017년에 출시된 플래그십 GeForce GTX 1080 Ti Nvidia보다 71% 높은 1200달러입니다. 그러면 아마도 실망스럽게도 GeForce RTX 2080 Ti는 4K의 13개 게임 제품군에서 이전 제품보다 평균 약 26% 더 빠릅니다.

    그러나 Nvidia의 Titan V도 능가한다고 말하면 어떨까요? Battlefield 1에서 GeForce RTX 2080 Ti는 20% 더 빠릅니다. Forza Motorsport 7에서 2080 Ti는 22%의 이점을 누리고 있습니다. 두 카드의 사양을 기준으로 우리는 이렇게 극적인 마무리를 기대하지 않았습니다. $3000 GV100 기반 Titan V는 게임이 아닌 딥 러닝을 위해 만들어졌지만, 이러한 결과는 확실히 GeForce RTX 2080 Ti의 $1200 가격을 맥락에 반영합니다. 따라서 여유가 있다면 RTX 2080 Ti는 최고의 그래픽 카드 중 하나입니다.

    4K 모니터를 사용하는 매니아 그룹에게 더욱 중요한 GeForce RTX 2080 Ti는 세부 설정을 희생하지 않고도 3840×2160에서 재생 가능한 성능을 제공합니다. 예, 4K에서 테스트하기 위해 안티 앨리어싱 모드를 껐습니다. 그러나 우리의 벤치마크는 모든 단일 타이틀에서 60FPS 이상의 고해상도, 고품질 PC 게임을 반영합니다.

    이것은 우리가 수년 동안 기대했던 순간입니다. GeForce GTX 980 Ti는 세부 사항을 축소하면 4K에서 재생할 수 있습니다. GeForce GTX 1080이 우리를 게임의 너바나에 조금 더 가깝게 해주었지만, 분명히 최대 품질의 4K에서 부드러운 성능을 위해 필요한 놀라운 성능은 아닙니다. 그런 다음 GeForce GTX 1080 Ti는 마침내 4K 챔피언을 선언하도록 유혹했습니다. 그러나 우리는 우리가 연기를 해서 기쁩니다. GeForce RTX 2080 Ti는 마침내 이러한 Ultra 설정을 3840×2160에서 실행 가능하게 만듭니다.

    TU102: 게임 야수 만들기

    GeForce RTX 2080 Ti는 어떻게 이것을 달성합니까? 카드의 내부 작동에 대한 포괄적인 분석을 놓쳤다면 Nvidia의 Turing Architecture Explored: Inside the GeForce RTX 2080을 확인하세요. 하지만 요약하자면 오늘의 주제는 186억 개로 구성된 754제곱밀리미터 GPU인 TU102를 기반으로 합니다. TSMC의 12nm FinFET 제조 공정에서 제조된 트랜지스터. 우리가 테스트한 것보다 더 효율적으로 작동하는 더 많은 양의 렌더링 리소스가 로드되었습니다.

    완전한 TU102 프로세서는 래스터 엔진으로 구성된 6개의 GPC(그래픽 처리 클러스터)와 6개의 TPC(텍스처 처리 클러스터)로 구성됩니다. 각 TPC는 하나의 PolyMorph 엔진(고정 기능 기하학 파이프라인)과 두 개의 스트리밍 멀티프로세서(SM)로 구성됩니다. SM 수준에서 우리는 64개의 CUDA 코어, 8개의 Tensor 코어, 1개의 RT 코어, 4개의 텍스처 유닛, 16개의 로드/저장 유닛, 256KB의 레지스터 파일 공간, 4개의 L0 명령어 캐시 및 96KB의 구성 가능한 L1 캐시/공유 메모리 구조를 찾습니다. .

    이 모든 것을 곱하면 72개의 SM, 4608개의 CUDA 코어, 576개의 Tensor 코어, 72개의 RT 코어, 288개의 텍스처 유닛 및 36개의 PolyMorph 엔진이 있는 GPU를 얻을 수 있습니다. 이러한 리소스는 12개의 32비트 GDDR6 메모리 컨트롤러에 의해 공급되며, 각각은 8개의 ROP 클러스터와 512KB의 L2 캐시에 연결되어 총 384비트 메모리 버스, 96개의 ROP 및 6MB L2 캐시를 생성합니다. 각 SM에는 한 쌍의 FP64 지원 CUDA 코어도 포함되어 있어 TU102의 FP32 성능의 1/32인 배정밀도 속도를 산출합니다.

    GeForce RTX 2080 Ti FEGEForce RTX 2080 FEGEForce GTX 1080 Ti FEGEForce GTX 1080 FE 아키텍처(GPU) CUDA 코어 피크 FP32 컴퓨팅 텐서 코어 RT 코어 텍스처 유닛 기본 클럭 속도 GPU 부스트 속도 메모리 용량 메모리 버스 메모리 대역폭 ROPsistor 카운트 TDPe Trans SLI 지원

    튜링(TU102)
    튜링(TU104)
    파스칼(GP102)
    파스칼(GP104)

    4352
    2944
    3584
    2560

    14.2 TFLOPS
    10.6 TFLOPS
    11.3 TFLOPS
    8.9 TFLOPS

    544
    368
    해당 없음
    해당 없음

    68
    46
    해당 없음
    해당 없음

    272
    184
    224
    160

    1350MHz
    1515MHz
    1480MHz
    1607MHz

    1635MHz
    1800MHz
    1582MHz
    1733MHz

    11GB GDDR6
    8GB GDDR6
    11GB GDDR5X
    8GB GDDR5X

    352비트
    256비트
    352비트
    256비트

    616GB/초
    448GB/s
    484GB/s
    320GB/s

    88
    64
    88
    64

    5.5MB
    4MB
    2.75MB
    2MB

    260W
    225W
    250W
    180W

    186억
    136억
    120억
    72억

    754mm²
    545mm²
    471mm²
    314mm²

    예(x8 NVLink, x2)
    예(x8 NVLink)
    예(MIO)
    예(MIO)

    모든 것을 통합: GeForce RTX 2080 Ti

    그러나 GeForce RTX 2080 Ti에 있는 TU102는 완전한 프로세서가 아닙니다. Nvidia가 Titan급 모델을 위한 공간을 남기기를 원하든 특정 빈 이상으로 완전한 기능을 하는 GPU의 수율이 불만족스럽다는 것을 발견했든, RTX 2080 Ti에는 2개의 TPC가 비활성화되어 4352개의 CUDA 코어, 544개의 Tensor 코어, 68개의 텐서 코어가 있는 카드를 남깁니다. RT 코어, 544개의 텍스처 유닛, 34개의 PolyMorph 엔진.

    TU102의 32비트 메모리 컨트롤러 중 하나도 꺼져 데이터를 88개의 ROP와 5.5MB의 L2 캐시로 이동하는 집계 352비트 버스를 생성합니다. Nvidia는 전략적으로 장애가 있는 GPU를 Micron의 MT61K256M32JE-14:A 모듈과 일치시킵니다. 이 중 11개가 RTX 2080 Ti의 PCB를 채우고 하나의 배치가 비어 있습니다. 그럼에도 불구하고 이론적인 피크 대역폭은 GDDR6의 더 높은 데이터 전송률로 인해 이전 세대 카드에 비해 급격히 증가합니다. 352비트 인터페이스의 14Gb/s에서는 616GB/s를 보고 있습니다. 이에 비해 11Gb/s의 GDDR5X는 GeForce GTX 1080 Ti를 484GB/s로 유지했습니다.

    Founders Edition 카드에서 1350MHz의 기본 코어 주파수는 GeForce RTX 2080 Ti가 충분히 냉각 실행되는 한 일반적인 GPU 부스트 속도인 1635MHz까지 점프합니다. 그리고 Nvidia는 GPU Boost 수치를 사용하여 최대 컴퓨팅 성능을 인용하기 때문에 최고 수준의 모델은 최대 14.2TFLOPS의 단정밀도 수학을 달성합니다.

    해당 주파수는 Nvidia의 참조 사양과 관련하여 오버클럭됩니다. 결과적으로 Founders Edition 모델은 260W TDP 등급이 약간 더 높습니다. PCIe 슬롯, 8핀 전원 커넥터 및 6핀 전원 커넥터는 이론적으로 이러한 제한을 처리할 수 있습니다. 그러나 Nvidia는 대신 2개의 보조 8핀 커넥터를 사용하여 GeForce RTX 2080 Ti Founders Edition에 오버클러킹을 위한 잠재적인 여유 공간을 제공합니다.

    PCIe 커넥터에서 GeForce RTX 2080 Ti의 전원 공급 장치로 다시 이동하여 GDDR6 메모리 및 해당 PWM 컨트롤러에 대해 3단계를 계산합니다. Nvidia에 따르면 총 13단계가 남아 있습니다. 그러나 그것은 옳을 수 없습니다, 그렇죠? 6개의 위상 2배 회로가 있더라도 로드 밸런서 역할을 하는 위상이 하나 남습니다. 숫자는 더하지 않습니다.

    실제로는 5개의 위상이 8핀 커넥터에 의해 공급되고 두 배가 되는 것처럼 보입니다. 위상당 2개의 제어 루프, 5*2=10 전압 조정 회로. GPU 왼쪽에 있는 나머지 세 단계는 마더보드의 PCIe 슬롯에 의해 공급되며 두 배가 되지 않습니다. 그것은 우리에게 Nvidia의 행운의 숫자 13을 제공합니다(스마트 로드 분배 체계와 함께). 물론 이 모든 것을 잘 구현하려면 올바른 구성 요소가 필요합니다…

    GPU 전원 공급 장치

    이 디자인의 전면과 중앙은 차세대 GPU를 지원하도록 특별히 설계된 uPI의 uP9512 8상 벅 컨트롤러입니다. uPI에 따르면 “uP9512는 프로그래밍 가능한 출력 전압과 능동 전압 포지셔닝 기능을 제공하여 출력 전압을 부하 전류의 함수로 조정하므로 과도 부하 전류에 최적으로 배치됩니다.”

    uP9512는 Nvidia의 개방형 전압 조정기 Type 4i+ 기술과 PWMVID를 지원합니다. 이 입력은 버퍼링되고 필터링되어 매우 정확한 기준 전압을 생성합니다. 그러면 출력 전압이 기준 입력으로 정밀하게 제어됩니다. 통합 SMBus 인터페이스는 성능과 효율성을 최적화하는 데 충분한 유연성을 제공하는 동시에 적절한 소프트웨어와의 통신을 용이하게 합니다.

    13개의 모든 전압 조정 회로에는 PowerTrench MOSFET 및 드라이버 IC가 통합된 ON Semiconductor FDMF3170 스마트 전력 스테이지 모듈이 장착되어 있습니다.

    평소와 같이 코일은 캡슐화된 페라이트 코어에 의존하지만 이번에는 전압 조정기 회로를 위한 공간을 만들기 위해 직사각형입니다.

    메모리 전원 공급 장치

    Micron의 MT61K256M32JE-14:A 메모리 IC는 두 번째 uP9512에서 오는 3단계로 구동됩니다. 동일한 FDMF3170 Smart Power Stage 모듈이 다시 나타납니다. 470mH 코일은 GPU 전력 단계에서 볼 수 있는 것보다 더 큰 인덕턴스를 제공하지만 물리적 치수 측면에서 완전히 동일합니다.

    입력 필터링은 3개의 1μH 코일을 통해 발생하며, 이에 따라 3개의 연결 라인 각각에는 일치하는 션트가 있습니다. 이것은 전압 강하가 병렬로 측정되어 원격 측정에 전달되는 매우 낮은 저항입니다. 이러한 회로를 통해 Nvidia는 상당히 정확한 방식으로 보드 전력을 제한할 수 있습니다.

    약간의 중복성을 원하는 사람들에게는 불행히도 이 카드에는 하나의 BIOS만 장착되어 있습니다.

    GeForce RTX 2080 Ti를 테스트한 방법

    Nvidia의 최신 및 최고의 제품은 의심할 여지 없이 현재 AMD와 Intel에서 제공하는 많은 고급 플랫폼 중 하나에서 찾을 수 있습니다. 우리의 그래픽 스테이션은 여전히 ​​4.2GHz에서 Intel Core i7-7700K CPU가 장착된 MSI Z170 Gaming M7 마더보드를 사용합니다. 프로세서는 G.Skill의 F4-3000C15Q-16GRR 메모리 키트로 보완됩니다. Crucial의 MX200 SSD가 남아 있고 게임이 로드된 1.4TB Intel DC P3700이 추가되었습니다.

    경쟁이 치열한 한, GeForce RTX 2080 Ti는 $3000 Titan V와만 경쟁합니다. 이번에는 GeForce GTX 1080 Ti, Titan X, GeForce GTX 1080, GeForce GTX 1070 Ti와 함께 해당 카드를 테스트 풀에 추가합니다. 및 Nvidia의 GeForce GTX 1070입니다. AMD는 Radeon RX Vega 64 및 56으로 대표됩니다. 모든 카드는 Founders Edition 또는 참조 모델입니다. Nvidia와 AMD의 사내 파트너 보드가 있으며 이를 타사 리뷰에 사용할 계획입니다.

    벤치마크 선택에는 이제 Ashes of the Singularity: Escalation, Battlefield 1, Civilization VI, Destiny 2, Doom, Far Cry 5, Forza Motorsport 7, Grand Theft Auto V, Metro: Last Light Redux, Rise of the Tomb Raider, Tom Clancy’s가 포함됩니다. The Division®, Tom Clancy’s Ghost Recon Wildlands, The Witcher 3 및 World of Warcraft: Battle for Azeroth. 우리는 Monster Hunter: World, Shadow of the Tomb Raider, Wolfenstein II 및 기타 몇 가지를 추가하기 위해 노력하고 있지만 Turing 기반 카드에 대한 Nvidia의 최종 드라이버와 함께 매우 제한된 시간으로 인해 이러한 계획을 폐기해야 했습니다.

    우리가 사용하는 테스트 방법론은 PresentMon: Performance In DirectX, OpenGL 및 Vulkan에서 가져왔습니다. 간단히 말해서, 이러한 모든 게임은 AIDA64를 통한 로깅과 함께 OCAT와 PresentMon용 자체 사내 GUI의 조합을 사용하여 평가됩니다.

    오늘 기사에서 볼 수 있는 모든 숫자는 업데이트된 드라이버를 사용하여 새로운 것입니다. Nvidia의 경우 GeForce RTX 2080 Ti 및 2080용 빌드 411.51을 사용하고 있습니다. 다른 카드는 빌드 398.82로 테스트되었습니다. Titan V의 결과는 성능이 변경되지 않았는지 확인하기 위해 411.51로 현장 확인되었습니다. AMD의 카드는 테스트 당시 최신 버전인 Crimson Adrenalin Edition 18.8.1을 사용합니다.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x