Lompat ke konten

Ulasan Nvidia GeForce GTX 1660 Ti 6GB: Turing Tanpa RTX

    1649727002

    Keputusan Kami

    Walaupun GeForce GTX 1660 Ti berharga lebih daripada 1060 6GB yang digantikannya, papan berasaskan Turing terbaharu Nvidia memberikan prestasi yang serupa dengan GeForce GTX 1070. Prestasi tinggi, tanda harga yang berpatutan dan penggunaan kuasa yang sederhana disatukan dalam kad grafik arus perdana atas yang kukuh .

    Untuk

    Prestasi hebat pada 1920 x 1080
    Kadar bingkai yang boleh diterima pada 2560 x 1440
    Mengekalkan ciri pecutan pengekodan/nyahkod video Turing
    Kuasa papan 120W setanding dengan persaingan AMD

    Terhadap

    Tiada teras RT/Tensor bermakna anda tidak akan dapat mencuba pengesanan sinar atau DLSS

    Turing Tanpa RTX

    Kemas Kini 21/11/2019: Sejak pelancaran GTX 1660 Ti pada Februari 2019, landskap GPU telah berubah secara mendadak, dengan sebilangan besar kad “Super” berdasarkan seni bina Turing yang sama, tetapi mendorong kedua-dua prestasi yang lebih tinggi dan harga yang lebih rendah daripada barisan Turing awal syarikat. Paling relevan kepada bakal pembeli GTX 1660 Ti ialah GeForce GTX 1660 Super, yang memberikan prestasi serupa kepada 1660 Ti, pada harga permulaan yang lebih rendah iaitu $229. Pada penulisan ini, itu kira-kira $30 kurang daripada GTX 1660 Ti harga terendah.

    Nvidia GeForce GTX 1660 Ti dibina pada TU116—pemproses grafik serba baharu yang menggabungkan pelorek Turing yang dipertingkat, seni bina cache bersatunya, sokongan untuk teduhan adaptif dan pelengkap penuh ciri pecutan pengekodan/dekod video. GPU dipasangkan sehingga memori GDDR6, sama seperti model siri GeForce RTX 20 yang lebih tinggi. Tetapi ia tidak cukup pantas untuk mewajarkan pelekatan pada teras RT untuk pengesanan sinar dipercepatkan atau teras Tensor untuk inferens dalam permainan. Hasilnya, TU116 adalah cip yang lebih ramping dengan senarai spesifikasi yang menekankan tajuk-tajuk teratas hari ini.

    Nvidia mengatakan bahawa GeForce GTX 1660 Ti akan bermula pada $280 dan menggantikan GeForce GTX 1060 6GB sepenuhnya. Walaupun harga asas itu adalah $30 (atau 12 peratus) lebih tinggi daripada tempat 1060 6GB berasaskan Pascal memulakan perjalanannya kembali pada 2016, syarikat itu mendakwa GeForce GTX 1660 Ti adalah sehingga 1.5 kali lebih pantas—dan pada penarafan kuasa papan 120W yang sama, tidak kurang juga.

    Prestasi yang lebih baik bagi setiap dolar bukanlah sesuatu yang banyak kita lihat daripada generasi Turing setakat ini. Bolehkah Nvidia mengubahnya dengan GPU yang lebih direka khas untuk prestasi pada 1920 x 1080?

    Temui TU116: Turing Sans RT dan Tensor Cores

    Kami telah melihat Nvidia melancarkan empat GPU berasingan kerana ia mengiringi kami ke bawah hierarki Turing. Dengan setiap satu, syarikat mengupas sumber untuk menyasarkan titik harga yang lebih rendah. Tetapi kami tahu ia cuba mengekalkan keseimbangan sepanjang perjalanan, meminimumkan kesesakan yang tidak semestinya merampas prestasi puncak pemproses kelas bawah mereka.

    GeForce RTX 2060 dilengkapi dengan 44 peratus daripada teras dan unit tekstur CUDA 2080 Ti, 54 peratus daripada ROP dan lebar jalur ingatannya, dan 50 peratus daripada cache L2nya. Sebelum 2060 dilancarkan, kami mengesyaki bahawa kemewahan seperti teras RT dan Tensor tidak lagi masuk akal pada tahap tersebut. Tetapi satu siri tampung untuk Battlefield V—permainan yang didayakan pengesanan sinar yang tersedia pada masa itu—mendayakan peningkatan prestasi yang besar, membuktikan bahawa ciri tandatangan Turing masih boleh digunakan pada kadar bingkai yang boleh dimainkan.

    Ternyata kami berada di luar satu peringkat. Nvidia menganggap TU116 sebagai sempadan di mana kuasa kuda teduhan jatuh cukup rendah untuk menghalang keupayaan Turing yang melihat masa depan daripada memberi banyak tujuan. Selepas menanggalkan teras RT dan Tensor, kami tinggal dengan cip 284mm² yang terdiri daripada 6.6 bilion transistor yang dihasilkan menggunakan proses FinFET 12nm TSMC. Tetapi walaupun transistornya lebih kecil, TU116 masih 42 peratus lebih besar daripada pemproses GP106 yang mendahuluinya.

    Sebahagian daripada pertumbuhan itu disebabkan oleh pelorek Turing yang lebih canggih. Seperti kad siri GeForce RTX 20 yang lebih tinggi, GeForce GTX 1660 Ti menyokong pelaksanaan serentak arahan aritmetik FP32, yang membentuk kebanyakan beban kerja shader dan operasi INT32 (untuk menangani/mengambil data, titik terapung min/maks, bandingkan, dsb. .). Apabila anda mendengar tentang teras Turing yang mencapai prestasi yang lebih baik daripada Pascal pada kadar jam tertentu, keupayaan ini sebahagian besarnya menerangkan sebabnya.

    Berbilang Pemproses Penstriman Turing terdiri daripada teras CUDA yang lebih sedikit daripada Pascal, tetapi reka bentuk mengimbangi sebahagiannya dengan menyebarkan lebih banyak SM pada setiap GPU. Seni bina yang lebih baharu memperuntukkan satu penjadual kepada setiap set 16 teras CUDA (2x Pascal), bersama-sama dengan satu unit penghantaran bagi setiap 16 teras CUDA (sama seperti Pascal). Empat daripada kumpulan 16 teras tersebut terdiri daripada SM, bersama-sama dengan 96KB cache yang boleh dikonfigurasikan sebagai memori kongsi 64KB L1/32KB atau sebaliknya, dan empat unit tekstur. Oleh kerana Turing menggandakan penjadual, ia hanya perlu mengeluarkan arahan kepada teras CUDA setiap kitaran jam lain untuk memastikannya penuh. Di antaranya, adalah percuma untuk mengeluarkan arahan berbeza kepada mana-mana unit lain, termasuk teras INT32.

    Dalam TU116 secara khusus, Nvidia mengatakan ia menggantikan teras Tensor Turing dengan 128 teras FP16 khusus bagi setiap SM, yang membolehkan GeForce GTX 1660 Ti memproses operasi separuh ketepatan pada kadar 2x FP32. GPU berasaskan Turing yang lain juga mempunyai FP16 kadar dua kali, jadi tidak jelas bagaimana GeForce GTX 1660 Ti unik dalam keluarganya. Lebih jelas, berdasarkan carta di bawah, ialah 1660 Ti memberikan peningkatan besar kepada daya pemprosesan separuh ketepatan berbanding GeForce GTX 1060 dan cip GP106 berasaskan Pascal.

    Tetapi apabila kami menjalankan modul Analisis Saintifik Sandra, yang menguji pendaraban matriks umum, kami melihat berapa banyak lagi yang dicapai oleh teras Tensor TU106 throughput FP16 berbanding TU116. GeForce GTX 1060, yang hanya menyokong FP16 secara simbolik, hampir tidak mendaftar pada carta sama sekali.

    Sebagai tambahan kepada pelorek seni bina Turing dan cache bersatu, TU116 juga menyokong sepasang algoritma yang dipanggil Teduhan Penyesuaian Kandungan dan Teduhan Penyesuaian Gerakan, bersama-sama dirujuk sebagai Lorekan Kadar Pembolehubah. Kami merangkumi teknologi ini dalam Nvidia’s Turing Architecture Explored: Inside the GeForce RTX 2080. Kisah itu juga memperkenalkan keupayaan pengekodan dan penyahkod video dipercepatkan Turing, yang dibawa ke GeForce GTX 1660 Ti juga.

    Menyatukan Semuanya…

    Nvidia mengemas 24 SM ke dalam TU116, membahagikannya antara tiga Kluster Pemprosesan Grafik. Dengan 64 teras FP32 bagi setiap SM, itu adalah 1,536 teras CUDA dan 96 unit tekstur merentas keseluruhan GPU. Rakan kongsi Lembaga sudah pasti akan menyasarkan julat frekuensi untuk mengisi jurang antara GTX 1660 Ti dan RTX 2060. Walau bagaimanapun, kadar jam asas rasmi ialah 1,500 MHz dengan spesifikasi GPU Boost 1,770 MHz. Sampel EVGA GeForce GTX 1660 Ti XC Black Gaming kami mendahului sekitar 1,845 MHz melalui tiga larian Metro: Last Light, manakala kad lain yang kami lihat sedia melebihi 2,000 MHz. Di atas kertas, GeForce GTX 1660 Ti menawarkan sehingga 5.4 TFLOPS prestasi FP32 dan 10.9 TFLOPS FP16 throughput.

    Enam pengawal memori 32-bit memberikan TU116 bas 192-bit agregat, yang dihuni oleh modul GDDR6 12 Gb/s (Micron MT61K256M32JE-12:A) yang menolak sehingga 288 GB/s. Itu 50% lebih lebar jalur memori daripada GeForce GTX 1060, membantu GeForce GTX 1660 Ti mengekalkan kelebihan prestasinya pada 2560 x 1440 dengan anti-aliasing didayakan.

    Setiap pengawal memori dikaitkan dengan lapan ROP dan kepingan 256KB cache L2. Secara keseluruhan, TU116 mendedahkan 48 ROP dan 1.5MB L2. Kiraan ROP GeForce GTX 1660 Ti berbanding dengan RTX 2060, yang juga menggunakan 48 output paparan. Tetapi kepingan cache L2nya adalah separuh besar.

    Walaupun die lebih besar, kiraan transistor 50% lebih tinggi dan kadar jam GPU Boost yang lebih agresif, GeForce GTX 1660 Ti dinilai untuk 120W yang sama seperti GeForce GTX 1060. Malangnya, kedua-dua kad grafik tidak termasuk sokongan berbilang GPU. Nvidia terus menolak naratif bahawa SLI bertujuan untuk memacu prestasi mutlak yang lebih tinggi, dan bukannya memberi pemain cara untuk memadankan konfigurasi GPU tunggal.

    EVGA GeForce GTX 1660 Ti XC Black GamingGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1060 FE Architecture (GPU) CUDA Cores Peak FP32 Kira Teras Tensor RT Teras Unit Tekstur Kadar Jam Asas GPU Kadar Galak Memori Kapasiti ROP Memori Bas L2 Jalur Memori Sokongan SLI Saiz Mati

    Turing (TU116)
    Turing (TU106)
    Pascal (GP106)
    Pascal (GP104)

    1536
    1920
    1280
    1920

    5.4 TFLOPS
    6.45 TLFOPS
    4.4 TFLOPS
    6.5 TFLOPS

    T/A
    240
    T/A
    T/A

    T/A
    30
    T/A
    T/A

    96
    120
    80
    120

    1500 MHz
    1365 MHz
    1506 MHz
    1506 MHz

    1770 MHz
    1680 MHz
    1708 MHz
    1683 MHz

    6GB GDDR6
    6GB GDDR6
    6GB GDDR5
    8GB GDDR5

    192-bit
    192-bit
    192-bit
    256-bit

    288 GB/s
    336 GB/s
    192 GB/s
    256 GB/s

    48
    48
    48
    64

    1.5MB
    3MB
    1.5MB
    2MB

    120W
    160W
    120W
    150W

    6.6 bilion
    10.8 bilion
    4.4 bilion
    7.2 bilion

    284 mm²
    445 mm²
    200 mm²
    314 mm²

    Tidak
    Tidak
    Tidak
    Ya (MIO)

    GeForce GTX 1660 Ti XC Black Gaming EVGA

    Edisi Pengasas GeForce GTX 1060 juga merupakan kad 120W dan ia berdecit dengan satu penyambung tambahan enam pin. GeForce GTX 1660 Ti XC Black Gaming EVGA, sebaliknya, menggunakan input lapan pin, memberikannya sedikit ruang kepala tambahan. Seperti yang akan kita lihat dalam ujian kuasa per-rel kami, kad ini menarik arus 3A ke atas slot PCIenya semasa ujian tekanan kami—selebihnya datang daripada penyambung lapan pinnya.

    EVGA menggunakan empat fasa kuasa untuk TU116. Fasa GPU dikawal oleh ON Semiconductor NCP81276 yang lebih lama di bahagian belakang PCB, yang dilampirkan pada kuartet ON Semiconductor NCP302155s.

    Empat komponen tersebut menyepadukan MOSFET sisi tinggi dan rendah, pemacu dan diod bootstrap. Ia adalah bahagian yang sama yang digunakan pada GeForce RTX 2070 Founders Edition, yang mampu mengalirkan arus purata sehingga 55A.

    Dwi-fasa uP1666Q Ubiq Semiconductor mengawal litar pengawalan voltan memori melalui dua MOSFET dwi-N QM3816N6.

    Lebih menarik daripada bekalan kuasa GeForce GTX 1660 Ti XC Black Gaming yang agak mudah, mungkin, adalah hakikat bahawa PCB EVGA mempunyai pad kosong untuk dua fasa GPU tambahan. Terdapat juga sepasang penempatan untuk dua lagi modul memori GDDR6. Nvidia melakukan sesuatu yang serupa dengan GeForce GTX 1060, meninggalkan beberapa tempat kosong pada kad Edisi Pengasasnya yang tidak pernah diisi. Ini adalah langkah penjimatan masa dan kos, yang membolehkan syarikat menggunakan satu PCB untuk berbilang produk.

    Plat logam terletak di atas PCB, mengapit pad terma antara pemacu/MOSFET bersepadu, modul memori GDDR6 dan perintang deria semasa. Lebih banyak pad haba pada bahagian atas plat mengekalkan haba bergerak ke dalam pemasangan sinki utama, yang dipasang di sekeliling GPU pada empat titik dan diskrukan melalui bahagian belakang PCB.

    Penyelesaian haba itu sendiri terdiri daripada pad tembaga yang agak nipis yang membuat sentuhan terus dengan TU116. Tiga paip leper dipateri ke bahagian atasnya, dan susunan sirip aluminium, seterusnya, dipateri ke paip haba. Timbunan sirip yang agak tebal dibesar-besarkan oleh kain kafan, yang menempatkan satu kipas 85mm dan menambah lebih kedalaman. Semua diberitahu, GeForce GTX 1660 Ti XC Black Gaming EVGA memakan tiga slot pengembangan pada motherboard anda.

    EVGA berakhir dengan ketebalan perdagangan untuk panjang. GeForce GTX 1660 Ti XC Black Gaming mungkin 2” dalam, tetapi ia hanya kira-kira 7.5” (~190mm) panjang dan 4 ⅜” (111mm) tinggi. Selain itu, berbanding dengan kad Edisi Pengasas yang gemuk yang telah kami semak, jumlah berat sebanyak 1 lb. 7 oz. (656g) terasa sangat ringan.

    Di hadapan, GeForce GTX 1660 Ti XC Black Gaming mendedahkan satu penyambung DVI dwi pautan, port HDMI dan antara muka DisplayPort. Penyambung VirtualLink berasaskan USB Jenis-C yang dilihat pada setiap kad kelas Turing yang lain setakat ini telah hilang, tanda bahawa kami akan turun ke tahap prestasi yang tidak kondusif untuk permainan VR yang lancar (walaupun pada set kepala VR terbaik). Rakan kongsi lembaga yang memilih untuk menambah Pautan Maya pada reka bentuk mereka bebas untuk berbuat demikian; EVGA hanya tidak melaksanakannya pada model ini.

    Bagaimana Kami Menguji GeForce GTX 1660 Ti XC Black Gaming EVGA

    Jelas sekali, GeForce GTX 1660 Ti adalah lebih arus perdana daripada papan berasaskan Turing lain yang telah kami semak. Oleh itu, stesen kerja grafik kami, berdasarkan papan induk MSI Z170 Gaming M7 dan CPU Intel Core i7-7700K pada 4.2 GHz, adalah sesuai. Pemproses ini dilengkapi dengan kit memori F4-3000C15Q-16GRR G.Skill. SSD MX200 Crucial ada di sini, disertai oleh Intel DC P3700 1.6TB yang dimuatkan dengan permainan.

    Setakat persaingan, 1660 Ti kebanyakannya menentang GeForce GTX 1070, walaupun kami menyertakan 1070 Ti juga. Sudah tentu, perbandingan dengan GeForce GTX 1060 tidak dapat dielakkan. Semua kad tersebut disertakan dalam barisan kami, bersama dengan GeForce RTX 2060 dan GeForce RTX 2070. Dari segi AMD, kami kebanyakannya berminat dengan Radeon RX 590, walaupun Radeon RX Vega 64 dan Radeon RX Vega 56 menarik tambahan juga.

    Pemilihan penanda aras kami termasuk Ashes of the Singularity: Escalation, Battlefield V, Destiny 2, Far Cry 5, Forza Horizon 4, Grand Theft Auto V, Metro: Last Light Redux, Shadow of the Tomb Raider, Tom Clancy’s The Division, Tom Clancy’s Ghost Recon Wildlands, The Witcher 3 dan Wolfenstein II: The New Colossus.

    Metodologi ujian yang kami gunakan datang daripada PresentMon: Prestasi Dalam DirectX, OpenGL dan Vulkan. Ringkasnya, permainan ini dinilai menggunakan gabungan OCAT dan GUI dalaman kami sendiri untuk PresentMon, dengan pengelogan melalui GPU-Z.

    Kami menggunakan versi pemacu 418.91 untuk menguji GeForce GTX 1660 Ti dan membina 417.54 untuk semua yang lain. Kad AMD menggunakan Crimson Adrenalin 2019 Edisi 18.12.3.

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x