Lompat ke konten

Ulasan Nvidia GeForce GTX 1660: Serangan Turing Berterusan

    1646061603

    Keputusan Kami

    Berdasarkan pemproses TU116 yang sama seperti GeForce GTX 1660 Ti, GeForce GTX 1660 Nvidia kehilangan dua Berbilangpemproses Penstriman dan menukar memori GDDR6 kepada GDDR5 yang lebih perlahan. Akibatnya, ia kekal sebagai pilihan terbaik untuk permainan pada 1920×1080 tetapi tidak disyorkan untuk 2560×1440. Pastikan anda membeli perbandingan sebelum membuat pembelian anda. Tawaran hangat pada kad Radeon RX 580 mungkin perlu dilihat, walaupun prestasinya lebih rendah.

    Untuk

    Prestasi 1080p yang sangat baik
    Harga menarik pada $220 pintu masuk
    Penggunaan kuasa 120W yang munasabah membantu mengekalkan haba dan bunyi yang rendah

    Terhadap

    Tidak sesuai untuk permainan 1440p
    Profil kuasa serupa dengan GeForce GTX 1660 Ti yang lebih pantas

    Ulasan Nvidia GeForce GTX 1660

    Ia hanya menunggu masa sebelum Nvidia menggunakan pemproses grafik TU116 yang tulen dalam GeForce GTX 1660 Ti dan mengukirnya sedikit untuk mencipta derivatif kos lebih rendah. GeForce GTX 1660 baharu, tidak menghairankan, sangat serupa dengan model kelas atas kerana ia tidak mempunyai teras RT dan Tensor tandatangan seni bina Turing. Sebaliknya, ia menyasarkan sumber on-die untuk mempercepatkan permainan rasterisasi hari ini.

    Nvidia tidak mengurangkan banyak daripada kumpulan sumber TU116 dalam penciptaan GeForce GTX 1660: sepasang Berbilangpemproses Penstriman dikeluarkan, mengambil 128 teras CUDA dan lapan unit tekstur bersamanya. Tetapi GPU sebaliknya agak lengkap. Kerugian terbesar kad ini ialah kekurangan memori GDDR6. Dengan menukar dalam 8 Gb/s GDDR5 sebaliknya, lebar jalur turun daripada 1660 Ti 288 GB/s kepada 192 GB/s sahaja.

    Nvidia Geforce GTX 1660 (Nvidia) di Amazon untuk $605.32

    Sememangnya, GeForce GTX 1660 ditujukan terutamanya untuk permainan FHD, di mana memori 6GB yang lebih perlahan tidak akan menjejaskan prestasi sama seperti pada resolusi yang lebih tinggi. Bolehkah papan $220/£200 mengekalkan kadar bingkai yang cukup pantas untuk menghalang Radeon RX 590 AMD dengan lebih GDDR5 pada bas yang lebih luas?

    Rekap TU116: Turing Tanpa Teras RT dan Tensor

    GPU di tengah-tengah GeForce GTX 1660 dinamakan secara khusus TU116-300-A1. Ia adalah saudara terdekat kepada GeForce GTX 1660 Ti TU116-400-A1, dipotong daripada 24 Berbilang Pemproses Penstriman kepada 22. Jelas sekali kami masih berurusan dengan pemproses yang tidak mempunyai teras RT dan Tensor Nvidia yang kelihatan pada masa hadapan, berukuran 284mm² dan terdiri daripada 6.6 bilion transistor yang dihasilkan menggunakan proses FinFET 12nm TSMC.

    Walaupun transistornya lebih kecil, TU116 adalah 42 peratus lebih besar daripada pemproses GP106 yang mendahuluinya. Sebahagian daripada pertumbuhan itu adalah disebabkan oleh pelorek seni bina Turing yang lebih canggih. Seperti kad siri GeForce RTX 20 yang lebih tinggi, GeForce GTX 1660 menyokong pelaksanaan serentak arahan aritmetik FP32, yang membentuk kebanyakan beban kerja shader, dan operasi INT32 (untuk menangani/mengambil data, titik terapung min/maks, bandingkan, dsb. ). Apabila anda mendengar tentang teras Turing yang mencapai prestasi yang lebih baik daripada Pascal pada kadar jam tertentu, keupayaan ini sebahagian besarnya menerangkan sebabnya.

    Berbilang Pemproses Penstriman Turing terdiri daripada teras CUDA yang lebih sedikit daripada Pascal, tetapi reka bentuk mengimbangi sebahagiannya dengan menyebarkan lebih banyak SM pada setiap GPU. Seni bina yang lebih baharu memperuntukkan satu penjadual kepada setiap set 16 teras CUDA (2x Pascal), bersama-sama dengan satu unit penghantaran bagi setiap 16 teras CUDA (sama seperti Pascal). Empat daripada kumpulan 16 teras tersebut terdiri daripada SM, bersama-sama dengan 96KB cache yang boleh dikonfigurasikan sebagai memori kongsi 64KB L1/32KB atau sebaliknya, dan empat unit tekstur. Oleh kerana Turing menggandakan penjadual, ia hanya perlu mengeluarkan arahan kepada teras CUDA setiap kitaran jam lain untuk memastikannya penuh. Di antaranya, adalah percuma untuk mengeluarkan arahan berbeza kepada mana-mana unit lain, termasuk teras INT32.

    Dalam TU116, Nvidia menggantikan teras Tensor Turing dengan 128 teras FP16 khusus bagi setiap SM, yang membolehkan GeForce GTX 1660 memproses operasi separuh ketepatan pada kadar 2x ganda FP32. GPU berasaskan Turing yang lain mempunyai FP16 kadar dua kali juga melalui teras Tensor mereka, jadi konfigurasi TU116 berfungsi untuk mengekalkan standard itu melalui perkakasan yang disediakan khusus untuk GPU ini. Carta berikut ialah versi terkini yang diterbitkan dalam ulasan GeForce GTX 1660 Ti kami, yang menggambarkan peningkatan besar TU116 kepada daya pemprosesan separuh ketepatan berbanding GeForce GTX 1060 dan cip GP106 berasaskan Pascal.

    Apabila kami menjalankan modul Analisis Saintifik Sandra, yang menguji pendaraban matriks umum, kami melihat berapa banyak lagi yang dicapai oleh teras Tensor TU106 melalui FP16 berbanding TU116. GeForce GTX 1060, yang hanya menyokong FP16 secara simbolik, hampir tidak mendaftar pada carta sama sekali.

    Sebagai tambahan kepada pelorek seni bina Turing dan cache bersatu, TU116 juga menyokong sepasang algoritma yang dipanggil Teduhan Penyesuaian Kandungan dan Teduhan Penyesuaian Gerakan, bersama-sama dirujuk sebagai Lorekan Kadar Pembolehubah. Kami merangkumi teknologi ini dalam Nvidia’s Turing Architecture Explored: Inside the GeForce RTX 2080. Kisah itu juga memperkenalkan keupayaan pengekodan dan penyahkod video dipercepatkan Turing, yang dibawa ke GeForce GTX 1660 juga.

    Menyatukan Semuanya…

    Nvidia mengemas 24 SM ke dalam TU116, membahagikannya antara tiga Kluster Pemprosesan Grafik. Dengan 64 teras FP32 bagi setiap SM, itu adalah 1,536 teras CUDA dan 96 unit tekstur merentas keseluruhan GPU. Apabila kehilangan dua SM, GeForce GTX 1660 berakhir dengan 1,408 teras CUDA aktif dan 88 unit tekstur yang boleh digunakan.

    Rakan kongsi Lembaga sudah pasti akan menyasarkan julat frekuensi untuk membezakan kad mereka. Walau bagaimanapun, kadar jam asas rasmi ialah 1,530 MHz dengan spesifikasi GPU Boost sebanyak 1,785 MHz. Kedua-dua nombor tersebut lebih tinggi sedikit daripada jam GeForce GTX 1660 Ti, walaupun ia tidak dapat mengimbangi sepenuhnya SM yang hilang.

    Sampel Gigabyte GeForce GTX 1660 OC 6G kami mengekalkan 1,935 MHz yang stabil melalui tiga larian Metro: Last Light, beroperasi kira-kira 90 MHz lebih pantas daripada 1660 Ti yang kami semak beberapa minggu lalu. Di atas kertas, GeForce GTX 1660 menawarkan sehingga 5 TFLOPS prestasi FP32 dan 10 TFLOPS FP16 throughput.

    Enam pengawal memori 32-bit memberikan TU116 bas 192-bit agregat, yang dihuni oleh modul GDDR5 8 Gb/s yang menolak sehingga 192 GB/s. Itu setanding dengan GeForce GTX 1060 6GB, dan pengurangan sebanyak 33% berbanding GeForce GTX 1660 Ti. Digabungkan dengan kehilangan dua SM, menurun daripada GDDR6 kepada akaun memori GDDR5 untuk prestasi GeForce GTX 1660 yang lebih rendah berbanding 1660 Ti.

    Setiap pengawal memori dikaitkan dengan lapan ROP dan kepingan 256KB cache L2. Secara keseluruhan, TU116 mendedahkan 48 ROP dan 1.5MB L2. Kiraan ROP GeForce GTX 1660 berbanding dengan RTX 2060, yang juga menggunakan 48 output paparan. Tetapi kepingan cache L2 TU116 adalah separuh lebih besar berbanding TU106.

    Memandangkan persamaan dengan GeForce GTX 1660 Ti, tidak mengejutkan bahawa GeForce GTX 1660 dinilai untuk 120W yang sama. Malangnya, kedua-dua kad grafik tidak termasuk sokongan berbilang GPU. Nvidia terus menolak naratif bahawa SLI bertujuan untuk memacu prestasi mutlak yang lebih tinggi, dan bukannya memberi pemain cara untuk memadankan konfigurasi GPU tunggal.

    Gigabyte GeForce GTX 1660 OC 6GGeForce GTX 1660 TiGeForce RTX 2060 FEGeForce GTX 1060 FEGeForce GTX 1060 FEGeForce GTX 1070 FE Architecture (GPU) Teras CUDA Puncak FP32 Kira Teras Tensor Teras RTTeras Unit Tekstur Bandar Kadar Memori Rate TDP Kapas Memori Bas ROwid Capa ROD Sokongan SLI Saiz Mati Kira

    Turing (TU116)
    Turing (TU116)
    Turing (TU106)
    Pascal (GP106)
    Pascal (GP104)

    1408
    1536
    1920
    1280
    1920

    5 TFLOPS
    5.4 TFLOPS
    6.45 TLFOPS
    4.4 TFLOPS
    6.5 TFLOPS

    T/A
    T/A
    240
    T/A
    T/A

    T/A
    T/A
    30
    T/A
    T/A

    88
    96
    120
    80
    120

    1530 MHz
    1500 MHz
    1365 MHz
    1506 MHz
    1506 MHz

    1785 MHz
    1770 MHz
    1680 MHz
    1708 MHz
    1683 MHz

    6GB GDDR5
    6GB GDDR6
    6GB GDDR6
    6GB GDDR5
    8GB GDDR5

    192-bit
    192-bit
    192-bit
    192-bit
    256-bit

    192 GB/s
    288 GB/s
    336 GB/s
    192 GB/s
    256 GB/s

    48
    48
    48
    48
    64

    1.5MB
    1.5MB
    3MB
    1.5MB
    2MB

    120W
    120W
    160W
    120W
    150W

    6.6 bilion
    6.6 bilion
    10.8 bilion
    4.4 bilion
    7.2 bilion

    284 mm²
    284 mm²
    445 mm²
    200 mm²
    314 mm²

    Tidak
    Tidak
    Tidak
    Tidak
    Ya (MIO)

    0 0 votes
    Rating post
    Subscribe
    Notify of
    guest
    0 comments
    Inline Feedbacks
    View all comments
    0
    Would love your thoughts, please comment.x
    ()
    x