Русская Википедия:GeForce 20

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:NvidiaGPU GeForce RTX 20 Series — семейство графических процессоров NVIDIA, представленное 20 августа 2018 года в рамках конференции Gamescom. Чипы семейства GeForce RTX 20 основаны на новой архитектуре Turing, названной в честь английского математика, логика и криптографа Алана Тьюринга. Заявлено увеличение производительности до 6 раз в области трассировки лучей по сравнению с графическими процессорами предыдущего поколения. В продаже с 15 января 2019 года.

Архитектура

Серия GeForce RTX 20 поддерживает трассировку лучей в реальном времени, которая реализована с помощью новых RT-ядер. Для увеличения детализации изображения используются решения на базе искусственного интеллекта[1].

Новые возможности в TU10x:

  • RT-ядра (аппаратное ускорение трассировки лучей)
  • Тензорные ядра (операции глубинного обучения, DLSS)
  • Контроллер памяти с поддержкой GDDR6
  • Переработано внутреннее устройство SM, появилась возможность исполнять INT32 и FP32 команды в одном такте, что может значительно повысить производительность
  • Mesh Shading
  • Уровень поддержки API DX12 значительно повышен
  • Увеличена производительность Vulkan API
  • Улучшена работа с асинхронными вычислениями из-за уменьшения задержек и разделения SM блоков
  • GPU Boost 4 — управление частотой и напряжением для разгона и Nvidia Scanner, система автоматического разгона
  • NVLink Bridge — для объединения двух видеокарт (замена интерфейса SLI), позволяющая повысить скорость обменов и получать доступ к видеопамяти обоих устройств
  • VirtualLink VR — стандарт одновременной передачи видеопотока и управляющих сигналов USB 3.1 через порт USB Type-C для уменьшения задержек в системах виртуальной реальности (замена HDMI).

Технические характеристики

Модель RTX 2060[2] RTX 2060 Super[3] RTX 2070[4] RTX 2070 Super[5] RTX 2080[6] RTX 2080 Super[7] RTX 2080 Ti[8] TITAN RTX[9]
Дата выхода 15.01.2019 09.07.2019 17.10.2018 09.07.2019 20.09.2018 23.07.2019 20.09.2018 03.12.2018
GPU TU106 TU104 TU102
Технологический процесс изготовления TSMC 12-нм
Площадь кристалла, мм² 445 545 754
Количество транзисторов, млрд 10,8 13,6 18,6
Количество скалярных процессоров (ядер CUDA) 1920 2176 2304 2560 2944 3072 4352 4608
Количество тензорных ядер 240 272 288 320 368 384 544 576
Количество RT ядер 30 34 36 40 46 48 68 72
Количество кластеров обработки графики (GPC) 3 5 6
Количество блоков мультипроцессоров (SM) 30 34 36 40 46 48 68 72
Количество текстурных блоков (TMU) 120 136 144 160 184 192 272 288
Количество блоков растеризации (ROP) 48 64 88 96
Заполнение сцены, млрд пикс/с 65,52 94,0 90,2 102,7 96,9 105,6 118,8 129,6
Заполнение сцены, млрд текс/с 163,8 199,9 203,4 256,8 278,7 316,8 367,2 388,8
Объём кэша L2, КБ 3072 4096 5632 6144
Разрядность шины видеопамяти, бит 192 256 352 384
Стандарт видеопамяти GDDR6
Объём видеопамяти, ГБ 6 8 11 24
Пропускная способность шины памяти, ГБ/с 336 448 492 616 672
Интерфейс PCI Express 3.0 x16
Энергопотребление, Вт 160 175 215 250 280
Частота ядра, МГц 1365 1470 1410 1605 1515 1650 1350
Частота в режиме Turbo Boost, МГц 1680 1650 1620 1770 1710 1815 1545 1770
Реальная (эффективная) частота видеопамяти, МГц 1750 (14000) 1925 (15400) 1750 (14000)
Производительность FP32, GFLOPS 5241,6 6397,4 6497,2 8217,6 8920,3 10137,6 11750,4 12441,6
Производительность FP64, GFLOPS 163,8 199,9 203,0 256,8 278,7 316,8 367,2 388,8
Производительность FP16, GFLOPS 10483,2 12794,8 12994,4 16435,2 17840,6 20275,2 23500,8 24883,2
Производительность тензорных ядер FP16, TFLOPS 41,9 51,9 71,3 94,0 99,5
Производительность тензорных ядер INT8/INT4[10], TOPS 83,8/167,7 103,9/207,9 142,7/285,4 188,0/376,0 199,0/398,1
Производительность RT ядер, Giga Rays/s 5 6 7 8 10 11
Операций трассировки лучей, Tera RTX-OPS/s 37 41 45 52 60 63 78 84
Поддержка версий API Direct3D 12_1, OpenGL 4.6, Vulkan 1.3, OpenCL 3.0
Поддержка версии Shader Model Shader Model 6.5

Примечания

Шаблон:Примечания

Ссылки

Шаблон:Nvidia

  1. Шаблон:Cite web
  2. Ошибка цитирования Неверный тег <ref>; для сносок автоссылка2 не указан текст
  3. Шаблон:Cite web
  4. Шаблон:Cite web
  5. Шаблон:Cite web
  6. Шаблон:Cite web
  7. Шаблон:Cite web
  8. Шаблон:Cite web
  9. Шаблон:Cite web
  10. Целочисленные операции над значениями с 8 и 4 битами соответственно. (То есть 0..255 и 0..15) — «Turing’s tensor cores also support INT8 and even INT4 precisions. These are 2x and 4x faster than FP16 respectively» Шаблон:Wayback