Русская Википедия:GeForce 40
Шаблон:NvidiaGPU GeForce 40 — семейство графических процессоров компании Nvidia. Серия была анонсирована 20 сентября 2022 года[1]. Видеокарты серии основаны на микроархитектуре Ada Lovelace.
История
20 сентября 2022 года на презентации исполнительный директор компании NVIDIA — Дженсен Хуанг, анонсировал архитектуру Ada Lovelace и первые продукты на ее основе - GeForce RTX 4090 и две GeForce RTX 4080 по цене MSRP 1599, 1199 и 899 долларов США соответственно. Также была представлена новая версия технологии умного сглаживания DLSS 3.0 и RTX Remix, предназначенная для модернизации графики[2].
14 октября 2022 года компания NVIDIA "деанонсировала" видеокарту GeForce RTX 4080 12GB в связи с путаницей в названии. Также опубликовала дату выхода GeForce RTX 4080 16GB - 16 ноября 2022 года.[3]
10 ноября 2022 года NVIDIA анонсировала видеокарту GeForce RTX 4070 Ti, которой стала переименованная GeForce RTX 4080 12GB. Дата показа — 3 января 2023 года, выход в свет назначен на 5 января 2023 года.
3 января, как и было обещано, NVIDIA продемонстрировала GeForce RTX 4070 Ti, а через пару дней она вышла в продажу.[4]
12 апреля 2023 года была представлена GeForce RTX 4070, начало продаж которой состоялось на следующий день.[5]
18 мая 2023 года NVIDIA представила RTX 4060 и RTX 4060 Ti,и также объявила что RTX 4060 Ti на 8ГБ выйдет 24 мая,а 4060 и 4060 Ti на 16ГБ выйдут в июле.
14 июня 2023 года NVIDIA объявила что RTX 4060 выйдет немного раньше,а именно — 29 июня.[6]
Архитектура
Архитектурные улучшения Ada Lovelace включают[7]:
- Ядра CUDA 9.x[8]
- Техпроцесс TSMC 4N
- Тензорные ядра четвёртого поколения с поддержкой FP8, FP16, bfloat16, TensorFloat-32 (TF32)
- Ядра трассировки лучей третьего поколения
- NVENC с аппаратной поддержкой AV1
Технические характеристики
Настольные
- Видеокарты 4060 и 4060 Ti имеют память GDDR6,остальные же видеокарты имеют память GDDR6X.
Модель | RTX 4060[9] | RTX 4060 Ti[10] | RTX 4070[11] | RTX 4070 Ti[12] | RTX 4080[13] | RTX 4090[14] | |
---|---|---|---|---|---|---|---|
Дата выхода | 29.06.2023 | 24.05.2023 | ??.07.2023 | 13.04.2023 | 05.01.2023 | 16.11.2022 | 12.10.2022 |
GPU | AD107 | AD106 | AD104 | AD103 | AD102 | ||
Технологический процесс изготовления | TSMC 4N | ||||||
Площадь кристалла, мм² | 159 | 188 | 294 | 379 | 609 | ||
Количество транзисторов, млрд | 18.9 | 22.9 | 35.8 | 45.9 | 76.3 | ||
Количество скалярных процессоров (ядер CUDA) | 3072 | 4352 | 5888 | 7680 | 9728 | 16384 | |
Количество тензорных ядер | 96 | 136 | 184 | 240 | 304 | 512 | |
Количество RT ядер | 24 | 34 | 46 | 60 | 76 | 128 | |
Количество кластеров обработки графики (GPC) | 2 | 3 | 4 | 5 | 7 | 11 | |
Количество блоков мультипроцессоров (SM) | 24 | 34 | 46 | 60 | 76 | 128 | |
Количество текстурных блоков (TMU) | 96 | 136 | 184 | 240 | 304 | 512 | |
Количество блоков растеризации (ROP) | 32 | 48 | 64 | 80 | 112 | 176 | |
Заполнение сцены, млрд пикс/с | 118.1 | 121.7 | 158.4 | 208.8 | 280.6 | 443.5 | |
Заполнение сцены, млрд текс/с | 236.2 | 344.8 | 455.4 | 626.4 | 761.5 | 1290.0 | |
Объём кэша L2, МБ | 24 | 32 | 36 | 48 | 64 | 72 | |
Разрядность шины видеопамяти, бит | 128 | 192 | 256 | 384 | |||
Стандарт видеопамяти | GDDR6 | GDDR6X | |||||
Объём видеопамяти, ГБ | 8 | 16 | 12 | 16 | 24 | ||
Пропускная способность шины памяти, ГБ/с | 272 | 288 | 504 | 720 | 1008 | ||
Интерфейс | PCI Express 4.0 x8 | PCI Express 4.0 x16 | |||||
Энергопотребление, Вт | 115 | 160 | 165 | 200 | 285 | 320 | 450 |
Частота ядра, МГц | 1830 | 2310 | 1920 | 2310 | 2205 | 2235 | |
Частота в режиме Turbo Boost, МГц | 2460 | 2535 | 2475 | 2610 | 2505 | 2520 | |
Реальная (номинальная) частота видеопамяти, МГц | 2125 (17000) | 2250 (18000) | 1313 (21000) | 1400 (22400) | 1313 (21000) | ||
Производительность FP32, TFLOPS | 15.11 | 26.06 | 29.15 | 40.09 | 48.74 | 82.58 | |
Производительность FP64, TFLOPS | 0.236 | 0.344 | 0.455 | 0.626 | 0.761 | 1.290 | |
Производительность FP16, TFLOPS | 15.11 | 26.06 | 29.15 | 40.09 | 48.74 | 82.58 | |
Производительность тензорных ядер INT8/INT4[15], TOPS | ? | ? | 116.8 | 160.4/320.8 | 194.9/389.8 | 330.3/660.6 | |
Производительность RT ядер, Giga Rays/s | ? | ? | ? | ? | ? | ? | |
Операций трассировки лучей, Tera RTX-OPS/s | ? | ? | ? | ? | ? | ? | |
Поддержка версий API | Direct3D 12_2, OpenGL 4.6, Vulkan 1.3, OpenCL 3.0 | ||||||
Поддержка версии Shader Model | Shader Model 6.5 |
Мобильные для ноутбуков
- Все модели оснащены памятью GDDR6.
Модель | RTX 4050 | RTX 4060 | RTX 4070 | RTX 4080 | RTX 4090 |
---|---|---|---|---|---|
Дата выхода | 22.02.2023 | 08.02.2023 | |||
GPU | AD107 | AD106 | AD104 | AD103 | |
Технологический процесс изготовления | TSMC 4N | ||||
Площадь кристалла, мм² | 156 | 186 | 294 | 378 | |
Количество транзисторов, млрд | 18.9 | 22.9 | 35.8 | 49.5 | |
Количество скалярных процессоров (ядер CUDA) | 2560 | 3072 | 4608 | 7424 | 9728 |
Количество тензорных ядер | 80 | 144 | 232 | 304 | |
Количество RT ядер | 20 | 36 | 58 | 76 | |
Количество текстурных блоков (TMU) | 80 | 96 | 144 | 232 | 304 |
Количество блоков растеризации (ROP) | 32 | 48 | 80 | 112 | |
Количество блоков мультипроцессоров (SM) | ? | ||||
Объём кэша L2, МБ | 12 | 32 | 48 | 64 | |
Разрядность шины видеопамяти, бит | 96 | 128 | 192 | 256 | |
Стандарт видеопамяти | GDDR6 | ||||
Объём видеопамяти, ГБ | 6 | 8 | 12 | 16 | |
Пропускная способность шины памяти, ГБ/с | ? | ||||
Энергопотребление, Вт | 35-115 | 60-150 | 80-150 | ||
Частота ядра, МГц | 1650 | 1470 | 1230 | 1350 | 1455 |
Частота в режиме Turbo Boost, МГц | 2370 | 2175 | 2280 | 2040 | |
Реальная (номинальная) частота видеопамяти, МГц | ? | ||||
Производительность FP32, TFLOPS | ? | ||||
Производительность FP64, TFLOPS | ? | ||||
Производительность FP16, TFLOPS | ? | ||||
Поддержка версий API | Direct3D 12_2, OpenGL 4.6, Vulkan 1.3, OpenCL 3.0 | ||||
Поддержка версии Shader Model | Shader Model 6.5 |
Примечания
Ссылки
- GeForce RTX 40 на официальном сайте NVidiaШаблон:Ref-ru
- Три новых видеокарты GeForce RTX 4060 от Nvidia на rualligator.ru
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Целочисленные операции над значениями с 8 и 4 битами соответственно. (То есть 0..255 и 0..15) — «Turing’s tensor cores also support INT8 and even INT4 precisions. These are 2x and 4x faster than FP16 respectively» Шаблон:Wayback
Шаблон:Выбор языка Шаблон:Nvidia