Русская Википедия:Тензорный процессор Google
Шаблон:О Шаблон:Архитектура CPU Тензорный процессор Google (Шаблон:Lang-en) — тензорный процессор, относящийся к классу нейронных процессоров, являющийся специализированной интегральной схемой, разработанной корпорацией Google и предназначенной для использования с библиотекой машинного обучения TensorFlow. Представлен в 2016 году на конференции Google I/O, при этом утверждалось, что устройства к тому моменту уже использовались внутри корпорации Google более года[1][2].
По сравнению с графическими процессорами, рассчитан на более высокий объём вычислений с пониженной точностью (например, всего 8-разрядную точность[3]) при более высокой производительности на ватт и отсутствии модуля для растризации и текстурных блоков[1][2].
Утверждается, что тензорные процессоры применялись в серии игр в го программы AlphaGo против Ли Седоля[2] и в следующих подобных поединках[4]. Также корпорация применила тензорные процессоры для обработки фотографий Google Street View на предмет извлечения текста, сообщалось, что весь объём обработан менее чем за пять дней. В Google Фото один тензорный процессор может обрабатывать более 100 миллионов фотографий в день. Также устройство применяется для самообучающейся системы RankBrain, обрабатывающей отклики поисковой системы Google.
Устройство реализовано как матричный умножитель для 8-разрядных чисел, управляемый CISC-инструкциями центрального процессора по шине PCIe 3.0. Изготавливается по технологии 28 нм, тактовая частота составляет 700 МГц и имеет тепловую расчётную мощность 28—40 Вт. Оснащается 28 Мбайт встроенной оперативной памяти и 4 Мбайт 32-разрядных аккумуляторов, накапливающих результаты в массивах из 8-битных множителей, организованных в матрицу размером 256×256. Инструкции устройства передают данные на узел или получают их из него, выполняют матричные умножения или свёртки[5]. В такт может производиться 65536 умножений на каждой матрице; в секунду — до 92 трлн[6].
Сравнительных характеристики тензорных процессоров
TPUv1 | TPUv2 | TPUv3 | TPUv4[8][10] | |
---|---|---|---|---|
Дата выхода | 2016 | 2017 | 2018 | 2021 |
Технологический процесс | 28 нм | 16 нм | 16 нм | 7 нм |
Размер чипа (мм2) | 331 | < 625 | < 700 | < 400 |
Встроенная память (МиБ) | 28 | 32 | 32 | 144 |
Тактовая частота (МГц) | 700 | 700 | 940 | 1050 |
Оперативная память | 8 ГиБ DDR3 | 16 ГиБ HBM | 32 ГиБ HBM | 32 ГиБ HBM |
Пропускная способность памяти | 34 ГБ/с | 600 ГБ/с | 900 ГБ/с | 1200 ГБ/с |
Тепловая схема питания (Вт) | 75 | 280 | 220 | 170 |
TOPS (Трлн. операций в секунду) | 23 | 45 | 123 | 275 |
TOPS/Вт | 0.31 | 0.16 | 0.56 | 1.62 |
Примечания
Ссылки
- ↑ 1,0 1,1 Шаблон:Cite news
- ↑ 2,0 2,1 2,2 Шаблон:Cite web
- ↑ Шаблон:Cite web
- ↑ Шаблон:YouTube (23 мая 2017)
- ↑ Шаблон:Cite web (44th International Symposium on Computer Architecture (ISCA), 2017)
- ↑ Шаблон:Cite news
- ↑ Шаблон:Cite conference
- ↑ 8,0 8,1 Шаблон:Cite web
- ↑ Шаблон:Cite news
- ↑ Stay tuned, more information on TPU v4 is coming soon, retrieved 2020-08-06.