Русская Википедия:Тензорный процессор Google

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:О Шаблон:Архитектура CPU Тензорный процессор Google (Шаблон:Lang-en) — тензорный процессор, относящийся к классу нейронных процессоров, являющийся специализированной интегральной схемой, разработанной корпорацией Google и предназначенной для использования с библиотекой машинного обучения TensorFlow. Представлен в 2016 году на конференции Google I/O, при этом утверждалось, что устройства к тому моменту уже использовались внутри корпорации Google более года[1][2].

По сравнению с графическими процессорами, рассчитан на более высокий объём вычислений с пониженной точностью (например, всего 8-разрядную точность[3]) при более высокой производительности на ватт и отсутствии модуля для растризации и текстурных блоков[1][2].

Утверждается, что тензорные процессоры применялись в серии игр в го программы AlphaGo против Ли Седоля[2] и в следующих подобных поединках[4]. Также корпорация применила тензорные процессоры для обработки фотографий Google Street View на предмет извлечения текста, сообщалось, что весь объём обработан менее чем за пять дней. В Google Фото один тензорный процессор может обрабатывать более 100 миллионов фотографий в день. Также устройство применяется для самообучающейся системы RankBrain, обрабатывающей отклики поисковой системы Google.

Устройство реализовано как матричный умножитель для 8-разрядных чисел, управляемый CISC-инструкциями центрального процессора по шине PCIe 3.0. Изготавливается по технологии 28 нм, тактовая частота составляет 700 МГц и имеет тепловую расчётную мощность 28—40 Вт. Оснащается 28 Мбайт встроенной оперативной памяти и 4 Мбайт 32-разрядных аккумуляторов, накапливающих результаты в массивах из 8-битных множителей, организованных в матрицу размером 256×256. Инструкции устройства передают данные на узел или получают их из него, выполняют матричные умножения или свёртки[5]. В такт может производиться 65536 умножений на каждой матрице; в секунду — до 92 трлн[6].

Сравнительных характеристики тензорных процессоров

Характеристики TPU:[7][8][9]
TPUv1 TPUv2 TPUv3 TPUv4[8][10]
Дата выхода 2016 2017 2018 2021
Технологический процесс 28 нм 16 нм 16 нм 7 нм
Размер чипа (мм2) 331 < 625 < 700 < 400
Встроенная память (МиБ) 28 32 32 144
Тактовая частота (МГц) 700 700 940 1050
Оперативная память 8 ГиБ DDR3 16 ГиБ HBM 32 ГиБ HBM 32 ГиБ HBM
Пропускная способность памяти 34 ГБ/с 600 ГБ/с 900 ГБ/с 1200 ГБ/с
Тепловая схема питания (Вт) 75 280 220 170
TOPS (Трлн. операций в секунду) 23 45 123 275
TOPS/Вт 0.31 0.16 0.56 1.62

Примечания

Шаблон:Примечания

Ссылки

Шаблон:Rq