Русская Википедия:FeiTeng-1000

Материал из Онлайн справочника
Перейти к навигацииПерейти к поиску

Шаблон:Карточка центрального процессора FeiTeng (Шаблон:Китайский) — линейка центральных процессоров, разработанных в Китае,[1] в National University of Defense Technology командой под руководством профессора Син Цзочэна[2].

Процессор FeiTeng-1000 является третьим поколением процессоров семейства YinHeFeiTeng (银河飞騰, YHFT), разрабатываемом под руководством профессора Син Цзочэна[2]. Первое поколение YHFT реализовывало архитектуру класса EPIC, полностью совместимую по машинному коду с Intel Itanium 2. Второе поколение, FT64, представляло собой систему-на-кристалле из процессора общего назначения и 64-битного потокового процессора. Эти процессоры использовались в компьютерах YinHe (银河) в качестве ускорителя.[3]

Следующей за FT-1000 моделью стал 16-ти ядерный FeiTeng-1500.

FeiTeng-1000

Производится по техпроцессу 65 нм, состоит из 350 млн транзисторов.[4] FeiTeng-1000 совместим с SPARC v9. Возможно был изготовлен с использованием наработок проекта OpenSPARC.[5]

В суперкомпьютере Tianhe-1A в 1024 сервисных узлах[6][1] установлено суммарно 2048 процессоров FeiTeng 1000 (по 2 чипа в узле). Каждый процессор имеет 8 ядер и поддерживает исполнение 64 потоков. Работает на частотах 800—1000 МГц. В чип встроены 3 канала HT, 4 контроллера DDR3 (базовая частота 400 МГц[6]), канал PCIe 2.0 x8[7]

Кеш L2 разделен на 8 частей, по 2 части на каждый контроллер памяти. Связь между ядрами и кешем — через Cache Crossbar.[6]

Galaxy FT-1500

Процессоры FeiTeng-1500[8] и FeiTeng-2000 планировались к использованию в следующих поколениях компьютеров TianHe.[6][3]

В суперкомпьютере Tianhe-2 установлено чуть более 4 тысяч 16-ядерных процессоров Galaxy FT-1500 c архитектурой Sparc v9, изготовленных по техпроцессу 40 нм, работающих на частоте 1,8 ГГц с тепловыделением 65 Вт[9]. Производительность FT-1500 составляет 115—144 GFLOPS; каждое его ядро исполняет до 8 чередующихся потоков и может исполнять 256-битные SIMD-операции, в том числе FMA (умножение-сложение). Для каждого ядра доступна кеш-память, работающая на 2 ГГц, с объёмами: 16 КБ L1 инструкций, 16 КБ L1 данных, 512 КБ L2; для всех ядер также доступна общая L3 кеш-память размером 4 МБ (4 банка по 1 МБ с 32-канальной ассоциативностью, по банку на ячейку из 4 ядер), используется протокол когерентности с использованием справочника. Чип FT-1500 является системой на кристалле и кроме ядер и кеш-памяти содержит:[10]

  • линии межпроцессорной связи,
  • 4 интегрированных контроллера памяти DDR3,
  • 2 корневых контроллера PCI-express,
  • порты 10 Gbit Ethernet.

См. также

Примечания

Шаблон:Примечания

Ссылки

Шаблон:Compu-stub

  1. 1,0 1,1 U.S. says China building 'entirely indigenous' supercomputer, by Patrick Thibodeau Computerworld, November 4, 2010 [1] Шаблон:Wayback
  2. 2,0 2,1 http://www.ee.ust.hk/ece.php/event/detail/671 Шаблон:Wayback «Prof. Xing and his team developed FT-1000/1000A/1500 series multi-core processors, the world’s first general-purpose 64-bit stream processor for scientific computing, and the world’s first CPU compatible with Intel Itanium processor.»
  3. 3,0 3,1 Шаблон:Cite web
  4. Шаблон:Cite web
  5. http://www.prace-project.eu/IMG/pdf/d8.4_1ip.pdf Шаблон:Wayback page 41
  6. 6,0 6,1 6,2 6,3 The TianHe-1A Supercomputer: Its Hardware and Software by Xue-Jun Yang, Xiang-Ke Liao, et al in the Journal of Computer Science and Technology, Volume 26, Number 3, May 2011, pages 344—351 Шаблон:Cite web
  7. Шаблон:Cite news
  8. Тихоокеанско-азиатские петафлопсы: «В более мощных образцах суперкомпьютеров .. планируется применение новых СБИС собственной разработки, в частности … мультитредовых микропроцессоров нового поколения FT-1500 и FT-2000 с количеством аппаратно поддерживаемых тредов 128 и более.»
  9. Dongarra, Jack (3 June 2013). "Visit to the National University for Defense Technology Changsha, China" Шаблон:Wayback (PDF). Netlib. Шаблон:Ref-en page 9.
  10. MilkyWay-2 supercomputer: system and application. Xiangke LIAO, Liquan XIAO, Canqun YANG, Yutong LU. Front. Comput. Sci., 2014, 8(3): 345–356 DOI:10.1007/s11704-014-3501-3 (September 6, 2013).