Русская Википедия:ECC-память

DIMM для ECC-памяти обычно содержит девять чипов памяти на каждой стороне, на один больше, чем для обычной памяти^[1]

ECC-память (Шаблон:Lang-en, память с коррекцией ошибок) — тип компьютерной памяти, которая автоматически распознаёт и исправляет спонтанно возникшие изменения (ошибки) битов памяти. Память, не поддерживающая коррекции ошибок, обозначается non-ECC.

Как правило, память с коррекцией ошибок может исправлять изменения одного бита в одном машинном слове. Это значит, что при чтении одного машинного слова из памяти будет прочтено то же значение, что было до этого записано, даже если в промежутке между записью и чтением один бит был случайно изменён (например, под действием космических лучей). Обычная память, как правило, не способна определить, была ли ошибка, хотя некоторые виды памяти с контролем чётности способны определить, что произошла ошибка, но не способны её исправить.

Память с коррекцией ошибок используется в большинстве компьютеров, для которых важна бесперебойная работа, в том числе в большинстве серверов. Для работы памяти в режиме коррекции ошибок требуется поддержка со стороны контроллера оперативной памяти, который может быть составной частью чипсета или встраиваться в систему на кристалле, единую с вычислительными ядрами.

Наиболее базовый алгоритм коррекции ошибок основан на коде Хэмминга. Однако существуют и другие алгоритмы, способные исправлять более одной ошибки.

На практике широко применяется DDR* SDRAM ECC-память для серверов с кодом класса SECDED (исправление одиночных и детектирование двойных ошибок). На модулях памяти на каждые 8 микросхем добавляется ещё по одной микросхеме, которая хранит ECC-коды размером 8 бит на каждые 64 бита основной памяти^[2].

Также схемы ECC-защиты данных могут применяться для встроенной в микропроцессоры памяти: кэш-памяти, регистрового файла. Иногда контроль также добавляют в вычислительные схемы.

Описание проблемы

Электромагнитные помехи внутри компьютерной системы способны спонтанно поменять состояние ячейки компьютерной памяти. Самой частой причиной такого изменения являются нейтроны из космических лучей^[3]. Поэтому частота ошибок в компьютерных системах возрастает при увеличении высоты. Так, поток нейтронов в 3,5 раза больше на высоте 1,5 км и в 300 раз больше на высоте 10-12 км (типичной высоте полёта пассажирских самолётов), чем на уровне моря^[4]. Поэтому системы, работающие на большой высоте, требуют большей защиты.

Например, на космическом аппарате Кассини-Гюйгенс установлены два идентичных устройства записи, каждое из которых содержит 2,5 гигабита памяти. На протяжении первых 2,5 лет полёта регистрировалось примерно постоянное количество ошибок каждый день: примерно 280 ошибок в день. Однако в течение одного дня (6 ноября 1997 года) число ошибок возросло в четыре раза. Считается, что это произошло из-за геомагнитной бури^[5] (также Шаблон:Нп5), которая была зафиксирована спутником GOES 9^[6].

Существуют опасения, что тенденция к уменьшению физических размеров модулей памяти приведёт к увеличению частоты возникновения ошибок из-за того, что частицы меньших энергий будут способны изменить бит^[4]. С другой стороны, компактные размеры памяти уменьшают вероятность попадания частиц в неё. Кроме того, переход на такие технологии, как кремний на изоляторе, может сделать память более устойчивой^[7].

Исследование, проведённое на большом количестве серверов Google, показало, что количество ошибок может составлять от Шаблон:Num до Шаблон:Num за миллиард рабочих часов (Шаблон:Lang-en) на мегабит (то есть 2,5-7,0 × 10⁻¹¹ ошибок / бит·час)^[8].

Технология

Одним из решений проблемы является контроль чётности — использование дополнительного бита, который записывает чётность остальных битов. Такой подход позволяет обнаруживать ошибки, но не позволяет исправлять их, поэтому при обнаружении ошибки можно лишь прервать выполнение программы.

Более надёжным является подход, при котором используются коды с коррекцией ошибок. Самым часто используемым кодом с коррекцией ошибок является код Хэмминга. Большинство видов памяти с коррекцией ошибок, используемых в современных компьютерах, может исправлять ошибку одного бита в одном 64-битном машинном слове и определить, но не исправить, ошибку в двух битах в одном 64-битном слове^[9].

Наиболее эффективный подход к исправлению ошибок зависит от вида ожидаемых ошибок. Часто предполагается, что изменения различных битов происходят независимо — в таком случае вероятность двух ошибок в одном слове пренебрежимо мала. Однако это предположение не выполняется для современных компьютеров. Технология коррекции ошибок Шаблон:Нп5 (IBM) позволяет исправлять несколько ошибок, в том числе и при порче целого чипа памяти. Другие технологии коррекции памяти, которые не предполагают независимости ошибок в разных битах, включают Шаблон:Нп5 (Sun Microsystems), Шаблон:Нп5 (Hewlett-Packard) и Шаблон:Нп5 (Intel).

Многие старые системы сообщали лишь о тех из обнаруженных ошибок, которые невозможно было исправить, и не сообщали об исправленных. Современные системы записывают как исправимые ошибки (CE, Шаблон:Lang-en), так и неисправимые (UE, Шаблон:Lang-en). Это позволяет вовремя заменить испорченную память: несмотря на то, что большое количество исправленных ошибок при отсутствии неисправимых ошибок не влияет на корректность работы памяти, это может свидетельствовать о том, что для данного модуля памяти вероятность появления неисправимых ошибок в будущем возрастёт^[10].

Преимущество и недостатки

Память с коррекцией ошибок защищает от некорректной работы компьютерной системы в связи с порчей памяти и уменьшает вероятность фатального отказа системы. Однако такая память стоит дороже; материнская плата, чипсет и процессор, которые поддерживают память с коррекцией ошибок, также могут быть дороже, поэтому такая память, как правило, используется лишь в системах, для которых критически важна бесперебойная и корректная работа, таких, например, как файловый сервер, научные и финансовые приложения.

Для проверки сумм часто требуется один дополнительный такт контроллера памяти. Дополнительная логика, реализующая подсчет, проверку ECC и исправление ошибок, требует логических ресурсов и времени на свою работу либо в самом контроллере памяти, либо в интерфейсе между CPU и контроллером памяти^[11]. Поэтому память с коррекцией ошибок работает на 2-3 % медленнее, чем обычная память, в зависимости от приложений^[12].

См. также

Примечания

Шаблон:Примечания

Ссылки

Шаблон:DRAM

↑ Шаблон:Cite web
↑ Шаблон:Cite web
↑ Ошибка цитирования Неверный тег <ref>; для сносок Boeing1 не указан текст
↑ ^4,0 ^4,1 «A Survey of Techniques for Modeling and Improving Reliability of Computing Systems», IEEE TPDS, 2015
↑ Шаблон:Cite web
↑ Ошибка цитирования Неверный тег <ref>; для сносок Auto7P-1 не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок Borucki1 не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок Schroeder1 не указан текст
↑ Ошибка цитирования Неверный тег <ref>; для сносок apmcsta1 не указан текст
↑ Doug Thompson, Mauro Carvalho Chehab. «EDAC — Error Detection And Correction» Шаблон:Webarchive. 2005—2009. «The 'edac' kernel module goal is to detect and report errors that occur within the computer system running under linux.»
↑ Шаблон:Cite web «The additional logic to support the ECC function is costly in both silicon real estate and system timing. In the ECC modes that support data correction, one additional system clock must be used to generate the corrected data … AMD Athlon processor checks for its own errors»
↑ Ошибка цитирования Неверный тег <ref>; для сносок Auto7P-9 не указан текст

[1] Шаблон:Cite web

[2] Шаблон:Cite web

[Boeing1-3] Ошибка цитирования Неверный тег <ref>; для сносок Boeing1 не указан текст

[ieee-tpds-4] 4,0 ^4,1 «A Survey of Techniques for Modeling and Improving Reliability of Computing Systems», IEEE TPDS, 2015

[5] Шаблон:Cite web

[Auto7P-1-6] Ошибка цитирования Неверный тег <ref>; для сносок Auto7P-1 не указан текст

[Borucki1-7] Ошибка цитирования Неверный тег <ref>; для сносок Borucki1 не указан текст

[Schroeder1-8] Ошибка цитирования Неверный тег <ref>; для сносок Schroeder1 не указан текст

[apmcsta1-9] Ошибка цитирования Неверный тег <ref>; для сносок apmcsta1 не указан текст

[10] Doug Thompson, Mauro Carvalho Chehab. «EDAC — Error Detection And Correction» Шаблон:Webarchive. 2005—2009. «The 'edac' kernel module goal is to detect and report errors that occur within the computer system running under linux.»

[AMD-762-11] Шаблон:Cite web «The additional logic to support the ECC function is costly in both silicon real estate and system timing. In the ECC modes that support data correction, one additional system clock must be used to generate the corrected data … AMD Athlon processor checks for its own errors»

[Auto7P-9-12] Ошибка цитирования Неверный тег <ref>; для сносок Auto7P-9 не указан текст

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

Партнерские ресурсы
Криптовалюты	Обмен криптовалют - www.bestchange.ru Криптовалютная биржа CoinEx Криптовалютная биржа Binance HIVE OS - операционная система для майнинга e4pool - Мультивалютный пул для майнинга.
Магазины	AliExpress — глобальная виртуальная (в Интернете) торговая площадка, предоставляющая возможность покупать товары производителей из КНР; computeruniverse.net - Интернет-магазин компьютеров(Промо код 5 Евро на первую покупку:FWWC3ZKQ);
Хостинг	DigitalOcean - американский провайдер облачных инфраструктур, с главным офисом в Нью-Йорке и с центрами обработки данных по всему миру;
Разное	Викиум - Онлайн-тренажер для мозга Like Центр - Центр поддержки и развития предпринимательства. Gamersbay - лучший магазин по бустингу для World of Warcraft. Ноотропы OmniMind N°1 - Усиливает мозговую активность. Повышает мотивацию. Улучшает память. Санкт-Петербургская школа телевидения - это федеральная сеть образовательных центров, которая имеет филиалы в 37 городах России. Lingualeo.com — интерактивный онлайн-сервис для изучения и практики английского языка в увлекательной игровой форме. Junyschool (Джунискул) – международная школа программирования и дизайна для детей и подростков от 5 до 17 лет, где ученики осваивают компьютерную грамотность, развивают алгоритмическое и креативное мышление, изучают основы программирования и компьютерной графики, создают собственные проекты: игры, сайты, программы, приложения, анимации, 3D-модели, монтируют видео. Умназия - Интерактивные онлайн-курсы и тренажеры для развития мышления детей 6-13 лет SkillBox - это один из лидеров российского рынка онлайн-образования. Среди партнеров Skillbox ведущий разработчик сервисного дизайна AIC, медиа-компания Yoola, первое и самое крупное русскоязычное аналитическое агентство Tagline, онлайн-школа дизайна и иллюстрации Bang! Bang! Education, оператор PR-рынка PACO, студия рисования Draw&Go, агентство performance-маркетинга Ingate, scrum-студия Sibirix, имидж-лаборатория Персона. «Нетология» — это университет по подготовке и дополнительному обучению специалистов в области интернет-маркетинга, управления проектами и продуктами, дизайна, Data Science и разработки. В рамках Нетологии студенты получают ценные теоретические знания от лучших экспертов Рунета, выполняют практические задания на отработку полученных навыков, общаются с экспертами и единомышленниками. Познакомиться со всеми продуктами подробнее можно на сайте https://netology.ru, линейка курсов и профессий постоянно обновляется. StudyBay Brazil – это онлайн биржа для португалоговорящих студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт. Автор24 — самая большая в России площадка по написанию учебных работ: контрольные и курсовые работы, дипломы, рефераты, решение задач, отчеты по практике, а так же любой другой вид работы. Сервис сотрудничает с более 70 000 авторов. Более 1 000 000 работ уже выполнено. StudyBay – это онлайн биржа для англоязычных студентов и авторов! Студент получает уникальную работу любого уровня сложности и больше свободного времени, в то время как у автора появляется дополнительный заработок и бесценный опыт.

Русская Википедия:ECC-память

Содержание

Описание проблемы

Технология

Преимущество и недостатки

См. также

Примечания

Ссылки

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Навигация

Поиск

Инструменты