Помехоустойчивое кодирование для субмикронных динамических ОЗУ
К.А. Петров
НИИ системных исследований РАН, Москва
2
Содержание
• Цели
• Динамическая память
• Помехоустойчивое кодирование
• Технология CHIPKILL
• Кодирование с исправлением смежных ошибок
• Кодирование с восстановлением байта
• Заключение
3
Цели
• Обзор существующих методов защиты подсистемы динамической памяти от сбоев и функциональных отказов
• Совершенствование этих методов средствами помехоустойчивого кодирования
• Сравнительный анализ полученных решений и представление набора рекомендаций по их применению в современных подсистемах динамической памяти микропроцессорных систем
4
Многократные сбоив динамической памяти
Количество сбоев от одного события
Сб
оев
/Гб
□ 170/180 нм + 110нм Δ 90 нм
5
Динамическая память
• Наибольший объем в микропроцессорной системе
• Относительно небольшая скорость обмена
• Множество кристаллов
Как
6
Помехоустойчивое кодирование
7
Помехоустойчивое кодирование
• Хэмминг SEC – single-error-correction
• Хсяо SEC-DED – single-error-detection,
double-error-correction
• S4EC-DED single-4-error-correction,
double-error-correction
• SEC-DAEC single-error-correction,
double-adjacent-error-correction
• Scrubbing - самовосстановление информации
8
Технология CHIPKILL
• Количество кристаллов равно количеству кодовых битов
• Только пакетные обращения
9
ТехнологияCHIPKILL+DAEC/SbEC
• Количество кристаллов в два раза меньше количества кодовых битов
• Только пакетные обращения
10
SbER-кодирование
Single-byte-error-repairКодирование с восстановлением байта
11
Сравнительный анализ
№1 – Chipkill№2 – Chipkill+SEC-DAEC№3 – Chipkill+SEC-DED-DAEC№4 – Chipkill+S4EC-DED№5 – SbER
Вид кодирования №1 №2 №3 №4 №5
Количество СБИС 72 36 38 19 9Пакетное чтение изапись
Да Да Да Да Нет
Обнаружение всехдвукратных ошибок
Да Нет Да Да Да
Стойкость к многократным сбоям
Да Да Да Да Нет
12
Сравнительный анализ
13
Заключение (1/2)• Для защиты субмикронных ДОЗУ от сбоев
наилучшим по критериям аппаратурной избыточности, количества СБИС ДОЗУ и быстродействия методом при отсутствии многократных сбоев является метод, использующий коды с восстановлением байта
• При наличии многократных сбоев наилучшим по критерию количества СБИС ДОЗУ является метод, использующий технологию Chipkill с кодом, исправляющим пакетные ошибки кратности четыре (Chipkill+S4EC-DED). Он также является наилучшим по критерию сбоеустойчивости без учета размера и быстродействия кодер-декодера
14
Заключение (2/2)• При разработке устойчивой к SEFI одного из
кристаллов ДОЗУ необходимо либо снижать стойкость к многократным сбоям, либо увеличивать количество кристаллов. Нахождение оптимума – отдельная задача
• Перспективным направлениями являются:
• каскадное кодирование для компенсации недостатков SbER-кодов
• помехоустойчивые коды для исправления пакетных ошибок
• И Chipkill, и SbER-коды можно использовать как в динамической, так и в статической памяти