Методы и подходы к повышению надежности параллельной потоковой вычислительной системы |
|
|
|
|
Авторы |
| Змеев Д.Н. |
| Левченко Н.Н. |
| Окунев А.С. |
Год публикации |
| 2020 |
DOI |
| 10.31114/2078-7707-2020-2-87-94 |
УДК |
| 004.27 |
|
Аннотация |
| В статье описаны основные подходы к обеспечению надежности аппаратно-программных средств параллельной потоковой вычислительной системы. Подход, связанный с динамическим перераспределением вычислений между исполнительными устройствами, делает возможным организацию дополнительных каналов связи между исполнительными устройствами и коммутаторами вычислительного ядра. Описаны варианты предотвращения переполнения ассоциативной памяти ключей: откачка и подкачка токенов в динамическом режиме работы и разбиение задачи на этапы. Также представлен общий алгоритм работы системы при ее восстановлении после сбоя/отказа и предложены варианты алгоритмов работы создания локальных контрольных точек. Описаны преимущества глобальной распределенной ассоциативно-вычислительная среды с точки зрения повышения надежности системы. Приведены результаты экспериментов на программной блочно-регистровой модели связанных с оценкой средств восстановления и обеспечения надежности параллельной потоковой вычислительной системы. |
Ключевые слова |
| параллельная потоковая вычислительная система, надежность вычислений, потоковая модель вычислений, локальная контрольная точка. |
Ссылка на статью |
| Змеев Д.Н., Левченко Н.Н., Окунев А.С. Методы и подходы к повышению надежности параллельной потоковой вычислительной системы // Проблемы разработки перспективных микро- и наноэлектронных систем (МЭС). 2020. Выпуск 2. С. 87-94. doi:10.31114/2078-7707-2020-2-87-94 |
Адрес статьи |
| http://www.mes-conference.ru/data/year2020/pdf/D039.pdf |