Молдованова О.В.
ОРГАНИЗАЦИЯ ДЕЦЕНТРАЛИЗОВАННОЙ САМОДИАГНОСТИКИ РАСПРЕДЕЛЁННЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ[1]
ФГОБУ ВПО «Сибирский государственный университет
телекоммуникаций и информатики»
A distributed self-diagnosis algorithm for distributed computer systems (CS) is proposed in the work. This algorithm is characterized by a parallel execution of a testing phase and phase of diagnostic information dissemination. Results of the algorithm simulation are provided for commonly used topologies of distributed CS.
Keywords: distributed computer system; distributed self-diagnosis; diagnostic image of a system.
В работе предложен децентрализованный алгоритм самодиагностики распределённых вычислительных систем (ВС), характеризующийся параллельным выполнением фаз тестирования и распространения диагностической информации. Приведены результаты моделирования алгоритма для распространённых топологий распределённых ВС.
Ключевые слова: распределённая вычислительная система; децентрализованная самодиагностика; диагностический образ системы.
[1] Работа выполнена при поддержке Совета по грантам Президента РФ (ведущая научная школа НШ 5176.2010.9) и Российского фонда фундаментальных исследований (гранты 11-07-00109-а, 09-07-00095-а).
Распределённые вычислительные системы (ВС) являются важнейшим инструментом решения сложных научных, инженерных и экономических задач [1]. Основным функциональным элементом распределённой ВС является элементарная машина (ЭМ). Такие системы характеризуются большемасштабностью – количество ЭМ в их составе может достигать 105 –106. Несмотря на высокую надёжность микроэлектронной базы, вероятность возникновения отказов в распределённых ВС повышается с ростом количества элементарных машин. При этом в последнее время постоянно увеличивается число трудоёмких задач, решаемых на большемасштабных ВС. Следовательно, организация отказоустойчивого функционирования таких систем требует создания алгоритмических и программных средств самоконтроля и самодиагностики.