среда, 11 сентября 2019 г.

Детекторы отказов в распределенных системах

Согласно теорем FLP консенсус невозможен в системах с асинхронными коммуникацией. Чандра и Туэг в статье  Unreliable failure detectors for reliable distributed systems показали, что ситуацию можно исправить за счёт добавления в распределённую систему специального сервиса - детектора отказов. 

С чего начать знакомство с этой темой? Книги по распределённым алгоритмам могут отпугнуть своими формулами и теоремами. Хочется чего-нибудь попроще.

Могу порекомендовать пост Failure Detection in Distributed Systems [ссылка] - довольно приятно и легко написано.

Комментариев нет: