Сетевые partition-ы
Уровень: Senior
Ответ
Сбой сети, разделяющий кластер на изолированные части (partition) – большой вызов для распределенной системы (CAP: либо остановить операции, либо риск неконсистентности); стратегии: либо одна из частей берется как основная, а другие ограничиваются на запись (avoid split-brain, пожертвовать доступностью), либо позволить каждой продолжать работать (повышая доступность ценой конфликтов, которые придется разрешать при восстановлении связи); системы консенсуса стремятся обнаружить partition (timeouts) и сохранить один кластер активным; после восстановления связи – слияние данных (конфликт-резолв, синхронизация журналов).