Хвостовая задержка (tail latency)
Уровень: Senior
Ответ
Метрика производительности — задержка самых медленных запросов (например, 99-й перцентиль); в распределенной системе суммарный отклик зависит от самого медленного звена (fan-out запросы могут ждать самый медленный сервис); оптимизация: репликация критичных запросов на несколько узлов (берем самый быстрый ответ), ограничение времени ожидания подзапросов (timeouts), устранение узких мест на критичном пути; анализ хвостовых задержек так же важен, как и средней, для хорошего UX.