SRE. Рецепты выживания в продакшене для инженера по надежности. Наталья Савенкова

Читать онлайн.
Название SRE. Рецепты выживания в продакшене для инженера по надежности
Автор произведения Наталья Савенкова
Жанр
Серия
Издательство
Год выпуска 2024
isbn



Скачать книгу

достаточно тяжело.

      Более благоприятная ситуация складывается тогда, когда количество пользователей естественным образом снижается и вы можете спокойно завершать свои затянувшиеся работы.

      В этом подходе есть риски – если работы проводят люди, которые уже отработали полный рабочий день, то к концу этого дня концентрация внимания снижена и вероятность ошибок выше.

      Оценивайте риски для вашей конкретной ситуации.

      Деньги: для компании почти всегда проще оплатить переработки группы сотрудников, чем нести потери от неработоспособности системы в дневное время.

      53. Календарь плановых запусков и работ

      О запусках и непредсказуемости.

      По мнению большинства инженеров продакт-менеджеры это очень непредсказуемые хаотичные ребята, которые всегда всё делают в последний момент. За это их, конечно, не любят. На самом деле, никаких непредсказуемых запусков у продактов нет – обычно о запуске известно за пару месяцев, потому что любой запуск требует достаточно большого объёма работы.

      Единственное, что нужно делать инженеру для уменьшения энтропии в этом мире продактов – иногда слезать с олимпа величия, ходить к продактам и задавать очень простой вопрос: “Коллеги, что вы планируете запустить в продукте в ближайшее время?”

      Продакты, они как дети, а ни один ребёнок не хочет быть плохим, поэтому с радостью расскажут вам о своих планах, если увидят в ваших искренних глазах готовность им помочь.

      Если у вас уже есть общий корпоративный календарь, то внесите туда планируемые запуски продактов, свой график регламентных работ и график “фризов” на изменения в системе. Если общего календаря нет – сделайте его. Не хотите электронный? Нарисуйте на стене табличку и приклейте в неё стикеры.

      Возьмите на себя задачу координации запусков и своих работ – вам все будут благодарны.

      54. Зафиксируйте термины

      Любая группа людей, занимающихся продолжительное время одним и тем же, неизбежно обрастает кучкой локальных терминов. Не каждому новичку сразу понятно, что именно значат местные названия. Я видела хорошую практику – завести глоссарий и описать в нём используемые названия и их значения.

      За историю работы мне встречались сервисы с запоминающимися названиями, например: “укроп”, “банана”, “L7”. И ещё вагончик терминов, типа: “ручка”, “дырка”, “бабуля”, “манка”… Список можно продолжать долго.

      Когда вы работаете в команде, с которой нужно быстро решать возникающие проблемы, вам необходимо говорить на одном языке и не допускать неверных трактовок. Нужно договориться, что именно и какими словами называть.

      Если мы говорим "снимаем трафик с Х", то все вокруг должны однозначно понимать, что это значит. Если мы говорим "катим Y в Z", все должны точно понимать, что такое Y, что такое Z и что значит "катим". Неточность в терминах приводит к плохим последствиям из-за нарушения координации и взаимопонимания.

      55. Групповая