Все вакансии / DevOps-инженер /Инженер доступности сервисов (SRE) / Москва

Наш заказчик, IT-компания, разрабатывающая тысячи внешних и внутренних сервисов, большинство из которых работает в кластерах инфраструктурного облака, насчитывающего десятки тысяч серверов, на которых работают сотни тысяч экземпляров приложений.

Основные задачи:

  • Участие в проектах по обеспечению надежности, доступности, масштабируемости и производительности сервисов.
  • Разработка систем автоматизации управления кластерами, систем мониторинга и аналитики состояния серверов.
  • Мониторинг и автоматизация каждой детали большой системы.

Стек:

Linux, Python, MySQL, MongoDB, Cassandra, Elliptics, Nginx, ZooKeeper, SaltStack, Porto, QEMU-KVM и множество собственных технологий.

Требования:

  • Опыт работы с Unix-системами (Linux или FreeBSD) более 3х лет.
  • Понимание принципов взаимодействия пользовательских приложений с ОС.
  • Опыт построения или администрирования отказоустойчивых систем, работающих в режиме 24x7x365 и требующих минимального участия человека.
  • Понимание, как устроены сетевые протоколы и зачем нужна маршрутизация.
  • Обязательный опыт программирования на Python (или C, или C++) от 3х лет.
  • Опыт локализации проблем в больших и сложных системах.
Подраздел:

Python