[DevOps, Kubernetes, Серверное администрирование, Системное администрирование] Онлайн-интенсив SRE: всё сломаем до основания, потом починим, ещё пару раз сломаем, а затем выстроим заново

Ответить на тему

Автор

Сообщение

news_bot ^®

Стаж: 8 лет 4 месяца
Сообщений: 27286

news_bot ^® написал(а)
03-Сен-2020 22:33

Цитировать

А давайте-ка что-нибудь сломаем? А то всё строим и строим, чиним и чиним. Скука смертная.
Давайте сломаем так, чтобы нам за это ничего не было — мало того, чтобы нас за это безобразие ещё и похвалили. А потом заново всё построим — да так, что будет на порядок лучше, отказоустойчивей и быстрее.
И снова сломаем.
Думаете, это конкурс по применению самого секретного инструмента всей нашей космонавтики — Big Russian Space Hammer?
Нет, это онлайн-интенсив SRE. Так уж получилось, что каждый курс Слёрм SRE никогда и ни за что непохож на предыдущий. Просто потому что никогда не угадаешь, что в огромной сложной системе, к которой каждую секунду подключаются тысячи и тысячи пользователей, а сама аудитория составляет несколько миллионов, может отвалиться, сломаться, затупить, заглючить и ещё сотнями способов испортить настроение дежурной смене SRE-инженеров.
В декабре мы проведём очередной интенсив по SRE.

Устроим небольшую ретроспективу. Вспомните, как всего лишь несколько лет назад HR устраивали забеги наперегонки, кто ухватит в свою компанию побольше DevOps-инженеров. Приз поменялся. Теперь они, как следящая система «Панцирь-С1», осматривают окружающее пространство, выискивают SRE-инженеров. Я рассказывал в статье «Евгений Варавва, разработчик в Google. Как описать Google в 5 словах», как живётся SRE-инженеру в Google, и как даже такая корпорация испытывает дефицит в SRE-специалистах.
На онлайн интенсиве Слёрм SRE в декабре за три дня, с 10:00 и до 19:00, вы научитесь обеспечивать быстродействие, отказоустойчивость и доступность сайтов в условиях ограниченных ресурсов, ликвидировать IT-инциденты и проводить разбор полётов так, чтобы проблемы не повторялись.
Спикеры курса:
Иван Круглов. Staff Software Engineer в Databricks. Имеет опыт в enterprise компаниях по распределенной доставке и обработке сообщений, BigData и web-stack, поиску, построению внутреннего облака, service mesh.
Павел Селиванов. Senior DevOps Engineer в Mail.ru Cloud Solutions. На счету десятки выстроенных инфраструктур и сотни написанных пайплайнов CI/CD. Сертифицированный администратор Kubernetes. Автор нескольких курсов по Kubernetes и DevOps. Регулярный докладчик на Российских и международных IT конференциях.
Всё будет проходить жёстко, непредсказуемо и на практике. Вы будете строить, ломать и чинить — причём порой в самых разных последовательностях.
Строить: Вам предстоит сформулировать показатели SLO, SLI, SLA для сайта, состоящего из нескольких микросервисов; разработать архитектуру и инфраструктуру, которая их обеспечит; собрать, протестировать и задеплоить сайт; настроить мониторинг и алёртинг.
Ломать: Вы рассмотрите внутренние и внешние факторы ухудшения SLO: ошибки разработчиков, отказы инфраструктуры, наплыв посетителей, DoS-атаки. Научитесь разбираться в устойчивости, error budget, практике тестирования, управлении прерываниями и с операционной нагрузкой.
Чинить: Вас натренируют быстро и эффективно организовать работу группы по ликвидации аварии в минимальные сроки: подключить коллег, оповестить интересантов (stakeholders), выстроить приоритеты.
Изучать: Вы сможете разобрать подход к сайту с точки зрения SRE. Проанализировать инциденты. Определить, как избежать их в будущем: улучшить мониторинг, изменить архитектуру, подходы к разработке и эксплуатации, регламенты. Автоматизировать процессы.
Онлайн-интенсив SRE имитирует реальные условия — время на восстановление работоспособности сервиса будет предельно ограничено. Как в настоящей жизни, как в реальной рабочей ситуации.
Узнать условия курса SRE, а также изучить полную программу можно по ссылке.
Онлайн-интенсив запланирован на декабрь 2020 года. Для тех, кто оплатит участие заранее, мы подготовили скидку.
Готовы к напряжённому обучению, нестандартным задачам и внезапным авариям?
Просто — не будет. Будет профессиональный рост.
===========
Источник:
habr.com
===========
Похожие новости:

Теги для поиска: #_devops, #_kubernetes, #_servernoe_administrirovanie (Серверное администрирование), #_sistemnoe_administrirovanie (Системное администрирование), #_sre, #_devops, #_slo, #_sla, #_sle, #_lomatchinitstroit (ломать-чинить-строить), #_intensiv (интенсив), #_obuchenie (обучение), #_error_budget, #_postmortem, #_blamelesspraktiki (blameless-практики), #_itintsidenty (IT-инциденты), #_graceful_degradation, #_failureinjection, #_capacity_planning, #_cascading_failures, #_blog_kompanii_southbridge (
Блог компании Southbridge
), #_devops, #_kubernetes, #_servernoe_administrirovanie (
Серверное администрирование
), #_sistemnoe_administrirovanie (
Системное администрирование
)

Профиль ЛС

Ответить на тему

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы

Текущее время: 19-Июн 00:54
Часовой пояс: UTC + 5