[SQL, Apache, DevOps, Data Engineering] Наши грабли — залог вашего успеха. Кейсы DevOps и SQL-команд
Автор
Сообщение
news_bot ®
Стаж: 6 лет 9 месяцев
Сообщений: 27286
Пятница — самое время занимательных историй. Сегодня предлагаем вам послушать доклады DevOps и SQL-направления с конференции ЮMoneyDay. Специалисты расскажут про:
- устройство кластера логов, который позволяет нам понимать, что происходит с платежами и транзакциями (а также в целом с компонентами и сервисами);
- работу дата-инженеров в машинном обучении;
- внедрение и трансформацию CI/CD.
Делимся ценным опытом, чтобы вы не совершали наших ошибок. Надеемся, будет полезно!
Наши грабли — залог вашего успеха
Максим Огрызков, старший системный администратор
В докладе пойдет речь об обработке логов нескольких дата-центров с доступом через единый интерфейс. Обсудим причины и последствия обновления кластера. Расскажу о транспорте доставки логов из разных систем и окружений, и причем тут Apache Kafka. А также почему мы не используем logstash и как одним запросом в Kibana «приложить» кластер.
1:17 О чем будет доклад: кластер логов
1:43 Как логи попадают в кластер?
3:50 Почему мы выбрали Apache Kafka
5:02 Rsyslog: преимущества использования
9:00 Где хранить логи из разных ДЦ?
12:08 Что делать, если объем данных слишком большой?
14:00 Обновление кластера.
20:30 Наши грабли и пути решения
22:35 Translog
24:25Bulk request
26:28 Opendistro-perfomance-analyzer
28:28 Index Shrink
29:49Librdkafka
31:37 Итоги: как выглядит наш кластер сейчас
Извините, данный ресурс не поддреживается. :(
Дата-инженеры в машинном обучении
Евгений Виноградов, руководитель отдела разработки хранилищ данных
Рассказ о том, как выглядит промышленная работа над экспериментами в ML — какие проблемы решаются на уровне модели, а какие-только на уровне данных, и как обеспечить контролируемый процесс обучения.
1:40 Справка о спикере
2:41 Кто занимается DS-проектами?
8:30 Что такое Data Science проект?
14:15 Порядок действий в DS-проекте
15:42 Процесс сбора датасета
20:26 Как все устроено в Apache Kafka
29:10 Что происходит после сбора датасета
29:21 Как выбрать модель?
30:40 Примеры проблем, которые может решить дата-инженер
34:38 На каких технологиях все это работает?
35:03 Выводы доклада
Извините, данный ресурс не поддреживается. :(
CI/CD для дата-инженера: туда и обратно
Антон Спирин, старший разработчик BI
Доклад о внедрении принципов CI/CD в BI-разработке, целях, их трансформации и преодолении трудностей.
2:00 Справка о спикере
2:44 Описание проблемы
4:28 Кто такой дата-инженер?
5:43 CI/CD – в чем состоит работа инженера?
6:55 Подробнее о стеке и информационных системах
8:00 Точка отсчета: с чего мы начинала
10:34 Первый этап изменений
15:50 Кажется, все хорошо, но… второй этап улучшений
19:01 Почти демо: JenkinsFile, Pipelines
20:44 Что мы получили на выходе?
22:43 Сколько ушло времени? Статистика по релизам
23:37 Наши челленджи и что можно было бы сделать иначе. Планы на будущее
Извините, данный ресурс не поддреживается. :(
Все доклады с большой ИТ-конференции ЮMoneyDay. На подходе материалы про PM, тестирование и мобильную разработку.
Ещё доклады
SPL
===========
Источник:
habr.com
===========
Похожие новости:
- [PostgreSQL] «Ростелеком» покупает отечественную СУБД Postgres Pro на 257 миллионов
- [Python, Визуализация данных, Машинное обучение] Мы скачали 10 миллионов Jupyter-ноутбуков с Github — и вот что мы выяснили
- [IT-инфраструктура, Хранение данных, Хранилища данных, Data Engineering] Мультиоблачная стратегия: управление сложной структурой в большом масштабе
- [SQL, Apache, Big Data] Управление кодом Spark-приложений
- [Платежные системы, Управление e-commerce, Бизнес-модели, Финансы в IT] Подключение к платежному сервису — быстро и удобно. Миф или реальность?
- [Программирование, R, Data Engineering] Логирование выполнения скриптов на языке R, пакет lgr
- [IT-инфраструктура, Машинное обучение, DevOps] Приглашаем на митап «Машинное обучение и инфраструктура вокруг него» 18 декабря в 14:00
- [Python, IT-инфраструктура, Администрирование баз данных, DevOps, Микросервисы] Vault+Pydantic: продолжение саги, локальная разработка
- [IT-инфраструктура, Amazon Web Services, DevOps, Облачные сервисы] Анонс видеокурса «Администрирование и разработка в облачных системах на примере AWS»
- [Информационная безопасность, DevOps] Вебинар «Опыт участия в кибербитве The Standoff: анализ атак и обзор инструментов»
Теги для поиска: #_sql, #_apache, #_devops, #_data_engineering, #_apache_kafka, #_datainzhener (дата-инженер), #_mashinnoe_obuchenie (машинное обучение), #_ci/cd, #_data_science, #_devops, #_sql, #_blog_kompanii_jumoney (
Блог компании ЮMoney
), #_sql, #_apache, #_devops, #_data_engineering
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 20:08
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 6 лет 9 месяцев |
|
Пятница — самое время занимательных историй. Сегодня предлагаем вам послушать доклады DevOps и SQL-направления с конференции ЮMoneyDay. Специалисты расскажут про:
Делимся ценным опытом, чтобы вы не совершали наших ошибок. Надеемся, будет полезно! Наши грабли — залог вашего успеха Максим Огрызков, старший системный администратор В докладе пойдет речь об обработке логов нескольких дата-центров с доступом через единый интерфейс. Обсудим причины и последствия обновления кластера. Расскажу о транспорте доставки логов из разных систем и окружений, и причем тут Apache Kafka. А также почему мы не используем logstash и как одним запросом в Kibana «приложить» кластер. 1:17 О чем будет доклад: кластер логов 1:43 Как логи попадают в кластер? 3:50 Почему мы выбрали Apache Kafka 5:02 Rsyslog: преимущества использования 9:00 Где хранить логи из разных ДЦ? 12:08 Что делать, если объем данных слишком большой? 14:00 Обновление кластера. 20:30 Наши грабли и пути решения 22:35 Translog 24:25Bulk request 26:28 Opendistro-perfomance-analyzer 28:28 Index Shrink 29:49Librdkafka 31:37 Итоги: как выглядит наш кластер сейчас Извините, данный ресурс не поддреживается. :( Дата-инженеры в машинном обучении Евгений Виноградов, руководитель отдела разработки хранилищ данных Рассказ о том, как выглядит промышленная работа над экспериментами в ML — какие проблемы решаются на уровне модели, а какие-только на уровне данных, и как обеспечить контролируемый процесс обучения. 1:40 Справка о спикере 2:41 Кто занимается DS-проектами? 8:30 Что такое Data Science проект? 14:15 Порядок действий в DS-проекте 15:42 Процесс сбора датасета 20:26 Как все устроено в Apache Kafka 29:10 Что происходит после сбора датасета 29:21 Как выбрать модель? 30:40 Примеры проблем, которые может решить дата-инженер 34:38 На каких технологиях все это работает? 35:03 Выводы доклада Извините, данный ресурс не поддреживается. :( CI/CD для дата-инженера: туда и обратно Антон Спирин, старший разработчик BI Доклад о внедрении принципов CI/CD в BI-разработке, целях, их трансформации и преодолении трудностей. 2:00 Справка о спикере 2:44 Описание проблемы 4:28 Кто такой дата-инженер? 5:43 CI/CD – в чем состоит работа инженера? 6:55 Подробнее о стеке и информационных системах 8:00 Точка отсчета: с чего мы начинала 10:34 Первый этап изменений 15:50 Кажется, все хорошо, но… второй этап улучшений 19:01 Почти демо: JenkinsFile, Pipelines 20:44 Что мы получили на выходе? 22:43 Сколько ушло времени? Статистика по релизам 23:37 Наши челленджи и что можно было бы сделать иначе. Планы на будущее Извините, данный ресурс не поддреживается. :( Все доклады с большой ИТ-конференции ЮMoneyDay. На подходе материалы про PM, тестирование и мобильную разработку. Ещё докладыSPL=========== Источник: habr.com =========== Похожие новости:
Блог компании ЮMoney ), #_sql, #_apache, #_devops, #_data_engineering |
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 20:08
Часовой пояс: UTC + 5