Хотите стать data–инженером в Сбербанке? Тогда эта вакансия для Вас, а мы обеспечим Вас интересными задачами!
Департамент информационных технологий блоков «Риски» и работы с ПА находится в поисках кандидатов на вакансии data-инженеров. Совместно со специалистами блока Риски, которые разрабатывают инновационные модели для бизнес-процессов банка в роли data–инженера Вы будете:
• разрабатывать витрины данных для задач моделирования, создавать выборки для обучения и тестирования моделей
• разрабатывать алгоритмы трансформации и очистки данных
• организовывать процессы сбора данных из систем-источников (анализ атрибутного состава, качества данных, выбор систем-источников, выбор методов загрузки, реализация механизмов загрузки)
Мы заинтересованы в привлечении как опытных, так и начинающих специалистов!
Мы используем:
• СУБД: Oracle, Teradata, Hadoop
• Языки: Python, Scala, R
• Управление требованиями: Jira, Confluenсe
• DevOps: Jenkins, Nexus
Ключевые требования, которым вам необходимо соответствовать:
• Высшее техническое или физико-математическое образование
• Знание алгоритмов и структур данных*
• Знание SQL, Python
• Опыт работы с Hadoop + Spark
• Навыки работы с Bash, Git
• Управление требованиями: Jira, Confluenсe, DevOps: Jenkins, Nexus
• Владение навыками коммуникации
• Готовность работать в команде на общий результат, адекватные коммуникационные навыки
• Опыт работы с Hadoop, навыки применения Spark, Impala
• Базовое понимание кредитного процесса в банке
• Базовое понимание жизненного цикла разработки моделей
• Базовые знания математической статистики, теории вероятностей
В зависимости от позиции, на которую Вы претендуете, Вам потребуется:
• Опыт работы от 2х лет
• Опыт работы с СУБД Oracle|Teradata|Hadoop
• Умение подготовить требования на основе постановки бизнес-задачи
Перечень решаемых задач может варьироваться в зависимости от специализации:
Data-инженер по разработке моделей
Работа в тесной связке с Data-scientists – разработчиками статистических моделей для автоматизации и повышения эффективности процессов принятия решений в Банке, а также с бизнес-заказчиками моделей
Ожидаемые задачи:
1. Подготовка данных для разработки конкретных моделей – анализ данных в системах Банка и/или внешних источниках (технический и смысловой), склейка данных из разных источников, очистка данных, выделение выборок, создание витрин данных для разработки
2. Разработка и поддержка промышленных витрин для разработки моделей – для постоянно используемых в моделях источников данных
3. Поддержка Data-инженеров по внедрению разработанных моделей с точки зрения используемых данных (модель должна работать на тех же данных, на каких она разрабатывалась)
Data-инженер по работе с моделями графовой аналитики.
Для работы по этому направлению Вам дополнительно потребуется:
• Опыт разработки на Java/Scala/C++
• Опыт подготовки данных для DL моделей (Python, Numpy, Numba, Pyarrow) и понимание их дальнейшего пути (Dataset/Dataloader)
• Навыки работы с Docker, Kubernetes
Data-инженер по разработке моделей для автоматического сканирования новостного потока с помощью инструментов семантического анализа.
Основная задача – отслеживание негативных тенденций в финансовом состоянии контрагентов в режиме реального времени. Каждый день только в Рунете появляется 35 000 новостей, среди которых есть как реальные сигналы, так и откровенный мусор. Из них релевантными окажутся 10, но каждая из них может предотвратить потери банка.
Дополнительным плюсом будет:
• Опыт работы (от 1 года) разработчиком на любом языке
• Опыт работы (от 1 года) бизнес-аналитиком с функцией выборки и подготовки данных
• Опыт построения витрин БД (Oracle, Teradata, Hadoop)
Почта для резюме: Eliseev.E.A@sberbank.ru
28 апреля 2021