Наша команда Data – аналитиков и инженеров занимается проектированием, разработкой, тестированием и выводом в промышленную эксплуатацию целевых решений (витрин данных, данных и реализацию интеграционных процессов между аналитическими и продуктовыми системами Банка и партнеров). Наша цель собрать данные из более сотни Источников данных Банка, мы будем работать с данными как с актуальностью Т-1 так и Near Real Time репликами. Продукт нашей работы — экосистема для конкретного сегмента клиентов: продукты, сервисы, каналы обслуживания и коммуникаций.
Обязанности:
- Создание S2T для реализации бизнес-витрин
- Создание прототипа логики сборки витрины на SQL и Spark
- Подготовка документации: функциональных и бизнес требований, модели данных, сопроводительной документации при прохождении тестовых и приемо-сдаточных испытаний, спецификаций на загрузку данных, расчет сайзингов.
- Проверка соответствия бизнес-витрины сформированным требованиям
- Проверка качества данных в источниках и бизнес-витринах
- Формирование требований к процессу ежедневной проверки качества данных
- Разработка и поддержка сопроводительной документации и спецификаций данных, развитие и поддержка базы знаний по вопросам работы с данными
- Предоставление экспертной поддержки внутренним потребителям (data analysts, data scientists) по вопросам, связанным с использованием данных
Требования:
- Не менее 1 года работы в качестве Data Engineer / Data Analyst / ETL Developer
- Знание SQL на продвинутом уровне (аналитические функции, подзапросы, хранимые процедуры, оптимизация производительности),
- Уверенные знания и опыт применения HiveQL/Spark
- Навыки работы с инструментами экосистемы Hadoop.
- Опыт проектирования архитектуры потоков данных для построения витрин и приложений к хранилищам данных, тестирования и вывода решений в промышленную эксплуатацию
- Опыт подготовки документации: функциональных и бизнес требований, модели данных, сопроводительной документации при прохождении тестовых и приемо-сдаточных испытаний, спецификаций на загрузку данных, расчет сайзингов
- Навыки декомпозиции бизнес-требований, формирования ТЗ для разработчиков
- Опыт работы с инструментами Atlassian Confluence, Jira, Nexus
- Знание розничного банковского бизнеса является преимуществом
- Опыт работы по Agile (SCRUM, Kanban, и т.д.) приветствуется
Приветствуем, но не ожидаем от кандидата:
- Apache Flink, HBase, Scala, Python, Apache Airflow
- Навыки работы с одной из СУБД (Oracle, Teradata, GreenPlum, Vertica)
Основной тех. стек:
- Hadoop(Hive/Impala/Oozie)
- Apache Spark
- Apache Flink
- HBase
- Scala
Условия:
- Профессиональное обучение, семинары, тренинги, конференции;
- Годовые премии;
- ДМС, сниженные ставки по кредитованию, программы лояльности для сотрудников;
- Самые инновационные, амбициозные проекты и задачи;
- Дисконт-программа от множества компаний партнеров.