Обязанности:
- Полный цикл разработки всех слоев хранилища данных и отображения отчетности
- Участие в составление плана проекта, оценка проектных сроков и рисков
- Участие в проектировании системы, решение сложных исследовательских задач по реализации никем ранее не реализованного функционала
- Развитие корпоративного хранилища и витрин данных (АС Облако данных) для развития международного бизнеса Сбербанка. Участие в сложных интеграционных проектах по развитию корпоративного DWH (преимущественно Hadoop, возможно, интеграции с БД Oracle и Teradata) в ролиразработчика.
- Разработка и проектирование потоков данных, алгоритмов загрузки и обработки данных вHadoopс использование Apache Spark;
- Разработка и оптимизация ETL, обеспечение производительности и стабильности, при необходимости участие в анализе инцидентов;
- Организация оптимального процесса разработки
- Участие в приемке системы
Требования:
- Фундаментальные знания принципов построения распределенных систем хранения и обработки данных;
- Наличие опыта работы с экосистемойHadoop(HDFS, Hive, Spark);
- Навыки работы в GNU/Linux, написание shell-скриптов;
- Опыт программирования на Scala, чтения и правок Java 8 кода;
- Опыт работы с системой контроля версий и DevOps инструментарием (Jenkins, Ansible)
- Опыт работы с аналитическими хранилищами, знание теории баз данных, знание SQL на уровне оконных функций. Опыт оптимизации запросов.
- Понимание методологии Agile
Условия:
- Место работы: м. Тульская (Даниловская мануфактура)
- График работы с 9:00 до 18:00, пятница - до 16:45
- Оформление согласно ТК РФ
- Социальный пакет: ДМС, спортзал (фитнес, йога), бассейн, возможность обучения за счет компании, льготные условия кредитования
- Премии по итогам года
Чтобы понять, подходим ли мы друг другу, ответь на небольшой тест.
Интерпретация ответов будет ниже*.
Ответь "да" или "нет" на вопросы:
- У меня минимум полгода опыта в разработке промышленных систем на базе Hadoop Spark в роли разработчика на протяжении всего жизненного цикла проекта;
- У меня есть опыт разработки на Java, Python или Scala
- Я умею программировать на Spark витрины данных (ETL-процессы, обвязки и т.п)
- Я понимаю основы работы СУБД, принципы построения хранилищ данных
- Я имею опыт программирования БД (любой SQL диалект), опыт написания сложных запросов и хранимых процедур;
- У меня есть опыт внедрения и приемки системы;
- У меня есть опыт разработки одного из видов документации: технический (функциональный) дизайн или техническое задание или техническая спецификация;
- Мне близка позиция С.Джобса "Работать надо не 12 часов, а головой".