Data engineer


Data engineer







Описание

Обязанности:

  • Подготовка данных и разработка агрегатов, необходимых для проектов;

  • Создание прототипов объектов (структур, витрин);

  • Подключение новых источников данных из внешних и внутренних систем с целью быстрого прототипирования и оценки полезности данных;

  • Разработка и поддержка ETL потоков данных: как batch (Sqoop, Spark, BQ), так и потоковых (Kafka, Spark);

  • Внедрение и обучение математических моделей, контроль качества моделей.

 

Требования:

  • Знания Java/Scala, Python;

  • Знание SQL, Git;

  • Знания принципов построения БД и хранилищ данных;

  • Уверенное знание экосистемы Apache Hadoop и Spark;

  • Опыт на подобной позиции от года.

  • Будет плюсом:

  • Знание систем контейнеризации (Docker и др.);

  • Знание Python;

  • Знание основ машинного обучения (базовые принципы – обучение, кросс-валидация, оценка качества моделей);

  • Опыт работы с NoSQL базами данных.

 

Условия:

  • Интересная работа в быстроразвивающейся компании;

  • Уникальная возможность работы с большим разнообразием аналитических задач;

  • Возможность один день в неделю работать из дома;

  • Зеленый свет для новых идей и предложений: мы часто делаем то, на что другие не отваживаются;

  • Возможности профессионального и карьерного роста;

  • Современный офис класса "А" в 5-ти минутах пешком от метро Новокузнецкая.