Назад

Senior Data Scientist

Заработная плата: не указана
Опыт работы: от 3 до 5 лет
Занятость: полная занятость
Откликнуться

Описание вакансии

Циан - крупнейший в России сервис для поиска недвижимости. В конце 2020 года к нам присоединилась компания N1 — самый популярный сервис для поиска недвижимости в Сибири и на Урале. N1 объединил такие проекты, как «НГС.Недвижимость» (Новосибирск), «Е1.Недвижимость» (Екатеринбург), МЛСН (Омск), DomChel (Челябинск), «Жилком» (Красноярск), а также разделы объявлений по продаже и аренде недвижимости на 20 региональных порталах.

19 лет мы помогаем людям найти, сдать, продать жилье по всей России. Циан не просто сайт, это высокотехнологичная компания, которая входит в топ-10 лучших сайтов по недвижимости в мире. Сейчас в компании работает 900+ сотрудников в трех офисах России - Москве, Санкт-Петербурге и Новосибирске. А ежемесячная аудитория сервисов - свыше 21 миллионов человек.

Наши текущие процессы позволят новому сотруднику работать в офисе (Москва/Питер) или же полностью удалённо.

О команде

Основные задачи которые решаем: персональные рекомендации; ранжирование поисковой выдачи; антифрод (модерация); поиск дубликатов объявлений, антибот, оптимизация ценообразования и многие другие. Так же есть CV, (например, нахождение одинаковых фоток, классификация), NLP и аудио (коллтрекинг).
Отлично подойдет тем кто любит mixed-data, ибо почти в каждой задаче можно прикрутить и тексты и фоточки и классический ML.

Наш стек:

  • Big Data: Hadoop, Hive, Spark, Kafka;
  • Deep Learning: PyTorch
  • Classic ML: numpy, pandas, sklearn, XGBoost, LightGBM, CatBoost;

Так же в зависимости от задач есть:

  • PostgreSQL, Phoenix, ElasticSearch, RabbitMQ

Людям Циан важно

  • Делать не просто продукт, а лучший продукт, который меняет клиентский опыт. Мы гордимся тем, что трансформируем рынок недвижимости, закрывая боли людей с поиском, продажей, ипотекой и арендой жилья;

  • Решать сложные задачи и искать новые решения. Поэтому наш рабочий день иногда похож на квест, благодаря которому каждый из нас может расти намного быстрее;

  • Влиять на продукт. Мы слушаем коллег и используем их экспертизу, идеи для выбора наилучшего решения в развитии продукта;

  • Чувствовать себя комфортно в команде, говоря то, что думаем. Для этого мы развиваем культуру обратной связи и взаимного уважения.

Задачи, которые могут стать твоими

  • Создание NLP моделей для анализа расшифрованных записей колл-трекинга
  • Разработка моделей классического ML для оценки готовности пользователя совершить целевое действие и для оценки “привлекательности” объявлений на сайте.
  • Построение оптимальной модели ценообразования в зависимости от сложности поиска покупателя для объекта жилья и внешних факторов рынка.

Мы видим на этой позиции человека, который:

  • Имеет прикладной опыт применения МЛ в продакшн. Быстро понимает, какой результат “может быть“, а кого “не может быть”
  • Имеет представление о дизайне архитектуры ML решения: как разбить пайплайн на компоненты (бэкенд, квери-серч, инференс модели и тд)
  • Способен построить процесс разметки данных (Толока, свое АПИ для ручной разметки)
  • Способен разобраться почему метрики на проде отличаются от метрик на этапе валидации модели. Понимает где разница существенная, а где нет. Способен устранить проблему (например, определить какие фичи были с ликом и как его устранить)
  • Умеет реализовать качественную кросс-валидацию и подобрать гиперпараметры с которыми модель не переобучена и не недообучена
  • Имеет опыт в классическом ML (различные имплементации бустинга, чем отличаются)
  • Знаком с популярными архитектурами сеток, может на PyTorch (или на Keras) реализовать train loop
  • Знаком с методами понижения размерности: понимает суть PCA, знаком с автоэнкодерами, t-sne, svd
  • Знает и применяет алгоритмы отбора фичей (boruta, генетические алгоритмы, etc)
  • Знаком с основами NLP: (как минимум, fit-predict последних слоев условного bert-а, суть LSTM, проблемы с градиентом: затухание, взрыв)
  • Имеет опыт работы с GPU (CUDA, nvidia-drivers; утилиты для мониторинга nvidia-smi / nvtop)
  • Уверенно кодит на Python (декораторы, пакетные менеджеры, генераторы, итераторы, контекстные менеджеры)

Плюсом будет

  • Стат. тесты. Умение объяснить что такое p-value и умение этими инструментами пользоваться. Может посчитать, что одна модель стат. значимо отличается от другой. (t-test, хи кварат)
  • Знакомство с основами CV: OpenCV (SIFT/SURF фичи, свертки, преобразование Фурье). Может реализовать edge detection, Hough transform

Мы готовы предложить

  • Оформление по ТК, белую зарплату;

  • Современный БЦ с фитнес-центром;

  • Две кухни оборудованными всем необходимым: микроволновые печи, кофемашины, чайники и т.д. Также на кухне всегда доступны снеки, фрукты, кофе и чай;

  • 5 day off в год, помимо основного отпуска;

  • Компенсацию спорта;

  • Профессиональный рост (ЛПР, корпоративная библиотека);

  • ДМС с первого рабочего дня (со стоматологией, госпитализацией, страховкой выезжающего за пределы нашей страны);

  • Корпоративного врача в офисе;

  • Бесплатную авто и вело парковку;

  • Офисный транспорт (самокаты);

  • Комнаты, где можно поработать в полной тишине.

Откликнуться

Время карьеры

Найти работу мечты
Время карьеры