Senior Data Scientist at Jar Soft

О проекте:
Около двух лет мы работаем над системой показа рекламы (DSP) для крупного иностранного заказчика. Система получает траффик от других систем SSP (агрегаторы траффика с рекламных площадок) по OpenRTB протоколу. Система позволяет обрабатывать до 500 тысяч запросов в секунду.
SSP системы проводят аукцион каждого запроса на рекламный баннер в реальном времени среди всех подписанных агрегаторов рекламных компаний (DSP). В аукционе побеждает DSP, предложившая лучшую цену. Наша система работает с мобильным траффиком и получает вознаграждение от рекламодателей за установку приложений, а платит SSP за показ рекламных баннеров, отсюда и вытекает бизнес задача оптимизации расходов.
Задачи:
В настоящий момент перед нами две актуальные задачи по Data Science:
1. Определение фейкового траффика (его доля оценивается в 50% от всех запросов).
2. Разработка и внедрение алгоритмов определения цены конкретного показа конкретному пользователю. Необходимо вычислять вероятность установки данным пользователем рекламируемого приложения, основываясь на истории запросов и поведения, а также учитывать проведение аукционов и необходимость предложения лучшей цены среди участвующих DSP.
Для каждой рекламной компании предполагается разработка собственных алгоритмов расчета цены и определения фейкового траффика, т.к. их эффективность зависит от контента. Следовательно, подразумевается создание и постоянное совершенствование Data Science алгоритмов.
Что есть для решения задач:
- логи запросов на показ баннера (миллиарды событий в месяц);
- результаты наших ставок на показ баннера;
- есть вся информация, доступная по OpenRTB протоколу;
- инструментарий для анализа логов;
- инструментарий для внедрения алгоритмов в систему;
Кто нам нужен:
Для решения этих задач, а также формирования, обучения и управления командой, мы рады обсудить возможность работы со специалистами, имеющими:
- Успешный опыт работы в крупных проектах по анализу данных / машинному обучению;
- Академическое/техническое образование, дающее отличное знание дисциплин математической логики, теории вероятностей, математической статистики;
- Python
- Hadoop / Hive /Pig / Spark
- Знание английского языка, достаточное для коммуникаций с англоговорящими коллегами.
Мы предлагаем:
- Мы готовы обсудить любые финансовые ожидания;
- Работа в комфортном и современном офисе в технопарке Академгородка;
- Возможен частичный Home Office. Критерий качества работы – выполнение задач;
- Свобода выбора инструментария и формирования команды;
- Помощь иногородним при переезде.
Контактная информация
Анойкин Денис
+7 (913) 9122448