Блеск и нищета Data Driven менеджмента

Системные Технологии

Расшифровка выступления Игоря Сергеева, эксперта по цифровизации RtM, на отраслевой встрече клуба Global CIO «IT в FMCG».

Запись выступления Игоря Сергеева

Мы занимаемся разработкой SFA-платформы «ST Чикаго». Это система, которая агрегирует данные из разных каналов дистрибуции и позволяет подключать сторонних провайдеров, вроде IR, 2GIS, DaData и т.д. Все данные собираются в один дата-хаб, который должен приносить пользу клиенту. Понятно, что все бенефиты от системы связаны либо с ростом продаж, либо с сокращением издержек, но есть конкретные инструменты.

Например, торговый представитель пошел в поле, взял заказ, этот заказ сразу полетел в центральную базу, из нее попал в базу дистра на обработку оператору. Сокращаются транзакционные издержки, сокращается потеря заказов, рост продаж заметный.

Или запустили OTIF, увидели, что дистр неправильно отрабатывает заказы, наказали дистра, дистр стал хорошо отрабатывать заказы, поднялись продажи, уменьшились OOS и т.д.

Расширение дата-сетов

Таких кейсов и инструментов много и конкретных профитов много. Но большинство крупных транснациональных и национальных компаний говорит, что они это уже прошли. И предлагают: давайте добавим еще источники данных. Например, подключим модерн-трейд и начнем грузить Х5, Магнит, ДубльГис и т.д. Или расширим дата-лейк по дистрибуции какими-то дополнительными дата-сетами. Мы говорим: ок, давайте загружать, посмотрим, покопаемся, инсайты поищем.

Загрузились и что? А давайте, говорят, пойдем еще дальше. Добавим данные Сбера и Тинькофф по продажам с касс. Возьмем от BestPlace данные по потокам трафика, попробуем подключить ОФД. Круто, давайте пробовать. Стартапы есть, давайте подключать, посмотрим.

Шеринг мастер-данных по торговым точкам

Это все развивается очень интересно. Некоторые производители решили пошерить мастер-данные между собой. Взяли базы по торговым точкам, слили в одно большое хранилище и смотрят продажи по категориям. Бенчмарк проводят. Это пилот, сейчас идет в Новосибирской обл. Крутая идея, она реализуется, ищутся инсайты.

Ну, и конечно же приходит такой клиент и говорит, ребят, у нас же куча дата-сетов и данных! Мы просто обязаны запустить machine learning и аналитику, которая будет говорить нам, что делать. Мы хотим, чтобы система строила динамический маршруты, чтобы максимизировать прибыль на каждом маршруте. Мы хотим, чтобы цена подсказывалась, чтобы промо формировалось.

Мы в Систехе очень любим такие задачи. Мечтаем создавать системы, которые позволят принимать правильные решения на чистых данных.

Но есть одно большое «но».

Блеск и нищета Data Driven менеджмента

Эти космические корабли и небоскребы, о которых говорят клиенты, базируются на фейковых и грязных данных. Мы через себя все это пропускаем и знаем, насколько они ужасны. Я занимался долгое время ERP. Когда ты внедряешь бекэнд в ERP-систему, ты более-менее контролируешь ситуацию, получая данные по накладным, из мест источников и т.д. Когда ты внедряешь систему, которая берет данные из гетерогенных источников (от дистров, ритейлеров, из офтейков), ты сталкиваешься с ужасным множеством. Давайте посмотрим, что это за множество, и что там происходит.

Транзакционные данные

В модерне: офтейки есть, они более-менее гранулярные и качественные. Остатки есть, их можно собрать либо через IR, либо через мерча. Полку может собрать IR. В этой части качество данных удовлетворительное.
В несетевой рознице: остатки в точке, полка в точке – данные более-менее качественные. Если DMS современная и качает данные с контролем стока, если автоинформаторы стоят, то дистр у вас под контролем и данные селлаута нормальные.
В части Сбер/ОФД вопрос. Что-то есть, но что это и как с этим работать – непонятно. Мы общались и со Сбером и с ОФД разными, так себе пока.

Мастер-данные

Опять-таки, моден норм. Кей-аккаунтов порядка 60К. Доступны через EDI, PARTIN, API, можно с сайтов забрать, все хорошо.
Несетевая розница. Крупнейшие игроки говорят, что юниверс по стране составляет около 400 тысяч . Данных в открытых источниках нет. 2GIS не очень хороший, не очень оперативный, не очень детальный, тема открытая.

Вы скажете, несетевая розница, ну, и ладно. RGM запустил на кей-аккаунтах и норм, там хорошие деньги могут быть. Ан нет.

Если говорить про дистрибьюторский канал, то он до сих пор дает большинству компаний 30-40% оборота. Это независимость от Магнита и Х5. Возможность проводить свою ценовую политику и самим решать, какая маржа должна быть в канале. И маржинальность выше. Канал интересный. И мы видим, что компании, которые 3-5 лет назад смотрели на традицию как на умирающий канал, начинают разворачиваться. Мы называем это ренессансом традишки.

Что происходит с мастер-данными в несетевой рознице?

В среднем у крупного производителя в базе аккумулируется порядка 3 млн записей по ТТ. Это записи, которые собраны за все годы, пока он качал сэллаут. Из этих 3 млн порядка 900 тысяч ТТ, по которым были продажи за последний год. И как показала практика, только 200 тыс из этих 900 тыс – реальные точки продаж. Вот это трехкратное сжатие базы – это та грязь, которая на самом деле поступает от дистрибьюторов.

Еще порядка 40 тыс новых записей прилетает в мес. от дистрибьюторов. Это не новые точки, это точки, которые каким-то образом меняются у дистра, могут поменять название или какой-то атрибут. Мы должны проверить, что произошло с точкой и та ли это точка, о которой мы знали.

Что в итоге? На данные дистра опереться нельзя – грязно. Данных в открытых источниках нет.

Три стратегии работы с АКБ в традиционной рознице

Что можно сделать? Можно проводить дорогой сенсус. Видели мы эти проекты, знаем, сколько тратит компания. Очень дорого.
Можно забить на канал. Сказать: ну и ладно, пусть так и будет, вот мы дистру отгрузили, дистр должен свой KPI по АКБ выполнять и все, нам неинтересно.
Можно организовать системный процесс поддержки DQ.

Мы эту историю уже проходили с 2 крупными компаниями. В ходе этого выработалось множество разных инструментов. Системный процесс не может быть автоматизирован до конца, он полуроботизирован, полуавтоматизирован.

Как выглядит системный процесс поддержки DQ

Получение точек от дистра (это всегда загрузка из каких-то источников типа SFA или DMS).
Разбор адресов, геокодирование. Часть точек, которые не распознаются автоматически, можно распознать вручную на геосервисах или картах. Часть точек вообще не распознается никак, это записи типа «у бабы Маши за углом». Такие точки улетают на территорию, где территориальный менеджер или супервайзер должны эту точку найти и идентифицировать.
После того, как адреса проставлены, можно начинать дедупликацию и мапинг точек дистрибьютора на эталонную точку. И вот на этом уровне рождается эталонная база из 200к точек.
Регулярная поддержка. Ежемесячно база этих точек обновляется и проверяется, контролируется нашей командой.

Мы реализовали инструмент, который объединяет в несколько групп пользователей. Это асессоры, которые автоматически распознают точки и проставляют геокоды, если находят их на карте. Это апруверы на территориях, которые дораспознают точки. Это аналитики, которые проставляют, реклассифицируют точки уже по факту их проверки и качества.

Результаты внедрения системной поддержки DQ

Мы высвобождаем ресурс аналитиков BD, это реально очень ценные люди, которые заняты зачастую рутинным трудом. Мы это убираем. Берем на себя эту работу по очистке грязных данных.
Мы повышаем оперативность чистки и мапинга данных, за счет это повышаем скорость принятия решений на чистых данных.
У вас чистая эталонная база, обновляемая в режиме реального времени.

Бизнес-бенефиты системной поддержки DQ

Бенефиты в сегментации клиентов. Например, вы увидели, что точка, которая была задублирована дистром, прокачивает больший объём товаров. Вы можете ее ресегментировать и, например, другой промо-бюджет на нее направить или ценовую политику на нее другую дать. Вы там начинаете оптимизировать промо-бюджеты и бюджеты с точки цены.
А есть часть бенефитов, которая появляется при шеринге эталонных данных с 2GIS. Например, вы можете обнаружить, что часть точек дистра относится к одной региональной сети. Эту сеть можно взять на прямой контракт, начать прокачивать и получать дополнительную маржу.
Вы можете мотивацию дистра выстроить по-новому. Если раньше дистр говорил «да я всю территорию покрыл, я свои KPI по АКБ выполняю», то увидев это через ДубльГис можно сказать «нет, подожди, ты еще 70% территории не поднял».
Можно увеличивать АКБ через расширение дата-сетов. Пилот, о котором мы говорим, это, наверное, будущее, когда производители шерят между собой данные по точкам, и вы видите, например, что вы на этой территории в какие-то точки продаете, а в какие-то нет, хотя туда продает производитель с похожими категориями товаров.
Ну, и ML-модели, конечно. Если мы имеем чистую базу точек и хорошие транзакционные данные, мы можем это загрузить в наш черный ящик ML-модели и получить те самые динамические маршруты и новое качество управления.

Блеск и нищета Data Driven менеджмента

Report Page