Self-service BI + AI
Рынок BI огромен (по каким-то оценкам он 6-7 млрд, а по каким-то уже за 12 млрд. долларов), и возможно, он вскоре изменится, и …Что поменяется?
1) Принятие решений о Self-service
Изначальные предпосылки принятия такого решения, - устраивать себе Self-service BI, - могут быть и обоснованные тривиальные, как то рост нагрузки на IT или потребность в ускорении аналитики), так и нетривиальные, связанные с принятием ситуационного решения.
· Фактор «чтобы добро не простаивало»: лицензии продаются пулом по 1000 и только, а у нас всего 10 BI-разработчиков, поэтому решили идти в SSBI;
· Топ-менеджер был на конференции и услышал модное слово;
· В коммерцию пришла новая сильная команда из другой компании, они принесли с собой новые стандарты работы и пожелания самим делать себе аналитику на BI-инструменте;
· ИБ пошло вразнос и закрыло прямой доступ в хранилище, отобрало python и несчастные аналитики пришли в BI, хотя раньше прекрасно жили с seaborn;
· SSBI – это лишь одна из инициатив, а на самом деле у организации есть большая программа по демократизации данных и пр.
Что может произойти?
AI – модная тема, решения с AI дешевеют каждый день, и связка BI+агент в одном интерфейсе в скором времени станет не роскошью. В связи с этим случаев, когда решение принимается не от внутренней обоснованной потребности организации, а спонтанно, на уровне «давайте пробовать» - будет больше.
2) Процесс внедрения Self-service BI и факторы успешности.
Как-то давно я уже разбирала факторы, почему программа Self-service в организации может провалиться: либо не достичь показателей внедрения, либо замедлиться/остановиться (полное исследование читать вот тут).

Здесь хочу подсветить, что у каждого фактора есть «стоимость», и чаще всего сценарии внедрения Self-service BI преследует одно и то же проклятие: все концентрируются на более «дешевых» факторах (чаще всего это обучение, доступ, участие пользователей, поддержка руководства и SLA/техподдержка), и надеются, что и без «дорогих» оно как-то само начнет работать.
Что изменится?
· Благодаря тому, что AI-агент может взять на себя процессы обучения инструменту, саппорта, траблшутинга, базы технических знаний по продукту, а также позволяет работать с качеством данных на прикладном уровне, команда может сразу начать работу с доступностью данных, системным качеством ключевых датасетов/семантических моделей, мониторингом, производительностью
· Затраты на каталог данных снижаются, так как встроенные AI при интерпретации данных могут опираться на метаданные и на содержание данных. Промт «Предположи, что это на основе факторов …» внезапно очень хорошо работает.
· Популярность внутренних профессиональных BI-сообществ в компании резко взлетит, а потом также стремительно упадет, - по причине, что когда все разберутся, как писать промты, далее можно будет уходить в индивидуальную работу с AI-хелпером.
· Снизится влияние проблемы «вовлечения пользователей», - встроенный агент позволяет снизить порог вхождения почти до 0, то есть отпадет технологический фактор, когда пользователь не берет инструмент, так как не умеет с ним работать, а времени учиться – не выделяют.
3) Аналитическая практика
Аналитическая практика— определение контекста и аудитории, формулировка аналитических вопросов, используемые методы и метрики, глубина проникновения аналитической культуры и DDD (он же – принятие решения на данных).
Не отрицая, что всякие аналитические школы будут востребованы, а любители BABOK будут и дальше процветать, к обучению аналитиков добавятся дополнительные пласты навыков, на стыке BI и AI.
Чему мы будем учить?
1) «Промпт как гипотеза»: будем учить формулировать задачу в формате цель → метрика → срезы/фильтры → период → допущения/исключения (напр.: «Сделай ABC по выручке за 90 дней, без возвратов, по категориям, с порогами 80/15/5»).
· Введение чек-листов валидации ответа агента: проверка источников, единиц измерения, правильной агрегации, реплицируемости.
· Обучение чтению авто-объяснений: различаем корреляцию/причинность; просим альтернативные объяснения и чувствительность результата.
· Расширяем data literacy: интерпретация доверительных интервалов, кумулятивов, перцентилей, ABC/RFM.
2)«Говорим со звездой»: будем учить пользователей и владельцев данных описывать зерно факта, ключи и измерения в терминах, понятных агенту (мини-бриф: факт, измерения, бизнес-правила).
· Навык принятия/отклонения предложений агента по вычисляемым показателям и иерархиям.
· Быстрая обратная связь по «дыркам» в модели: как формулировать запрос на добавление меры/измерения.
3) Принятие решений по маппингу и качеству: пороги пропусков/дубликатов, стратегия outliers, согласование кодировок. Скорее всего, это будут практики реакций: что делать, когда агент сообщает о несоответствии данных/плохом качестве данных
4) «Промпт-дизайн»: задаём макет словами (цель дашборда, аудитория, ключевые вопросы, приоритетные виджеты, медиа/мобильный формат).
Важно: я сначала внесла в этот пункт еще и чек-лист приёмки авто-дашборда: соответствие бренд-гайду, доступность (подписи, легенды), читабельность, производительность, но в ходе эксперимента выяснила, что он либо сам генерирует читабельные макеты, либо возвращается с доуточнением. В общем, Power BI может отрулить этот момент.
5)Структура «Контекст → Инсайт → Действие → Риск/альтернатива»:
Навык «контрастного рассказа»: просим альтернативные объяснения, проверяем устойчивость инсайта к смене периодов/срезов.
Персонализация повествования: аудитории/ролям — свои call-to-action и KPI.
4) Поставляемые пользователям артефакты.
Элементами поставки (то, что мы отдаем пользователям в рамках Self-service) могли быть:
· Инструмент
· Датасет (плоская витрина)
· Семантический слой
· Заголовка отчет (шаблон с предварительными метриками или какими-то визуализациями, которые пользователь дальше докручивал под себя)
Что изменится?
1) Появятся Агенты-рекомендатели и хелперы всех сортов, которые можно будет встраивать в основного агента (пресловутая мульти-агентская архитектура). Например:
a. Рекомендатель визуализаций с учётом типа данных/задачи и бренд-темы; авто-ограничения (агрегации, подписи, оси).
b. Автовывод схемы и связей (schema inference) с подтверждением пользователем
c. подсказки по кардинальности/граням на основе датасетов
d. Автопрофилирование и правила DQ (валидаторы типов/ключей, уникальности, диапазонов) с объяснениями для агента.
2) Шаблоны нарративов (готовые цепочки промтов с ссылками, в которые надо подставить конкретный /датасет/версии метрик/объект). Знаете, я так сейчас музыку генерирую в musicgpt – только у меня там шаблоны аккордов.
3) Библиотека «аналитических рецептов» (ABC/RFM/кохорты) как функции агента;
4) Внутренний семантический слой, доступный агенту ((metric cards, словарь терминов, единицы, правила агрегаций). – фактически, каталог данных, упакованный в агента.