Self-service BI + AI

Self-service BI + AI

Рынок BI огромен (по каким-то оценкам он 6-7 млрд, а по каким-то уже за 12 млрд. долларов), и возможно, он вскоре изменится, и …

Что поменяется?

1)      Принятие решений о Self-service

Изначальные предпосылки принятия такого решения, - устраивать себе Self-service BI, -  могут быть и обоснованные  тривиальные, как то рост нагрузки на IT или потребность в ускорении аналитики), так и нетривиальные, связанные с принятием ситуационного решения.

·        Фактор «чтобы добро не простаивало»: лицензии продаются пулом по 1000 и только, а у нас всего 10 BI-разработчиков, поэтому решили идти в SSBI;

·        Топ-менеджер был на конференции и услышал модное слово;

·        В коммерцию пришла новая сильная команда из другой компании, они принесли с собой новые стандарты работы и пожелания самим делать себе аналитику на BI-инструменте;

·        ИБ пошло вразнос и закрыло прямой доступ в хранилище, отобрало python  и несчастные аналитики пришли в BI, хотя раньше прекрасно жили с seaborn;

·        SSBI – это лишь одна из инициатив, а на самом деле у организации есть большая программа по демократизации данных и пр.

Что может произойти?

AI – модная тема, решения с AI дешевеют каждый день, и связка BI+агент в одном интерфейсе в скором времени станет не роскошью. В связи с этим случаев, когда решение принимается не от внутренней обоснованной потребности организации, а спонтанно, на уровне «давайте пробовать» - будет больше.

2)      Процесс внедрения Self-service BI и факторы успешности.

Как-то давно я уже разбирала факторы, почему программа Self-service в организации может провалиться: либо не достичь показателей внедрения, либо замедлиться/остановиться (полное исследование читать вот тут).

Здесь хочу подсветить, что у каждого фактора есть «стоимость», и чаще всего сценарии внедрения Self-service BI преследует одно и то же проклятие: все концентрируются на более «дешевых» факторах (чаще всего это обучение, доступ, участие пользователей, поддержка руководства и SLA/техподдержка), и надеются, что и без «дорогих» оно как-то само начнет работать.

Что изменится?

·        Благодаря тому, что AI-агент может взять на себя процессы обучения инструменту, саппорта, траблшутинга, базы технических знаний по продукту, а также позволяет работать с качеством данных на прикладном уровне, команда может сразу начать работу с доступностью данных, системным качеством ключевых датасетов/семантических моделей, мониторингом, производительностью

·        Затраты на каталог данных снижаются, так как встроенные AI при интерпретации данных могут опираться на метаданные и на содержание данных. Промт «Предположи, что это на основе факторов …» внезапно очень хорошо работает.

·        Популярность внутренних профессиональных BI-сообществ в компании резко взлетит, а потом также стремительно упадет, - по причине, что когда все разберутся, как писать промты, далее можно будет уходить в индивидуальную работу с AI-хелпером.

·        Снизится влияние проблемы «вовлечения пользователей», - встроенный агент позволяет снизить порог вхождения почти до 0, то есть отпадет технологический фактор, когда пользователь не берет инструмент, так как не умеет с ним работать, а времени учиться – не выделяют.

 

3)      Аналитическая практика

Аналитическая практика— определение контекста и аудитории, формулировка аналитических вопросов, используемые методы и метрики, глубина проникновения аналитической культуры и DDD (он же – принятие решения на данных).

Не отрицая, что всякие аналитические школы будут востребованы, а любители BABOK будут и дальше процветать, к обучению аналитиков добавятся дополнительные пласты навыков, на стыке BI и AI.

Чему мы будем учить?

1) «Промпт как гипотеза»:  будем учить формулировать задачу в формате цель → метрика → срезы/фильтры → период → допущения/исключения (напр.: «Сделай ABC по выручке за 90 дней, без возвратов, по категориям, с порогами 80/15/5»).

·        Введение чек-листов валидации ответа агента: проверка источников, единиц измерения, правильной агрегации, реплицируемости.

·        Обучение чтению авто-объяснений: различаем корреляцию/причинность; просим альтернативные объяснения и чувствительность результата.

·        Расширяем data literacy: интерпретация доверительных интервалов, кумулятивов, перцентилей, ABC/RFM.

 2)«Говорим со звездой»: будем учить пользователей и владельцев данных описывать зерно факта, ключи и измерения в терминах, понятных агенту (мини-бриф: факт, измерения, бизнес-правила).

·        Навык принятия/отклонения предложений агента по вычисляемым показателям и иерархиям.

·        Быстрая обратная связь по «дыркам» в модели: как формулировать запрос на добавление меры/измерения.

3) Принятие решений по маппингу и качеству: пороги пропусков/дубликатов, стратегия outliers, согласование кодировок. Скорее всего, это будут практики реакций:  что делать, когда агент сообщает о несоответствии данных/плохом качестве данных

4) «Промпт-дизайн»: задаём макет словами (цель дашборда, аудитория, ключевые вопросы, приоритетные виджеты, медиа/мобильный формат).

Важно: я сначала внесла в этот пункт еще и чек-лист приёмки авто-дашборда: соответствие бренд-гайду, доступность (подписи, легенды), читабельность, производительность, но в ходе эксперимента выяснила, что он либо сам генерирует читабельные макеты, либо возвращается с доуточнением. В общем, Power BI может отрулить этот момент.

5)Структура  «Контекст → Инсайт → Действие → Риск/альтернатива»:

Навык «контрастного рассказа»: просим альтернативные объяснения, проверяем устойчивость инсайта к смене периодов/срезов.

  Персонализация повествования: аудитории/ролям — свои call-to-action и KPI.

4)      Поставляемые пользователям артефакты.

Элементами поставки (то, что мы отдаем пользователям в рамках Self-service) могли быть:

·        Инструмент

·        Датасет (плоская витрина)

·        Семантический слой

·        Заголовка  отчет (шаблон с предварительными метриками или какими-то визуализациями, которые пользователь дальше докручивал под себя)

Что изменится?

1)      Появятся Агенты-рекомендатели и хелперы всех сортов, которые можно будет встраивать в основного агента (пресловутая мульти-агентская архитектура). Например:

a.       Рекомендатель визуализаций с учётом типа данных/задачи и бренд-темы; авто-ограничения (агрегации, подписи, оси).

b.      Автовывод схемы и связей (schema inference) с подтверждением пользователем

c.       подсказки по кардинальности/граням на основе датасетов

d.      Автопрофилирование и правила DQ (валидаторы типов/ключей, уникальности, диапазонов) с объяснениями для агента.

2)      Шаблоны нарративов (готовые цепочки промтов с ссылками, в которые надо подставить конкретный /датасет/версии метрик/объект). Знаете, я так сейчас музыку генерирую в musicgpt – только у меня там шаблоны аккордов.

3)      Библиотека «аналитических рецептов» (ABC/RFM/кохорты) как функции агента;

4)      Внутренний семантический слой, доступный агенту ((metric cards, словарь терминов, единицы, правила агрегаций). – фактически, каталог данных, упакованный в агента. 



Report Page