Аналитическое резюме секции «Время экспериментов: искусственный интеллект на службе исследователя» 

Аналитическое резюме секции «Время экспериментов: искусственный интеллект на службе исследователя» 

Сергей Давыдов, программный директор секции, член программного комитета конференции, департамент социологии НИУ ВШЭ

Мероприятие, посвященное искусственному интеллекту, проводилось в рамках Грушинской конференции четвертый раз подряд. Особенностью этого года стал фокус на российских исследовательских методиках и продуктах, основанных на ИИ.

В открывающем докладе «Как BigData и ИИ могут помочь в исследованиях» Д. Исаенков (МТС) обратил внимание на тот факт, что ИИ – один из этапов технологической автоматизации, берущий начало в 1950-е гг. При этом человечество уже пережило три «зимы искусственного интеллекта» - периода упадка интереса к технологии после высокого интереса и сравнительно бурного развития. Первая эпоха ИИ связана с задачами машинного перевода и относится к 1950-м гг. Вторая эпоха ИИ относится к 1980-м гг., она связана с появлением высокоуровневого языка программирования Lisp, экспертных систем и компьютеров пятого поколения. Третья эпоха ИИ происходит прямо сейчас. Наиболее перспективные направления, в которых ИИ может помочь исследователю и которые уже используются в МТС: AI-обзвоны, распознавание мимики, синтетические люди, сбор полевых данных, программирование анкет, обработка ответов, мультимодальность и компьютерное зрение. Важно помнить, что сфера ИИ значительно шире, чем ChatGPT и другие генеративные технологии. Кроме того, перспективная стратегия для исследователя – не искать задачи под технологии ИИ, а решать задачи при их помощи.

Исследовательский менеджер методлаборатории ВЦИОМ И. Буханский посвятил доклад «Обработка аудио и текстовых материалов в социологической организации средствами ИИ (на примере ВЦИОМ)» кейсу анализа при помощи ИИ неоконченных телефонных интервью продолжительностью до 20 секунд с целью более точного расчета параметров достижимости. Ценность автоматизации данной задачи заключается в необходимости сравнительно простой обработки большого объема материалов (70% массива исследования «ВЦИОМ-Спутник», около 80 тыс. звонков). Проект включил три этапа: классификацию, транскрибирование и кодирование средствами LLM. На первом этапе осуществлялся выбор между классическими подходами ML и DL. Градиентный бустер оказался не хуже, чем сверточные нейросети, при этом данный подход требует меньше ресурсов. Была достигнута точность 80% атрибуции при разделении на 7 классов. На втором этапе осуществлялся выбор из 3 технологий: Whisper (OpenAI), NVIDIA NeMO и российская разработка Wav2Vec. Наилучшие результаты были получены с Whisper. Наконец, на третьем этапе может использоваться ChatGPT или его аналоги, например, LeChat от Mistral или российская разработка LeoGPT.

Совместный доклад А. Карташевой (НИУ ВШЭ) и Т. Орешкиной (УФУ) «Дилемма достаточной точности и прозрачности рекомендательных сервисов» основан на дилемме Д. Коллингриджа из области предиктивной аналитики. Она заключается в проблеме силы и проблеме информации. На примере трех анализируемых профориентационных сервисов («Робот-профориентатор» от ТГУ, «Wizard» от УРФУ и «IOT-навигатор» от СПбГТУ «ЛЭТИ» и УрФУ) авторы приходят к заключению, что, с одной стороны, пользователи не ждут от таких систем слишком точных прогнозов ввиду их очевидности, а с другой стороны, не готовы принять прогнозных ошибок, которые возникают в результате нехватки данных.

В выступлении на тему «ML-аналитика на данных соцмедиа для принятия эффективных бизнес-решений» Васили Черный поделился опытом использования ML-технологий в компании Brand Analytics. Машинное обучение необходимо для сбора данных, а также распознавания языка, на котором написан текст. Кроме того, MLиспользуется для анализа больших объемов информации, которые не могут быть обработаны вручную; автоматического определения тональности сообщения; автоматизированной продуктовой аналитики (включая функцию аспектной тональности); построения эффективной системы поддержки клиентов; оперативного выявления сбоев в работе массовых сервисов; помощи в подготовке аналитики (WOM – выявление сообщений от первого лица, NER – выявление персон и компаний, определение тематики сообщений); анализа социума или бренда. Также Brand Analytics предлагает BrandGPT – умного ИИ-ассистента, помогающего быстро решать типовые аналитические задачи.

Д. Малышева представила доклад «Fastuna AI: ИИ-ассистент для исследований бизнеса», в котором рассказала о практиках применения ИИ в качественных исследованиях. Компания Fastuna AI предлагает технологию цифрового интервьюирования «Маша», способную проводить интервью с респондентами по заранее составленному гайду, обрабатывать транскрипты и выделять различные темы.

Заключительный доклад секции, представленный М. Незговоровой был озаглавлен «Путь к синтетическим респондентам или будущее, которое уже наступило». На примере исследовательского опыта компании OMI были показаны возможности использования синтетических респондентов для решения различных маркетинговых задач: генерирование идей и гипотез, генерирование и визуализация продуктовых идей, их тестирование и доработка.

В рамках круглого стола участники дискуссии обсудили тенденции развития исследовательского рынка с приходом технологий ИИ, появляющиеся в данном контексте возможности и барьеры; правовые и этические вызовы; трансформацию индустрии и роли исследователя.

К числу основных тенденций эксперты отнесли повышение точности, сложности, эффективности, мощности, скорости создания ИИ-моделей. Высокая доступность новых ИИ-продуктов порождает вызов – необходимость научиться правильно их использовать. Для обучения алгоритмов необходимы данные, уже сегодня за них развернулась высокая конкуренция. ИИ не заменит исследователя, но исследователь с ИИ заменит исследователя без ИИ. Существенный риск связан с возможностью закольцованного обучения, когда ML будет обучаться на своих же результатах. Культурный код, на котором обучаются модели, приобретает значимость.

В рамках обсуждения правовых вопросов был отмечен рост в России числа судебных разбирательств, связанных с ИИ, на 60%. Существующие регуляторные нормы существенно тормозят развитие ИИ. При этом развитие регуляторной базы существенно отстает от передовых практик, и это облегчает прогресс.

Компетенции, которые будут нужны исследователю будущего: насмотренность в области ИИ-технологий, готовность пробовать и экспериментировать, умение работать в междисциплинарных группах.

Report Page