Использование Microsoft Video Indexer для OSINT

Использование Microsoft Video Indexer для OSINT

Moody

Работаете над кейсом со множеством видео? Разве не было бы здорово вместо того, чтобы просматривать каждое, просто скачать их все, автоматически транскрибировать и проиндексировать?

Представьте, что вы расследуете резонансное событие, на тему которого есть несколько десятков видео. Чтобы просмотреть каждое видео, придется убить много времени, которого у вас, возможно, не так уж и много. Было бы замечательно загрузить все эти ролики в единую базу данных, проиндексировать их по разговорному контенту, темам и даже людям, которые в нем фигурируют. А потом просто отсеять ненужные фрагменты и перейти к сути.

Эта и многие другие функции являются частью набора инструментов, предлагаемого Microsoft Video Indexer. Microsoft позволяет регистрировать пробные учетные записи на этой платформе с разных почтовых сервисов, в том числе через Gmail. Позвольте мне рассказать о некоторых аспектах этой платформы, которые могут быть полезны во время проведения исследований.

Вернемся в август 2019 года. Проходит саммит G7 во Франции, и нам интересно собрать максимум информации по этой теме. Этот саммит горячо обсуждают во всех социальных сетях и широко освещают в прессе. В качестве источника видео мы будем использовать Youtube. А чтобы скачивать оттуда видео, будем использоваться сервис Y2Mate. Заходить на него и указывать ссылку вручную необязательно, достаточно добавить «pp» к исходному URL-адресу Youtube, как показано на скриншоте ниже, и нажать "Enter" - это перенаправит вас на сайт.

Не стоит забывать, что мы не ограничены одним Youtube. Загружать на Video Indexer видео можно и просто с компьютера - единственное, что нужно знать - язык видео. По умолчанию это английский. Если вы работаете с видео на другом языке, я бы посоветовал установить другой язык видео вручную. Ещё я столкнулся с проблемой загрузки длинных видео. Если у вас возникнут аналогичные проблемы, попробуйте разделить видео на части.

После того, как мы загрузили видео и оно проиндексировалось платформой, происходит волшебство. Вот пара функций Video Indexer'а:

  • Распознавание лиц
  • Полная транскрипция аудио (с переводом)
  • Определение темы
  • Обнаружение места действия
  • Определение эмоций

Давайте посмотрим на одно из загруженных мною видео:

Панель справа имеет две вкладки: инсайды и таймлайн. В разделе инсайдов вы сможете посмотреть список людей, которые были идентифицированы в видео по лицам. Как вы заметили, выбранный парень по имени Стефан де Врис был успешно опознан, и на таймлайне ниже можно увидеть моменты, в которых он появляется на видео (выделены черным цветом). Результаты основаны на поиске в Bing. Если человек не распознается и не индексируется автоматически, вы можете назвать его вручную.

Unknown #12 на самом деле Ангела Меркель. Нажав на кнопку редактирования в правом верхнем углу, мы можем указать имя. Если двух (или более) людей назвать одинаково, они будут автоматически объединены в одного человека. Две категории ниже индексируют общие темы, обсуждаемые в видео, а также именуют сцены в соответствии с окружением. Нажав на заголовок, вы перейдете к той части видео, где обсуждается указанная тема. Видео, кстати, идет потоком слева. Имейте ввиду, что сервис работает не идеально. К примеру, сцена, где Дональд Трамп начинает говорить, была помечена как туалетные помои (хотя некоторые люди считают его просто придурком).

Затем, немного ниже, находится шкала с общим настроением, царящим в видео фрагменте. Я предполагаю, что данная оценка основана на используемых в видео словах. Такие слова, как «хорошо», «отлично» и «круто», скорее всего, приведут к позитивному рейтингу. Помните, что они не всегда используются в правильном контексте говорящими, поэтому я обычно игнорирую эту функцию.

Большая часть данных, отображаемых на вкладке "Инсайды", основана на транскрипции разговоров, отображаемых на следующей вкладке - таймлайн. Работает эта функция неплохо, но некоторые данные все же придется редактировать вручную. Например, я отредактировал транскрипцию речи одного из спикеров: вместо «мой Chrome» докладчик сказал «Macron».

Смотрите видео на иностранном языке? Рекомендую нажать на кнопку перевода (земной шар) и выбрать язык, на котором будет отображена транскрипция.

Итак, мы загрузили два видео, немного отредактировали некорректные данные и теперь имеем полностью проиндексированную базу данных для выполнения запросов. Вернувшись на главную страницу своего профиля, мы сможем искать по всей проиндексированной информации: по тексту, по ключевым словам, по людям и прочему.

Поиск по ключевому слову «Trump» отобразит результаты поиска и распределит их по категориям. Как вы можете заметить, по небольшому слову сервис нашел его самого, все его упоминания в речи, и даже бегущий текст. Бегущий текст? Это один момент, который я почти забыл. Video Indexer также распознает наложенный в видеозаписях текст.

Это был только краткий обзор возможностей Microsoft Video Indexer. Я думаю, что он может пригодиться в некоторых OSINT-кейсах. И если вы хотите раскрыть потенциал сервиса на всю, рекомендую перейти на платную подписку.

Я даже подумывал о загрузке видео со всех интересующих меня конференций, чтобы создать большую базу данных и смотреть только наиболее увлекательные для меня темы, а не видеоролики целиком 😊


Статья доступна в оригинале на английском языке - читать.

Cybred - канал об информационной безопасности и конкурентной разведке, вдохновленный идеями олдскульных андеграундных интернет-сообществ о свободе распространения информации в сети и всеобщей взаимопомощи.

Report Page