Технология распознавания голоса АНБ

Технология распознавания голоса АНБ

Telegram News

Речь пойдёт о технологии распознавания голоса, которая описывалась в одном из секретных документов Агентства Национальной Безопасности (АНБ или NSA), раскрытого для общественности Эдвардом Сноуденом.

Технология работает, анализируя физические и поведенческие особенности голоса человека, отличные уже потому, что все люди различаются формой рта и длиной гортани. На основе анализа построен алгоритм динамической модели вокальных характеристик человека — «голосовая линия». Весь процесс состоит: из захвата нескольких произнесённых слов, превращения этих слов в голосовой отпечаток и сравнение с другими «голосовыми отпечатками», уже сохраненными в базе данных. Производится это практически мгновенно.

Перехватывая и записывая миллионы зарубежных телефонных разговоров, видео-телеконференций и интернет-звонков — спецслужба создала уникальную коллекцию голосов.

Документы из архива Сноудена показали, что через алгоритм распознавания речи могли быть идентифицированы люди по их прошлым высказываниям, даже если они использовали неизвестные номера телефонов, секретные кодовые слова или разные языки. 

Опять-таки, по мнению экспертов из Сivil Liberties, эта и другие технологии распознавания речи ставят под угрозу право на неприкосновенность частной жизни. «Это создает новые возможности для разведки и новые возможности для злоупотреблений», — пояснил Тимоти Эдгар, бывший советник Белого Дома.

Эдгар и другие эксперты указали на относительно стабильный характер человеческого голоса, который гораздо сложнее изменить или замаскировать, чем имя, адрес, пароль, номер телефона или PIN-код. Голос является уникальным и легкодоступным биометрически: в отличие от ДНК, он может собираться пассивно и с большого расстояния, без согласия ничего не подозревающего субъекта. Чем больше образцов конкретного голоса собраны, тем качественней модель работает.

Не только спецслужбы, но и коммерческие компании применяют похожие технологии, к примеру, для ведения банковских дел и проверки пароля. И спрос на использование таких инструментов растет. Исследования фирмы Tractica показали, что доходы от индустрии голосовых биометров достигнут к 2024 году почти 5 миллиардов долларов в год.

С другой стороны, исполнительный директор Фонда Свободы прессы Тревор Тимм отметил, что технология распознавания речи может гипотетически использоваться для отслеживания журналистов, разоблачения источников политических инсайтов и предотвращения анонимных рекомендаций. Тимм указал на многие пути — от телевизоров и наушников до устройств с поддержкой Интернета — через которые могут тайно записывать голоса. «Все вокруг имеет микрофоны. Мы все носим микрофон 24 часа в сутки на наших мобильных телефонах», — сказал Тимм. «И мы знаем, что у властей есть способы взломать телефоны и компьютеры, чтобы включить эти устройства».

Власти избегают обсуждения этой технологии, потому что тогда к ним возникнут серьезные вопросы, на которые они предпочли бы не отвечать.

Новые инструменты для голоса 

В 2015 году издание The Intercept сообщило, что АНБ построило набор «технологий человеческого языка». Разрабатывая программы для автоматического перевода речи в текст — то, что аналитики называют «Google для голоса» — агентство способно использовать ключевые слова и «селекторы» для поиска, чтения и индексирования записей. 

Распознавание речи появилось наряду с программами «речь-текст» в качестве дополнительной технологии, помогающей аналитикам изучать бесчисленные часы перехватов.

Еще с 1996 года АНБ финансирует Национальный институт стандартов и технологий Speech Group по разработке «наиболее доминирующих и перспективных алгоритмических подходов к проблемам, стоящим перед распознаванием речи». Участниками системы с NIST являются ведущие биометрические компании.

Например, Nuance рекламирует правительствам, военным и разведывательным службам «общедоступную голосовую биометрическую систему, способную быстро и точно идентифицировать и сегментировать людей в системах, содержащих миллионы голосовых отпечатков». В 2014 году Associated Press сообщил, что технология Nuance использовалась крупнейшей в Турции компанией мобильной телефонной связи для сбора речевых данных примерно из 10 миллионов клиентов. 

Nuance Communications — транснациональная корпорация — производитель программного обеспечения, управляемая из Burlington, Massachusetts, США. Разрабатывает приложения, работающие с голосовыми данными и с изображениями.

В октябре Хьюман Райтс Вотч сообщила, что китайское правительство создало национальную базу данных для голосовых отпечатков, чтобы автоматически идентифицировать людей, разговаривающих по телефону. Китайские власти стремятся связать голосовую биометрию десятков тысяч людей с их идентификационным номером, этнической принадлежностью и домашним адресом. Согласно HRW — поставщик, который производит голосовое программное обеспечение Китая — даже запатентовал систему для точного определения аудиофайлов для «мониторинга общественного мнения». 

Аналитические системы спецслужб могут сортировать перехваты по различным категориям, искать по ключевым словам требуемые данные в режиме реального времени и уведомлять, если отслеживаемые разговоры отвечают определенным установленным критериям.

И совсем неудивительно, что АНБ направляет те же биометрические технологии, которые используются для обнаружения внешних угроз, для поиска несогласных. Тимм подтвердил, что известны такие факты.

Для спецслужб США шпионаж за видными политиками и общественными деятелями с помощью этой технологии давно стал практикой. Вряд ли другие спецслужбы отстают в техническом оснащении. Поэтому у любого человека в любой стране есть право знать информацию об инструментах, которые власти могут использовать для наблюдения за миллионами людей во всем мире. Важно, чтобы этот тип информации обсуждался в публичной сфере.


______________________

Подписывайтесь на новости от Telegram News в Telegram + чат и во ВКонтакте