Про «умные» альбомы в Яндекс.Диске

Про «умные» альбомы в Яндекс.Диске


В конце ноября на мой Android-смартфон прилетело обновление «Яндекс.Диска», в чейнджлоге которого (а, как вы помните, я обожаю читать списки изменений) был следующий текст:

В Диске появились умные альбомы «Красивые» и «Разобрать».
В первый попадают красивые фотографии, чтобы вы могли их пересматривать в любой момент, а во втором находятся фотографии, которые возможно стоит разобрать или даже удалить. 

Triggered. Понятно, что поиск по тексту сейчас не делает только ленивый, но изображения? На ум приходит только мерзкий Facebook/Instagram, где это сделано в том числе для рекламщиков. Пишу в саппорт: «Где поставить галочку, чтобы Яндекс перестал анализировать содержимое фотографий, например, для создания альбома "красивые"?», на что получаю встречный вопрос:

«Не хочется вас расстраивать, но отключить технологию компьютерного зрения невозможно, ведь она является непосредственной частью Яндекс.Диска. Скажите, а почему вам не нравятся автоматически генерируемые альбомы? Ведь это сделано для вашего удобства в первую очередь! Я могу вас уверить, что ни у кого, кроме вас, нет доступа к вашей информации, робот никуда ее не передает».

Я решил вступить с ними в переписку и подробно объяснил, что не так с этой фичей. Получилось 7 пунктов, на которые впоследствии пришёл ответ. Для удобства чтения я сгруппирую дальнейший текст в формате «вопрос-ответ».


Я: Во-первых, будучи линуксоидом, я верю, что "утилиты" нужно использовать по необходимости, а не "пусть будет". Мне эти "умные" альбомы попросту не нужны.

Саппорт: Наша команда понимает, что чем более тонкая настройка предложена пользователю, тем выше шанс, что конечный продукт будет удобен для людей с совершенно разными потребностями, вкусами и предпочтениями. Мы обязательно подумаем над возможностью отключать интеллектуальные подборки и сортировку в альбомах. Жаль, пока нет возможности указать точно, когда это может быть реализовано.


Я: Во-вторых, робот – не человек, ему неведомо понятие "красоты". Его можно научить находить что-то более-менее похожее, но тогда вопрос – на какой выборке этого "робота" обучали? Уж не не пользовательской ли часом?

С: Как вы знаете, в системе Яндекса существует огромное количество сервисов, поисковых алгоритмов и баз данных.

Если в работе автоматической сортировки требуется обучение с использованием изображений, нет никакой необходимости прикасаться к закрытым материалам наших пользователей, которые размещены в Диске. В совершенно открытом доступе на данный момент имеется невообразимое количество нужного контента.


Я: В-третьих, я отдаю себе отчёт, что Яндекс де факто российская компания, а сервис предоставляется бесплатно. А там, где сервис бесплатный, товаром является пользователь. Сегодня "робот" анализирует фотографии, а завтра будет анализировать текстовые файлы? Хотя, возможно, это уже происходит.

С: Нет, мы не можем говорить об анализе в его классическом понимании, когда говорим о сортировке фото роботом.

При внешней иллюзии интеллекта этот алгоритм остается машинной обработкой изображений, не более. И абсолютно точно технически невозможно просматривать документы пользователя без его разрешения или ведома. Опять-таки, в таких действиях нет никакой необходимости, так как открытой информации, которую можно получить абсолютно легально, более чем достаточно.


Я: В-четвёртых, Яндекс и так собирает слишком много информации. Например, список установленных приложений, который был собран автоматически при создания письма в саппорт. Или раздел "Experiments" в логах. Возможно, я что-то упустил в политике конфиденциальности.

С: Боюсь, мы запутаемся в формулировках, если применим термин "слишком много" к вопросу сбора информации. Приложение записывает в логи только те данные, которые прямо или косвенно влияют на его работоспособность и помогают технической группе сориентироваться в среде обитания самого приложения. В условиях, когда контакт поддержки с пользователем минимален, а прямой доступ к его оборудованию отсутствует, такая информация позволяет избежать "ручного" сбора информации и сократить как переписку, так и время обработки запроса.


Я: (здесь объединены два пункта, т.к. на них дан один ответ) В-пятых, побуду занудой и ещё раз попрошу указать пункты из Условий использования ( https://yandex.ru/legal/disk_termsofuse/) и/или Политики конфиденциальности ( https://yandex.ru/legal/confidential/index.html) , прямо разрешающей анализировать (ручным или автоматическим способом) контент, хранящийся в персональном облаке пользователя.

В-шестых, согласно пункту 10.1 Политики конфиденциальности, я имею право (далее цитата): "требовать ограничений на обработку Вашей Персональной информации" (конец цитаты). Уточните, пожалуйста, распространяется ли это на функциональность, связанную с обработкой (ручным или автоматическим способом) контента, хранящегося в моём персональном облаке.

С: Согласно Политике конфиденциальности (https://yandex.ru/legal/confidential/) Яндекс всегда обрабатывает вашу Персональную информацию в определенных целях и только ту Персональную информацию, которая имеет отношение к достижению таких целей. В том числе такая обработка необходима для того, чтобы совершенствовать, менять, персонализировать или иным образом улучшать наши сервисы в интересах всех пользователей.

Если вы хотите ограничить объем обрабатываемой Персональной информации, вы можете удалить информацию, указанную вами раннее в вашей учетной записи. Если вы хотите ограничить цели обработки, то вы можете либо прекратить использование отдельных сервисов, для оказания которых необходима обработка вашей Персональной информации, либо отписаться от рассылок, на получение которых ранее получали согласие.


Я: Наконец, в-седьмых, выскажу мнение, так сказать, TL;DR: Яндекс.Диск всё больше становится в моих глазах местом, пригодным только для ограниченного по времени хранения файлов, которые зашифрованы до попадания на Диск и расшифровываются только после скачивания с Диска. Анализ пользовательского контента с точки зрения эмоциональной оценки – свинство.

С: Согласен с вами, что эмоциональная оценка контента пользователя – это грубо, если она присваивается человеком. Но, ссылаясь на третий пункт своего же ответа, повторюсь – мы не можем говорить об эмоциональной оценке, когда речь идет о машинной обработке, так как система лишена каких-либо эмоций и в обработке руководствуется совершенно иными принципами.


Выводы, как и всегда, предлагается сделать самостоятельно.