Что о вас знает Skynet?
https://t.me/TeleSecurВ последнее время много статей о том, как о нас собирают информацию различные онлайн сервисы. Все эти статьи по большей части технические.
Эти долгие, скучные статьи заканчиваются выводом в пару строк, типа этого:
Приложение ВКонтакте для Android помимо своих метрик и телеметрий отправляет такой же, и даже больший, объем данных для третьих лиц: MyTracker и MailRu LibVerify.
Какие тут вводы можно сделать об угрозах со стороны сервисов? Да никаких. Ну собирают и собирают, все собирают. Вот если бы показали отчет полученный на основании этих данных, вот это было бы интересно.
На самом деле много информации собирается, а выводы делаются на основании вашего поведения и контента который вы просматриваете или лайкаете.
Чтобы "залезть вам в голову” достаточно знать какие посты вы смотрите, сколько по времени, по каким ссылкам переходите и какие записи оставляете. А если эти данные насытить из других источников, то про вас и про ваши планы можно узнать все.
В этой статье я постараюсь показать, как современные Machine Learning делают выводы о вас.
Data Selfie
Год назад я поставил себе расширение в браузере Data Selfie. Это расширение к браузеру , которое отслеживает вашу активность на Facebook. По мере того как набирается информация о вас, выводы появляются в дашборде.
Ссылка: http://dataselfie.it
Для анализа, расширение использует две машины (Machine Learning):
IBM Watson -Natural Language Processing (NLP)- машина работающая с естественным языком
Apply Magic Sauce (Университет Cambridge) - на основании ваших лайков в Facebook делает предположения о ваших психологических чертах.
Я и Facebook
Немного о том какой я пользователь Facebook. В друзьях у меня только те кого я знаю лично. Я практически ничего не комментирую и не публикую, только смотрю ленту и иногда лайкаю.
Что стало известно обо мне
Собственно в отчетах есть очевидные статистические данные (скриншоты не привожу). Они говорят, о том кого вы больше всего читаете и лайкаете:
Activity - лента активностей на временной шкале
Top friends - друзья, ранжируется по времени залипания на их постах
Top pages - страницы, ранжируется по времени залипания на постах групп из вашей подписки
Top likes - кого вы больше всего лайкаете, ранжируется по количеству лайков на постах, фотографиях и видео друзей
Вторая часть дашборда уже интереснее, информация которая получена не просто плюсованием смайликов или секунд на страницах. Анализ делают выше упоминаемые машины.
Keywords
Рейтинг ключевых слов которые был в постах и статьях которые вы просматривали/читали. Ранжируются по релевантности.
Entities
Рейтинг объектов (личности, организации) попавшие в поле ваших интересов. Ранжируются по релевантности, есть упоминание контекста в котором они упоминались (позитивный, негативный или нейтральный).
Personality Prediction
Делаются выводы о вашей личности на основании того, что вы просматриваете и как реагируете в своей ленте FB. Схематично показана ваша Big 5 - пятифакторная модель структуры личности: экстраверсия, согласие, добросовестность, невротизм и открытость к опыту. Очень познавательная схема.
Religious Orientation
Отчет о ваших религиозных взглядах. Машина уагадала, я не мусульманин. А вот решить христианин я или неверующий однозначно не смогла, нет у нее такого - “верующий атеист”. Я считаю, что машина угадала мое отношение к религии.
Political Orientation
Отчет о том каким политическим взглядам относятся ваши. Мои взгляды угадали, даже в пропорциях. Правда непонятно в чем разница между Liberal и Libertanian.
Other Prediction
О том как я отношусь к большинству живущих на земле. Отчет чем -то мне напомнил характеристику на работе : мужчина, интеллигент, приоритеты: удовлетворенность жизнью, лидерство. Считаю, что угадали.
Shopping Preference
Основанная на Big 5 модель ваших предпочтений в шопинге (вероятно или маловероятно). Мои предпочтения при покупках угадали.
Но точно не могу сказать, что я любитель платить карточкой. Если я не догадываюсь, и я на самом деле предпочитаю оплату картой, то это хороший повод использовать против меня социальную инженерию. Меня можно вывести на платеж картой, и там я могу проявить слабость.
Health+ Activity+ Other Preferences
Отчет о предпочтениях в здоровье и различных активностях. Да, я часто ем- каждые 2-3 часа , 5-6 раз в день, как завещал великий ЗОЖ. Угадали.
Недавно только закончился абонемент в тренажерный зал. Именно факт наличие абонемента угадала машина, а не насколько я фанат спорта. Ходил редко в зал;)
Интересное предположение, о старте своего бизнеса в ближайшие несколько лет. Машина считает, что это маловероятно. А я считаю, что это важная часть моего будущего. Может она знает больше обо мне? Может я на столько нерешителен в этом вопросе. В общем нужно посмотреть.
Итог
Что я скажу. Я в шоке. Даже при моей низкой активности в Facebook, машина вычислила несколько моментов про меня, которые как мне казалось знаю только я.
Есть некоторые моменты про которые я даже не задумывался, но посмотрев на дашборд и хорошенько поразмыслив, я понял что машина угадала.
Есть отчеты и выводы, которые явно не были в постах. Ну нет среди моих друзей и не могу вспомнить ,что бы они писали про религию и отношение к ней. Или про то что я покупаю, на что обращаю внимание, и как люблю оплачивать товары.
Точно не было вопросов про бизнес и свое дело. Это вообще только мои мечты.
Чтобы понять про вас больше чем вы знаете сами про себя, нужно совсем мало входной информации, очень мало.