Что о вас знает Skynet?

Что о вас знает Skynet?

https://t.me/TeleSecur

В последнее время много статей о том, как о нас собирают информацию различные онлайн сервисы. Все эти статьи по большей части технические.

Эти долгие, скучные статьи заканчиваются выводом в пару строк, типа этого:

Приложение ВКонтакте для Android помимо своих метрик и телеметрий отправляет такой же, и даже больший, объем данных для третьих лиц: MyTracker и MailRu LibVerify.

Какие тут вводы можно сделать об угрозах со стороны сервисов? Да никаких. Ну собирают и собирают, все собирают. Вот если бы показали отчет полученный на основании этих данных, вот это было бы интересно.

На самом деле много информации собирается, а выводы делаются на основании вашего поведения и контента который вы просматриваете или лайкаете.

Чтобы "залезть вам в голову” достаточно знать какие посты вы смотрите, сколько по времени, по каким ссылкам переходите и какие записи оставляете. А если эти данные насытить из других источников, то про вас и про ваши планы можно узнать все.

В этой статье я постараюсь показать, как современные Machine Learning делают выводы о вас.


Data Selfie

Год назад я поставил себе расширение в браузере Data Selfie. Это расширение к браузеру , которое отслеживает вашу активность на Facebook. По мере того как набирается информация о вас, выводы появляются в дашборде.

Ссылка: http://dataselfie.it 

Для анализа, расширение использует две машины (Machine Learning):

IBM Watson -Natural Language Processing (NLP)- машина работающая с естественным языком

Apply Magic Sauce (Университет Cambridge) - на основании ваших лайков в Facebook делает предположения о ваших психологических чертах.


Я и Facebook

Немного о том какой я пользователь Facebook. В друзьях у меня только те кого я знаю лично. Я практически ничего не комментирую и не публикую, только смотрю ленту и иногда лайкаю.


Что стало известно обо мне

Собственно в отчетах есть очевидные статистические данные (скриншоты не привожу). Они говорят, о том кого вы больше всего читаете и лайкаете:

Activity - лента активностей на временной шкале

Top friends - друзья, ранжируется по времени залипания на их постах

Top pages - страницы, ранжируется по времени залипания на постах групп из вашей подписки

Top likes - кого вы больше всего лайкаете, ранжируется по количеству лайков на постах, фотографиях и видео друзей


Вторая часть дашборда уже интереснее, информация которая получена не просто плюсованием смайликов или секунд на страницах. Анализ делают выше упоминаемые машины.

Keywords

Рейтинг ключевых слов которые был в постах и статьях которые вы просматривали/читали. Ранжируются по релевантности.

Entities

Рейтинг объектов (личности, организации) попавшие в поле ваших интересов. Ранжируются по релевантности, есть упоминание контекста в котором они упоминались (позитивный, негативный или нейтральный).

Personality Prediction

Personality Prediction

Делаются выводы о вашей личности на основании того, что вы просматриваете и как реагируете в своей ленте FB. Схематично показана ваша Big 5 - пятифакторная модель структуры личности: экстраверсия, согласие, добросовестность, невротизм и открытость к опыту. Очень познавательная схема.

Religious Orientation

Religious Orientation

Отчет о ваших религиозных взглядах. Машина уагадала, я не мусульманин. А вот решить христианин я или неверующий однозначно не смогла, нет у нее такого - “верующий атеист”. Я считаю, что машина угадала мое отношение к религии.

Political Orientation

Political Orientation

Отчет о том каким политическим взглядам относятся ваши. Мои взгляды угадали, даже в пропорциях. Правда непонятно в чем разница между Liberal и Libertanian. 

Other Prediction


О том как я отношусь к большинству живущих на земле. Отчет чем -то мне напомнил характеристику на работе : мужчина, интеллигент, приоритеты: удовлетворенность жизнью, лидерство. Считаю, что угадали.

Shopping Preference

Shopping Preference

Основанная на Big 5 модель ваших предпочтений в шопинге (вероятно или маловероятно). Мои предпочтения при покупках угадали.

Но точно не могу сказать, что я любитель платить карточкой. Если я не догадываюсь, и я на самом деле предпочитаю оплату картой, то это хороший повод использовать против меня социальную инженерию. Меня можно вывести на платеж картой, и там я могу проявить слабость.  

Health+ Activity+ Other Preferences

Health+ Activity+ Other Preferences

Отчет о предпочтениях в здоровье и различных активностях. Да, я часто ем- каждые 2-3 часа , 5-6 раз в день, как завещал великий ЗОЖ. Угадали.

Недавно только закончился абонемент в тренажерный зал. Именно факт наличие абонемента угадала машина, а не насколько я фанат спорта. Ходил редко в зал;)

Интересное предположение, о старте своего бизнеса в ближайшие несколько лет. Машина считает, что это маловероятно. А я считаю, что это важная часть моего будущего. Может она знает больше обо мне? Может я на столько нерешителен в этом вопросе. В общем нужно посмотреть.

Итог

Что я скажу. Я в шоке. Даже при моей низкой активности в Facebook, машина вычислила несколько моментов про меня, которые как мне казалось знаю только я.

Есть некоторые моменты про которые я даже не задумывался, но посмотрев на дашборд и хорошенько поразмыслив, я понял что машина угадала.

Есть отчеты и выводы, которые явно не были в постах. Ну нет среди моих друзей и не могу вспомнить ,что бы они писали про религию и отношение к ней. Или про то что я покупаю, на что обращаю внимание, и как люблю оплачивать товары. 

Точно не было вопросов про бизнес и свое дело. Это вообще только мои мечты.


Чтобы понять про вас больше чем вы знаете сами про себя, нужно совсем мало входной информации, очень мало.


Report Page