Анатомия трекеров

Анатомия трекеров

Life-Hack [Жизнь-Взлом]/Хакинг

#Полезное

Трекеры прячутся почти во всех уголках интернета и современной жизни. Средняя веб-страница обменивается данными с десятками третьих сторон. Среднее приложение делает то же самое, а многие из них собирают конфиденциальную информацию, такую как местоположение и записи вызовов, даже когда они не используются.

Трекеры отслеживания проникают и в физический мир. Торговые центры используют автоматические считыватели номерных знаков, чтобы отслеживать трафик через свои парковки, а затем делиться этими данными с правоохранительными органами. Компании, организаторы концертов и политики используют маячки Bluetooth и WiFi для пассивного мониторинга людей в их районе. Розничные магазины используют распознавание лиц, чтобы идентифицировать клиентов, отслеживать кражи и показывать целевую рекламу.

Технологические компании, торговцы данными и рекламодатели, стоящие за этим отслеживанием, а также технологии, с помощью которых оно осуществляется — всё это обычно невидимо для пользователя. Корпорации создали зал односторонних зеркал: внутри, в социальных сетях вы можете видеть только приложения, веб-страницы, рекламу и себя самих. Но в тени с обратной стороны зеркала находятся трекеры, которые спокойно записывают практически все, что вы делаете. Эти трекеры не всезнающие, но они широко распространены и неизбирательны. Данные, которые они собирают и получают, не идеально точны, но, тем не менее, чрезвычайно чувствительны.

Мы надеемся, что этот документ прольёт свет на корпоративное отслеживание и демистифицирует его для журналистов, политиков и заинтересованных потребителей, объяснит масштабы проблемы и предложит способы ее решения.

ОТСЛЕЖИВАНИЕ СЕРВИСОМ VS. ОТСЛЕЖИВАНИЕ ТРЕТЬЕЙ СТОРОНОЙ

Крупнейшие компании собирают огромные объемы данных, когда люди пользуются их услугами. Facebook знает, кто ваши друзья, что вам «нравится» и какой контент вы читаете в ленте новостей. Google знает, что вы ищете и куда вы идете, когда вы перемещаетесь с помощью Google Maps. Amazon знает, что вам нужно купить и что вы купили.

Данные, которые эти компании собирают с помощью своих собственных продуктов и услуг, называются «отслеживание сервисом». Эта информация может быть чрезвычайно конфиденциальной, и компании уже давно используют ее неправильно. Сервисы обычно собирают данные, получая так называемое «согласие»: используя наш сервис, вы соглашаетесь разрешить нам использовать данные, которые мы собираем, пока вы это делаете. Все больше пользователей начинают понимать, что для многих бесплатных сервисов они являются сырьём, даже если им это не нравится.

Однако компании собирают столько же личной информации, если не больше, о людях, которые не пользуются их услугами. Например, Facebook собирает информацию о пользователях других веб-сайтов и приложений с помощью своих невидимых «пикселей конверсии». Аналогичным образом, Google, хотя вы и не давали ему такого права, отслеживает в какой магазин вы пошли приобретать товар в своем городе, после того как загуглили этот товар, и эти данными могут пользоваться рекламодатели для лучших настроек в Google AdWords. Тысячи других торговцев данными, рекламодателей и трекеров скрываются где-то на заднем плане, когда мы сёрфим веб или просто пользуемся телефоном или умными часами. Это называется «отслеживание третьей стороной». Его гораздо труднее идентифицировать без намётанного взгляда, и его почти невозможно избежать.

ЧТО ЗНАЮТ ТРЕКЕРЫ?

Многие знакомы с самыми вопиющими случаями нарушения конфиденциальности: каждый смартфон представляет собой карманный GPS-трекер, который постоянно передает информацию о своем местонахождении через интернет неизвестным третьим сторонам. Подключенные к интернету устройства с камерами и микрофонами могут оказаться и периодически оказываются бесшумными жучками для прослушивания разговоров и отслеживания местоположения. Хорошо известен случай, когда школа следила за учениками с помощью веб-камер на их ноутбуках.

Но эти самые известные каналы наблюдения не являются самыми распространенными и опасными для нашей частной жизни. Даже несмотря на то, что мы проводим много часов, смотря в подключенные к интернету фронтальные камеры, они крайне редко записывают что-либо без явного намерения пользователя. Чтобы не нарушать закон, технологические компании обычно воздерживаются от тайного прослушивания разговоров пользователей. Как покажет эта статья далее, трекеры узнают намного больше из тысяч менее шокирующих источников данных. Тревожная правда заключается в том, что хотя Facebook не прослушивает вас через ваш телефон, это просто потому, что ему это уже не нужно.

Самая распространенная угроза нашей конфиденциальности — медленное, постоянное и непреклонное накопление казалось бы довольно обыденных данных о том, как мы живем. Оно включает такие вещи, как история просмотров, использование приложений, историю покупок и данные геолокации. Эти казалось бы малозначительные отдельные данные могут быть объединены в значительное целое, которое говорит о нас почти всё. Трекеры собирают данные о наших кликах, просмотрах, нажатиях и переходах и создают обширные поведенческие профили, которые могут выявить нашу политические предпочтения, религиозные убеждения, сексуальную идентичность и активность, расу и этнос, уровень образования, ежемесячный доход, потребительские привычки, а также физическое и психическое здоровье.

КАК ТРЕКЕРЫ СВЯЗЫВАЮТ ДАННЫЕ С КОНКРЕТНЫМИ ЛЮДЬМИ?

Большинство сторонних трекеров предназначено для создания профилей реальных людей. Это означает, что каждый раз, когда трекер собирает информацию, ему нужен идентификатор — то, что он может использовать, чтобы связать эту информацию с конкретным человеком. Иногда трекер делает это косвенно: сопоставляя собранные данные с определенным устройством или браузером, что, в свою очередь, впоследствии может соотноситься с одним человеком или, возможно, с небольшой группой людей, например домохозяйством.

Чтобы отслеживать, кто есть кто, трекерам нужны уникальные, постоянные и доступные идентификаторы. Другими словами, трекер ищет информацию, которая (1) указывает только на вас или ваше устройство, которая (2) не изменится, и к которой (3) он имеет легкий доступ. Некоторые потенциальные идентификаторы соответствуют всем трем из этих требований, но трекеры все еще могут использовать идентификатор, который проверяет только два из этих трех показателей. Также трекеры могут комбинировать несколько слабых идентификаторов, чтобы создать один сильный.

Идентификатор, который проверяет все три показателя, может быть именем, адресом электронной почты или номером телефона. Это также может быть «имя», которое дает вам сам трекер, например «af64a09c2» или «921972136.1561665654». Для трекера важнее всего то, что идентификатор указывает на вас и только на вас. Со временем он может создать достаточно богатый профиль о человеке, известном как «af64a09c2» — где он живёт, что читает, что покупает, обычное имя ему даже не нужно. Трекеры могут использовать искусственные идентификаторы, такие как cookie-файлы и рекламные ID, чтобы компании могли писать целевым группам пользователей личные сообщения со своими предложениями. Данные, которые не связаны с реальным именем вроде Василий Петрович Иванов, не менее чувствительны: «анонимные» профили личной информации почти всегда могут быть связаны с реальными людьми.

Классификация идентификаторов по уникальности, постоянности и доступности.

Один из самых хитрых и виртуозных способов отслеживания: трекер создает фигуры и графику с текстом в разных шрифтах, а затем следит за тем, какие шрифты отобразились с какого устройства, ведь на устройствах с разными экранами, операционными системами и аппаратном обеспечением отобразятся разные шрифты. Потом трекер переводит отображенный на устройстве шрифт в код — хеширует его. И после анализа рекламодатель уже понимает, с какого устройства вы заходили.

КАК СОБИРАЮТСЯ ДАННЫЕ?

Чтобы отслеживать нас, компаниям, которые этим занимаются, нужно убедить разработчиков веб-сайтов и приложений включить определенный код отслеживания в свои продукты. А это не так просто, потому что включение такого кода в программу может нести для нее риски: это может замедлить работу ПО, бесить пользователей и подвергать сайт/приложение риску напороться на штраф, например, по GDPR. Тем не менее крупнейшие сети отслеживания охватывают огромную часть интернета и плейсторов, постоянно собирая данные из миллионов различных источников. В физическом мире трекеры можно найти на рекламных щитах, в розничных магазинах и на парковках торговых центров. Так как же выглядят эти сети отслеживания? Этот вопрос мы и обсудим в этой части.

Доминирующая рыночная сила в отслеживании — рекламная индустрия. Поэтому неудивительно, что онлайн-реклама является одним из основных инициаторов сбора данных. В простейшей модели одна рекламная сеть размещает рекламу на нескольких веб-сайтах. Владелец сайта, работающий с рекламной сетью, должен разместить на своем сайте небольшой фрагмент кода, который будет загружать рекламу с рекламного сервера. Так, каждый раз, когда пользователь посещает сайт, отправляется запрос этому рекламному серверу, а тот в ответ отправляет куки-файлы на компьютер пользователя, благодаря которыми рекламодатель теперь видит примерную статистику веб-сёрфинга пользователя, если тот посещает сайты той же рекламной сети. Так и начинается отслеживание. Аналогичным образом, рекламный сервер может предоставить разработчикам мобильных приложений комплект ПО для размещения рекламы. Всякий раз, когда пользователь открывает приложение, которое использует такое ПО, приложение отправляет запрос на рекламный сервер. Этот запрос содержит рекламный идентификатор пользователя, что позволяет рекламному серверу профилировать активность пользователя в разных приложениях.

На самом деле экосистема онлайн-рекламы еще сложнее. На рекламных биржах проводятся «аукционы в реальном времени» для отдельных показов объявлений на веб-страницах. При этом они могут загружать код от нескольких других сторонних поставщиков рекламы и могут делиться данными о каждом показе со многими потенциальными рекламодателями, участвующими в аукционе. Каждое объявление, которое вы видите, может быть использовано для обмена данными с десятками трекеров. Ниже — несколько инструментов, с помощью которых технологические компании наблюдают за пользователями.

Рекламная аналитика и пиксели конверсии

Код отслеживания не всегда встроен во что-либо видимое для пользователей, например в рекламный баннер. Значительная часть отслеживания происходит через невидимые «пиксели». Эти пиксели используются многими сборщиками данных в интернете — Google Аналитикой, Facebook, Amazon и т.д.

Когда владельцы веб-сайтов устанавливают сторонние пиксели отслеживания, они обычно делают это в обмен на доступ к некоторым данным, которые собирает тот, кто предоставляет пиксель. Например, Google Аналитика предлагает владельцам веб-сайтов информацию о том, какие люди посещают их сайты.

Встроенные медиаплееры

Наблюдение за пользователями часто реализуется с помощью встроенной рекламы в видео и в текстовых блогах на разных платформах, предоставляющих такую возможность — YouTube, Vimeo, Streamable и Twitter и т.д. Отслеживание может вестись и с помощью аудио-виджетов для сервисов Soundcloud, Spotify и потокового подкаста. Эти медиаплееры почти всегда работают в IFrame (встроенном коде) и поэтому имеют доступ к локальному хранилищу и могут произвольно запускать JavaScript.

Виджеты социальных сетей

Соцсети предоставляют веб-сайтам различные услуги, такие как кнопки «Нравится в Facebook» или «Поделиться в Twitter». Они часто представляются владельцам сайтов как легкий способ увеличить трафик и присутствие в социальных сетях. Кнопки «Нравится» и «Поделиться» могут использоваться для отслеживания точно так же, как пиксели: «кнопка» на самом деле является встроенным изображением, которое инициирует запрос к серверу соцсети.

Более сложные виджеты, например, разделы комментариев (когда на сайте можно комментировать новость из своего профиля Google/Facebook/Вконтакте) работают больше как встроенные медиаплееры. Они обычно входят в IFrame и имеют больший доступ к браузерам пользователей, чем простые пиксели или кнопки. Как и медиаплееры, эти виджеты могут получать доступ к локальному хранилищу и запускать JavaScript, чтобы вычислить идентификатор браузера.

Наконец, крупнейшие компании (в частности, Facebook и Google) предлагают услуги по управлению учетными записями для разных сайтов, например «Войти через Google», «Авторизоваться через Facebook». Эти службы «единого входа» привлекательны для владельцев сайтов по нескольким причинам: (1) веб-сайты и приложения могут переложить работу по управлению учетными записями на крупные компании, (2) пользователи могут запоминать меньше пар логин-пароль и реже проходить процедуру регистрации/входа. Но пользователи тут же платят свою цену: они позволяют Google, Facebook и др. выступать в роли третьей стороны и отслеживать свои действия на всех сайтах, где они залогинились. Сервисы входа в систему — это более надежные трекеры, чем пиксели или другие простые виджеты, поскольку они заставляют пользователей подтверждать свою личность

Капча

Капча — это технология, которая традиционно отделяет людей от роботов. Владельцы сайтов устанавливают капчу на страницах, где им особенно важно заблокировать автоматический трафик — на страницах регистрации и страницах с особенно большими файлами.

ReCAPTCHA от Google — самая популярная технология капчи в интернете в настоящий момент. Каждый раз, когда вы подключаетесь к сайту, который использует recaptcha, ваш браузер подключается к домену *.google.com, чтобы загрузить ресурсы капчи и делиться всеми связанными куки-файлами с Google. Это означает, что сеть капча — ещё один источник данных, которые Google может использовать для профилирования пользователей.

В то время как старая капча просила вас прочитать искаженный текст или щелкнуть на картинки со светофорами, новая ReCAPTCHA v3 записывает «взаимодействия с веб-сайтом» и бесшумно выявляет, является ли пользователь человеком. ReCaptcha генерирует что-то похожее на поведенческий идентификатор, в котором собрано то, как пользователь взаимодействует со страницей. Далее Google скармливает эти данные своему искусственному интеллекту для оценки вероятности того, что пользователь человек, а затем возвращает этот результат на первоначальный веб-сайт. Помимо удобства для пользователей, эта новая система выгодна Google двумя вещами. Во-первых, из-за невидимой рекапчи пользователи не задают вопросов по поводу того, куда Google отправляет их данные. Во-вторых, при анализе «робот или человек» Google использует свой огромный массив поведенческих данных, собранных из разных служб, и поэтому находится вне конкуренции на рынке капчи.

КТО СОБИРАЕТ ДАННЫЕ КРОМЕ ТЕХНОГИГАНТОВ?

Дата-брокеры

Это компании, которые собирают, агрегируют, обрабатывают и продают данные. Они работают вне поля зрения обычных пользователей, но в центре экономики обмена данными. Часто брокеры вообще не имеют прямых отношений с пользователями, и люди, о которых они продают данные, могут не знать, что они существуют. Дата-брокеры покупают информацию у небольших компаний, в том числе у розничных продавцов, финансово-технологических компаний, медицинских исследовательских компаний, интернет-рекламодателей, телекомов, производителей устройств Интернета вещей и у местных органов власти. Затем они продают данные (или услуги на основе данных) рекламодателям, агентам по недвижимости, исследовательским компаниям, университетам, правительствам или другим дата-брокерам.

Политические силы

Бизнес — не единственный, кто старается извлечь выгоду из сбора данных и целевой рекламы. Как показал прошлогодний случай с компанией Cambridge Analytica, сбором данных интересуются и политтехнологи. Cambrige Analytica исследовала незаконно полученные личные данные миллионов потенциальных избирателей для оценки их «психографии», а затем использовала эти данные для политических кампаний. В 2018 году группа американских консерваторов CatholicVote использовала данные о местоположении мобильного телефона, чтобы определить, кто находился внутри католической церкви, а затем отправляла им рекламу с просьбой проголосовать за Трампа.

Также данные закупают коллекторы, правоохранительные органы, администрации городов, правительства, разведки и частные лица, в том числе мошенники и криминал.

ЗАКЛЮЧЕНИЕ

Несмотря на то, что отслеживание трекерами — это неприятно и вряд ли кто-то захочет быть объектом наблюдения, зная, что его данными торгуют направо и налево, и также вряд ли кто-то захочет испытывать постоянное чувство тревоги из-за нарушения своей конфиденциальности, избежать наблюдения сейчас почти невозможно. Однако, каждый может решить, сколько усилий он готов приложить в этой борьбе за неприкосновенность своей частной жизни — и любые усилия здесь важны.

Фонд электронных рубежей предлагает в меру возможностей обезопасить веб-серфинг с помощью полезных расширений вроде Privacy Badger и по крайней мере отозвать некоторые разрешения у подозрительных приложений на смартфоне. Также EFF напоминает, что можно добиться успехов в юридическом поле, например, подавая в суд на компании, допускающие утечки данных и отмечает, что конфиденциальность — это право, а не привилегия образованных людей, у которых есть время читать десятки страниц пользовательских соглашений и тратить время и деньги на выбор расширений против отслеживания. Так как конфиденциальность — это право, она должна быть у всех по умолчанию, без соблюдения сложных ритуалов.

Источник


Report Page