Преданные браузером: как разработчики плагинов торгуют данными пользователей

10.01.2017

Cкандал вокруг мошенничества Web of Trust, расширения под Chrome и Firefox, показал: в Сети нельзя укрыться от спекулянтов данными

Предположительно 140 миллионов интернет-пользователей доверяют расширению Web of Trust (WOT), полагая, что оно защитит их в Сети от информационных спрутов, хакерских атак и аферистов. Однако затем разработчик myWOT попался на том, что предлагал на цифровом рынке самые актуальные данные: списки всех веб-адресов, на которые миллионы пользователей WOT заходили в течение месяца.

В одном только пробном наборе, который удалось приобрести журналистам телекомпании NDR, находилась подробная история поиска трех миллионов немецких пользователей данного сервиса. «Все это лишь простой недосмотр», — утверждает разработчик в анонимном заявлении и обещает исправить ситуацию.

Вольфи Кристл не столь оптимистичен. Для него данный случай — катастрофа невероятнейших масштабов: «Это же абсурдно, что расширение, обещающее безопасность, на деле подвергает пользователей опасности, халатно передавая информацию сторонним лицам». Специалист по информационным рынкам из Вены знает, как компании собирают, анализируют и продают данные и что происходит со сведениями, полученными в том числе и от расширения WOT.

Вместе с еще одним специалистом, Сарой Шпикерман, он написал об этом книгу, которая представляет собой очень подробное исследование того, как наживаются на данных пользователей за кулисами, зачастую в серой области этики и права, но всегда с ущемлением прав обычных пользователей.

Нажива на информации

Wolfie Christl, Sarah Spiekermann: Networks of Control, выпущена в 2016 году. Бесплатно доступна для скачивания (на английском языке) по адресу: http://crackedlabs.org/en/networksofcontrol, печатную версию можно приобрести на сайте: http://facultas.at/2016/networksofcontrol

Браузерная информация, которой, по-видимому, торгует myWOT, имеет особую ценность в мире цифрового капитализма, — утверждает Кристл: «С ее помощью можно создать профили личности для целевой рекламы, а также использовать для совершенно различных целей». На основе посещаемых конкретным человеком веб-сайтов и сервисов вычисляются его привычки и потребности.

Разумеется, это проблема, которая, к сожалению, уже давно стала обыденностью. Во всяком случае в России компании, желающие использовать приобретенные таким образом данные, осуществляют свою деятельность в относительно узких рамках закона.

Только этого недостаточно. Определяющим фактором является то, что полученная информация настолько завуалирована, что ее нельзя соотнести с конкретным лицом. Но и здесь, по словам Кристл, myWOT откровенно халтурит, по злому умыслу или из-за бессилия, поскольку выслеживает и продает не только сведения о посещенном веб-адресе вместе с подстраницей, но и URL целиком вместе с параметрами». Первое, якобы, стало уже нормой и повсеместно эксплуатируется индустрией цифровой рекламы. «Информация второго вида, однако, абсолютно очевидно представляет собой высочайший уровень угрозы».

Зачастую полные URL помимо веб-адреса содержат также сведения, позволяющие привязать их к конкретному пользователю: адрес электронной почты, ссылки на частые облачные хранилища и наименования профилей в социальных сетях и форумах.

Каждый может убедиться в этом, просто заглянув в историю своего браузера. Таким образом, myWOT занимается продажей наиболее уязвимой информации, которая деанонимизируется с небольшими усилиями, что нарушает Положения о защите персональных данных WOT.

Всеобъемлющий профиль

Эксперта по информационным рынкам Кристла этот скандал не застал врасплох: браузерные дополнения уже считались опасными. Но он также считает myWOT лишь относительно мелким узелком в сети торговцев данными: «Существует слишком много фирм, отслеживающих наше поведение в Интернете». При этом речь идет о миллиардах пользователей и миллионах веб-сайтов и онлайн-сервисов.

Вокруг таких сведений уже давно возник информационный капитализм: чем больше их собирается и анализируется, тем ценнее они становятся. Чем подробнее обновляемое в реальном времени досье, содержащее сведения о предпочтениях, особенностях личности и модели поведения, тем легче обращаться к конкретным пользователям и манипулировать ими. При этом речь уже давно идет не только о рекламе, но и о кредитоспособности и готовности выполнять свои платежные обязательства определенных лиц.

«Все эти фирмы», уверен Кристл, «пытаются ассоциировать наше поведение в Сети, наши покупки, информацию о нашем поведении с устройствами, платформами и сферами жизни». Вместо имени на созданном таким образом досье продавцы данными пишут псевдоним, уникальный буквенный код, который с помощью хеш-функции выводит на известные почтовые адреса или телефонные номера, то есть относительно стабильные характеристики человека.

Этот однозначный код каждый раз связывается с пользователем, как только он распознается трекером при работе с Интернетом из дома, на рабочем месте, при просмотре интернет-телевидения или использовании карты постоянного клиента.

Ужасающие масштабы

«Создаются всеобъемлющие профили о нашей повседневной деятельности и жизни, которые уже давно вышли за пределы того, что в свое время знала любая самая мощная инстанция в истории человечества об отдельных людях. Все это представляет собой колоссальную проблему!» То есть анонимность в подобной системе — всего лишь фарс. Чтобы продать что-то кому-то, не нужно знать его имени.

Для понимания взрывоопасности утекших из WOT данных нужно разбираться не только в информационном содержании якобы безвредных сведений о браузинге. Не менее ужасающим являются масштабы торговли информацией — мирового рынка агрегации и обработки данных такого рода для создания прогнозируемых профилей. Лишь один пример из книги Кристла: этим летом Oracle приобрел компанию-трекер AddThis.

По их собственным утверждениям, сервис следит за 15 миллионами веб-сайтов, а также 3 миллиардами пользователей. На каждого составлено досье. В отношении величин таких порядков традиционные методы анонимизации совершенно не работают: если папка существует на каждого серфера, имена перестают играть какую-либо роль. Идентификационный код — вот его новое имя. Но корень зла в другом: в желании информационных компаний еще сильнее контролировать пользователя.

Считать отдельные компании не причастными к торговле данными — поведение человека, оторванного от жизни. Как в таких обстоятельствах выглядит настоящая конфиденциальность, следует еще выяснить. Но к счастью, дело WOT обстояло гораздо проще. В данном случае очевидно не было недостатка как в умениях программистов, так и в добрых намерениях.

Если бы компания в свое время так же серьезно, как и сказано в ее заявлении, относилась к анонимизации, собранные данные быстро уничтожались, — полагает Вольфи Кристл. Для достижения своей цели расширение WOT также должно сохранять только домены, вместо предательских ветвей URL. Несмотря на то что и эта информация имеет вес на рынке, она все равно не столь опасна для пользователей.

Анонимность — иллюзия

Латания Свини, эксперт по защите данных, профессор Гарвардского университета

В 2009 году ИТ-специалист Латания Свини продемонстрировала, что 87 процентов всего населения США могут быть однозначно идентифицированы   всего лишь на основе их дат рождения, пола и индекса.

По этому принципу сегодня работают многие цифровые компании, чтобы создать для пользователя анонимный, но при этом однозначно ассоциируемый профиль. Впрочем, существуют методы для извлечения из такого профиля отдельных данных, представляющих минимальную угрозу частной жизни.

Так была разработана концепция «дифференциальной приватности» (differential privacy). В соответствии с ней анонимность, к примеру, достигается не удалением данных, а скорее добавлением цифрового шума и манипуляцией с информационными точками. Такие методы, однако, законом не регулируются. Следовательно, специалистам по конфиденциальности необходимо выработать новое правило: нужна не грамотная анонимизация, а наказание за деанонимизацию без согласия на то пользователя.

Изображения: Glebstock/Fotolia.com; CC BY 2.0 — arcticpenguin/Flickr, cropped