Как интернет-ресурсы шпионят за нами?
CHIP расскажет, как интернет-ресурсы шпионят за пользователями ради рекламных предложений и объяснит, как защититься от слежки.
CHIP расскажет, как интернет-ресурсы шпионят за пользователями ради рекламных предложений и объяснит, как защититься от слежки.
Покупки в городских магазинах часто сопряжены с отрицательными эмоциями: толпы людей, плачущие дети и отсутствие брюк нужного размера. Однако у «аналогового» шопинга есть одно неоспоримое преимущество: за вами не следят особы с сомнительной репутацией, которые протоколируют каждый шаг и каждый примеренный предмет одежды. Жуткая картина, однако именно это в настоящее время происходит в Интернете. Шпионами являются фирмы, которые размещают на сайтах рекламу и анализируют поведение пользователей. Значительно преуспела в этом прежде всего компания Google. Используемые ей инструменты — файлы cookies, идентификация браузеров и мобильных телефонов. Как результат, на различных сайтах целенаправленно отображается реклама, например, той продукции, которую вы просмотрели на одной из предыдущих страниц или запрашивали в поисковике. Возникает желание крикнуть в монитор, что брюки уже давно куплены и вам надоело такое преследование. Но это не поможет: реклама будет появляться снова и снова.
К числу тех, кому технологии слежения приносят наибольшую выгоду, относятся прежде всего интернет-ма-газины. Благодаря данным инструментам они получают информацию о том, каким образом пользователь попал на сайт (через специализированный блог, рекламный баннер, размещенный на другом ресурсе, или поиск Google), а также о том, что он делает на портале: просматривает ли отдельные продукты или сравнивает их. А может быть, он ищет товары определенной фирмы? Рекламные компании анализируют эти данные, после чего буквально заваливают пользователя рекламой продукции и специальными предложениями этого магазина на других веб-страницах. Каждый рекламный баннер — это своего рода инструмент пробуждения покупательского интереса. По мнению веб-аналитиков, только 2% всех посетителей интернет-магазина обязательно что-то покупают. Одним из способов повышения покупательской активности до уровня, когда она будет выражаться уже двузначными цифрами, является ретаргетинг — многократное отображение ранее уже просмотренной пользователем рекламы.
Пользователь как мишень
Для непосвященных интернет-реклама кажется чем-то мистическим. Помимо ретаргетинга используется также контекстно ориентированная реклама, которая основана на содержимом недавно посещенного веб-сайта. Подобным образом работает и таргетинг ключевых слов (Keyword Targeting) — реклама на основе отдельных слов, которые отображаются, например, на страницах результатов поиска Google или в Gmail. Кроме того, предусмотрен такой механизм, как поведенческий таргетинг (Behavioural Targeting), позволяющий выявлять интерес пользователя к тому или иному товару на основе его поведения. Для оценки моделей поведения существуют даже отдельные эксперты, называемые Customer Journey Managers. Их можно охарактеризовать как невидимых интернет-гидов, которые сопровождают пользователей в Сети, ведя их, словно неискушенных туристов по восточному базару.
Интернет-реклама — основной источник дохода многих веб-сайтов — в настоящее время оплачивается исходя из количества кликов или показов. Технологии оплаты только по конверсии (то есть по результатам продаж) давно интересуют и рекламодателей, и владельцев площадок электронной торговли, но пока они еще не реализованы. На подобную рекламу (клики и показы) приходится около двух третей мирового оборота. Таким образом, чем больше кликов (переходов) будет сделано, тем больше денег получит веб-сайт. В первом полугодии 2012 года компания Google заработала с помощью подобной рекламы в общей сложности $20,8 млрд.
Как создается профиль пользователя
Для анализа поведения пользователя веб-сайты используют файлы cookies. Когда вы открываете какую-либо страницу, сервер сохраняет их на ПК и считывает содержимое уже существующих cookies, оставленных данным ресурсом. Используемые рекламными компаниями механизмы слежения, которые при загрузке страницы в фоновом режиме устанавливают соединение с целью получения данных, проделывают то же самое.
Существует много видов cookies, и простейшими их представителями являются HTTP cookies. Эти маленькие текстовые файлы содержат, как правило, небольшое количество информации — например, дату и время обращения к странице. Другие сохраняют данные доступа к различным веб-сервисам или содержимое «Корзины» интернет-магазина, чтобы обеспечить возможность идентификации пользователя на различных подстраницах сайта. Но также с их помощью можно создавать анонимные профили, которые позволяют оценивать перемещения пользователей по Сети. В профилях содержится информация о том, кто что ищет, какие страницы открывает или какую продукцию покупает. При этом некоторые файлы cookies «живут» очень долго: на отдельных веб-сайтах они хранятся до 20 лет. Однако существует и еще более неприятный вид таких файлов.
Flash cookies используются на многих сайтах для сохранения уровня громкости интернет-видеоплееров или достигнутого в какой-либо браузерной игре прогресса. Кроме того, независимо от веб-обозревателя они осуществляют сбор информации о конфигурации ПК, благодаря чему механизмы слежения могут идентифицировать отдельные устройства. Некоторые из них копируют себя в несколько каталогов системы, и, чтобы от них избавиться, необходимо удалить сразу все копии файлов. Наиболее устойчивые cookies (так называемые evercookies) вновь восстановятся при открытии сайта их происхождения.
Наибольшую опасность в настоящее время представляют файлы Super cookies, называемые также DOM Storage cookies. Это уже не файлы, а сохраняемые непосредственно в браузере данные. Разработанный в рамках HTML 5 метод предоставляет в распоряжение интерактивных веб-приложений невероятные объемы дискового пространства и является альтернативой HTTP cookies, противодействовать которой практически невозможно. Cбор данных принял огромные масштабы. Именно такие механизмы слежки используют крупнейшие онлайн-магазины.
До 80% рекламы обеспечивают Super cookies. Самое неприятное в этой ситуации то, что собранные данные не остаются в руках какой-то одной рекламной компании, а мигрируют от одного поставщика рекламных услуг к другому. Это подтверждают результаты нашего анализа, проведенного с помощью браузерного плагина Collussion. С одной стороны, по закону личные данные не могут передаваться третьим лицам без согласия пользователя, но с другой — это не распространяется на анонимную информацию (например, о кликах). Таким образом, в Интернете процветает торговля данными.
Блокировать сбор сведений можно самостоятельно несколькими доступными способами. Разумеется, рекламным компаниям известны все эти трюки, и они все больше применяют новые методы слежения. Одним из них является Fingerprinting (англ. «снятие отпечатков пальцев»). Подобные механизмы слежения способны на основе различных данных, загружаемых при открытии веб-ресурса, создать уникальный «отпечаток» вашей системы. К таким данным относится IP-адрес, версия ОС, установленные плагины Flash, Java и т. п., а также разрешение экрана, глубина цвета и типы шрифтов. Большое количество учитываемых параметров предполагает множество комбинаций, поэтому вероятность существования двух абсолютно одинаковых веб-обозревателей практически исключена.
В подробностях: виды cookies
Файлы cookies — это наиболее распространенный инструмент для анализа поведения пользователей в Сети. Веб-сайты и сервисы слежения сохраняют их на ПК пользователей, чтобы идентифицировать последних при дальнейших открытиях страницы.
HTTP Cookies | |
---|---|
Назначение | идентификация ПК при открытии страницы; управление данными для входа в систему (сессионные cookies); хранение данных для подстраниц сайта — например, информации об имеющихся в «Корзине» товарах |
Хранение | формат — текстовый файл (TXT) или база данных SQLite; расположение — в браузере (как правило, подкаталог в C:UserUsernameAppData); максимальный размер — 4 кбайт |
Flash Cookies | |
---|---|
Назначение | контроль Flash-видео и интерактивной рекламы; отслеживание поведения пользователя в Сети независимо от используемого браузера; могут копировать и восстанавливать HTTP cookies |
Хранение | формат — SOL; расположение — локальная папка Flash-плеера; максимальный размер — 100 кбайт |
Super Cookies | |
---|---|
Назначение | идентификация пользователей и хранение данных веб-приложений |
Хранение | формат — база данных SQLite; расположение — непосредственно в браузере (сохраняется с помощью функции «DOM Storage» в HTML 5); максимальный размер — 10 Мбайт |
На примерах: сбор информации на сайте Интернет-магазина Boutique
На сайте интернет-магазина Boutique мы обнаружили действие восьми механизмов сбора данных, что типично для подобных веб-ресурсов. Сбор информации осуществляют, как правило, рекламные компании, в том числе множество зарубежных. Ниже приведен их список.
- SOCIOMANTIC — немецкая рекламная компания
- TRADEDOUBLER — шведская рекламная компания
- FACEBOOK — слежение посредством кнопки «Нравится»
- CRITEO — французская рекламная компания
- DOUBLECLICK — рекламная служба Google
- ADRIVER — российская рекламная компания
- GOOGLEADSERVICES — сервис контекстной рекламы от Google
- YADRO — российская баннерная сеть
Однако браузер — это лишь начало. Следующей целью рекламных компаний являются портативные устройства. Активная абонентская база пользователей мобильного Интернета в России уже сегодня составляет 22,5 млн человек — таковы показатели на конец 2012 года, согласно исследованию, проведенному компанией J’son & Partners Consulting по заказу Google. Благодаря возможности определения местоположения посредством Wi-Fi и спутниковых систем смартфоны открывают совершенно иные возможности слежения за пользователем и анализа полученных данных. На мобильных устройствах может храниться весьма ограниченное количество файлов cookies. Поэтому в сфере мобильной персонализированной рекламы используются приложения, так как они способны работать с огромными объемами данных.
Компания BitDefender, специализирующаяся на сетевой безопасности, проанализировала некоторые программы для ОС Андроид, в том числе и популярную игру Paradise Island. Оказалось, что она отправляет номера телефонов и адреса электронной почты на AirPush.com, а идентификационный номер устройства на Aarki.net — это сайты поставщиков рекламных услуг для мобильных гаджетов. Другие приложения, по сведениям BitDefender, считывают список контактов, а также информацию о посещенных веб-сайтах и поисковых запросах. Некоторые агрессивные рекламные программы способны изменять используемую по умолчанию поисковую систему, благодаря чему они начинают отслеживать каждый поисковый запрос владельца смартфона.
Однако наиболее ценной является информация о том, где он находится. «Нет ничего проще, чем создание пользовательских профилей на основе данных о местоположении, так как это позволяет получить сведения о любимых занятиях человека», — говорит исследователь по вопросам безопасности Ливиу Арсене из BitDefender. Например, если механизм слежения несколько раз в месяц обнаруживает, что смартфон находится на футбольном стадионе, то, вероятно, его владелец увлекается данным видом спорта. Следовательно, он, вероятнее всего, больше интересуется спортивной одеждой или билетами на футбольные матчи, нежели женской обувью, в связи с чем на его смартфоне будет отображаться соответствующая реклама.
Google, снова Google
К анализу пользовательских данных на мобильных устройствах проявляет интерес все больше компаний. Среди них — стартап Adelphic, создатели которого утверждают, что способны охарактеризовать поведение владельцев мобильных телефонов на основе 30 «сигналов». Что это за сигналы, основатели компании предпочитают не уточнять, говоря лишь, что с помощью специального алгоритма могут определять, какой была реакция пользователя на предыдущие рекламные предложения. Чтобы владеть данной информацией, Google купила стартап, выложив за него $10 млн. Для нее решения от компании Adelphic стали, вероятно, следующим шагом в развитии технологии обработки данных, которые собираются с помощью мобильных сервисов вроде «Локатора» или «Ассистента».
По причине растущей фрагментации устройств (ПК, ноутбук, планшет, смартфон) рекламные компании испытывают значительные трудности при размещении целенаправленной — а значит, доходной — рекламы. Бывшая сотрудница Google Камакши Сиварамакришнан намерена решить проблему с помощью своего стартапа Drawbridge. Сервис использует результаты статистического анализа анонимных данных, чтобы отслеживать пользователя по нескольким устройствам. Для этого он выполняет анализ файлов cookies различных браузеров (ПК, мобильные устройства) и с помощью специального алгоритма проверяет, могут ли два файла cookies относиться к одному и тому же пользователю.
Если вероятность последнего велика, файлы cookies объединяются в общую группу данных. На основании чего алгоритм приходит к такому выводу, является тайной. Однако, по всей видимости, он работает хорошо, так как сегодня некоторые крупные разработчики игр для мобильных устройств и интернет-турагентства используют бета-версию данного сервиса.
Пугает то, что масштабы слежения за пользователем могут расширяться и далее, так как планируется размещать персонализированную рекламу и на экранах телевизоров. Для этого, конечно, нужно владеть какой-то информацией о человеке, сидящем перед экраном. Как Google (для Google TV), так и американский провайдер кабельного телевидения Verizon подали заявки на регистрацию патентов, в которых описаны методы анализа зрителей посредством встроенных в телевизоры и ресиверы камер и микрофонов. В патенте Verizon приводится два примера: супружеская пара сидит перед телевизором, между ними завязывается спор, после чего на экране появляется реклама, содержащая рекомендации по улаживанию семейных конфликтов. Вторая сцена: мужчина и женщина обнимаются, сидя на диване, в этот момент на экране запускается реклама противозачаточных средств.
Довольно мрачная перспектива, однако рекламная индустрия стремится достичь именно этой цели, которая подразумевает возможность сбора и обобщения любой информации о пользовательской активности как онлайн, так и в автономном режиме, подобно определению местоположения смартфона.
Доли компаний на рынке рекламы |
Рекламные компании, приобретенные Google |
|
---|---|---|
|
|
Крупнейшие сервисы веб-аналитики
Два самых крупных ресурса, без которых сегодня немыслима работа как крупных компаний, занимающихся продвижением товаров в Сети, так и владельцев мелких сайтов — это Google Analytics и «Яндекс.Метрика». Обе системы позволяют владельцам сайтов знать о своих посетителях практически все, начиная с таких мелочей, как браузер, ОС, разрешение экрана и другие характеристики ПК, и заканчивая временем, в течение которого человек раздумывает перед нажатием на кнопку «купить». Google Analytics сегодня делает акцент на социальных сетях и предлагает отслеживать распространение материалов сайта по страницам таких ресурсов. При этом система рассчитывает выгоду, которую владелец сайта получает от этого распространения. А «Яндекс.Метрика» вообще записывает все, что делал пользователь на сайте, и владелец всегда может просмотреть эти действия в специальном плеере «Вебвизор». Здесь отображаются даже перемещения курсора, а также текст, набираемый посетителем на клавиатуре или выделяемый мышью.
Конфликт интересов
Можно ли найти такое решение проблемы, при котором владельцы сайтов зарабатывали бы деньги, не ущемляя в правах пользователей? В своей нынешней форме интернет-реклама от этого весьма далека. Ведь она сопровождается завуалированным сбором данных, не предусматривающим оповещения пользователей и поиск практичного разрешения всех противоречий. Поэтому миллионы людей, как и прежде, полагаются на блокировщики рекламы. По крайней мере, Mozilla не осталась в стороне и позаботилась о функции, пресекающей возможность сохранения пользовательских данных в своем браузере Firefox. Неприкосновенность личной сферы должна быть чем-то само собой разумеющимся. Если пользователей будут информировать о том, что собранные данные имеют большое значение, так как они позволяют, например, выполнять эффективный поиск подходящих товаров, то все останутся только в выигрыше. Вместо этого сетевые концерны придерживаются мнения, что прозрачность угрожает их бизнесу. Они полагают, что пользователи будут избегать их интернет-порталов, если им станет известно о применяющихся алгоритмах сбора данных. Все, что остается обычным людям в данной ситуации, — либо смириться со слежкой, либо блокировать подобные действия доступными средствами.
Советы по противодействию сбору данных
С помощью нескольких несложных операций вы сможете положить конец слежке в Сети, удалить файлы Super cookies и повысить безопасность своего мобильного телефона.
Полностью избежать слежения и сбора информации нереально. Но наши советы помогут ограничить возможности сборщиков данных настолько, что они не сумеют составить на вас ценное «досье». При этом не нужно будет мириться со снижением удобства веб-серфинга.
УДАЛЕНИЕ ФАЙЛОВ COOKIES (IE, FIREFOX, CHROME). HTTP cookies можно удалить непосредственно через браузер. В Internet Explorer щелкните в настройках по «Безопасность| Удалить журнал обозревателя» и установите флажок рядом с пунктом «Куки-файлы». В Firefox для этого необходимо выбрать «Настройки | Приватность | Удалить отдельные куки | Удалить все куки». В Chrome откройте «Настройки | Показать дополнительные настройки» и в разделе «Личные данные» выберите «Очистить историю». В данном разделе также имеется пункт «Настройки контента», в котором браузер можно настроить таким образом, чтобы cookies удалялись при закрытии приложения. От Flash cookies избавиться не так просто: для этого потребуется плагин — например, BetterPrivacy (Firefox) или Click&Clean (Chrome). Они находят и удаляют файлы super cookies каждый раз, когда вы закрываете браузер.
ОТКЛЮЧЕНИЕ DOM-STORAGE (FIREFOX). Блокировать сохранение данных веб-приложений (DOM-Storage) вы можете только в браузере Firefox. Для этого в адресной строке введите «about:config», найдите параметр «dom.storage.enabled» и щелкните по нему два раза. Значение справа изменится на «False», и после этого веб-сайты больше не смогут сохранять данные.
«Коммерческая» схема глобальной Сети