МЕТОДИКИ ОТСЛЕЖИВАНИЯ И ИДЕНТИФИКАЦИИ ПОЛЬЗОВАТЕЛЕЙ В СЕТИ-ИНТЕРНЕТ
Секция: Технические науки
LIV Студенческая международная научно-практическая конференция «Технические и математические науки. Студенческий научный форум»
МЕТОДИКИ ОТСЛЕЖИВАНИЯ И ИДЕНТИФИКАЦИИ ПОЛЬЗОВАТЕЛЕЙ В СЕТИ-ИНТЕРНЕТ
В нашем технологическом мире «валютой» нового времени стала информация. Как говорил Натан Ротшильд «Кто владеет информацией, тот владеет всем миром». Различные компании, государственные организации собирают о пользователях информацию с целью создания портрета личности, таргетированного показа рекламы и национальной безопасности. Одна из самых сложных задач в сфере сбора информации о пользователя: является его идентификация как на постоянно используемом устройстве, так и на временно им используемых. Одной из актуальных задач нашего времени становится создание комплексных мер и действий по сохранению приватности и защититься от проникающего контроля систем отслеживание информации о пользователях. Без знания методик отслеживания и идентификации невозможно создать методы защиты.
Методики идентификации пользователя на постоянно используемом устройстве
IP адрес – это уникальный числовой адрес вашего компьютера в компьютерной сети работающей по протоколу IP [1]. Этот метод служит для сужения круга поиска пользователя (в основном определяют провайдера, страну). В РФ почти все провайдеры выдают при каждом новом подключение к сети-интернет динамический IP адрес из некого диапазона случайных IP адресов. И часто бывает, что в сети под одним внешним IP адресом сидят несколько пользователей.
Cookies – это сохраненные вашим браузером, фрагменты полученных данных от сайта или различного рода настроек, в результате посещения какого-либо веб-сайта [1]. Эти данные как правило являются методом идентификации пользователя на данном сайте. У такого типа данных есть срок жизни, который устанавливается самими cookies или браузером. Отслеживание и идентификация пользователя происходит при запросе сайтов или веб-систем: кол-во cookies и данных хранимых ими. Метод является одним из самых часто используемых и достаточно точных.
LSO (Local Shared Objects) – это те же самые cookies только на основе flash-технологий. Основные преимущества LSO от обычных cookies – это то что они устанавливаются скрытно, о них мало знают обычные пользователи, удалить стандартными средствами браузера их нельзя, так как они сохраняются непосредственно на жесткий диск [1]. Многие сайты, например, Skype будет сохранять LSO, если вы запретите сохранять браузеру обычные cookies. Этот метод также является достаточно точным и применение его с перечисленными выше методами позволяет идентифицировать пользователя почти на любом сайте. Срок жизни таких данных ограничен лишь памятью, выделенной под хранение этих данных и частотой их использования.
IS (Isolated Storage) – это специальное хранилище данных, которые хранятся на жестком диске компьютера и не привязываются к какому-либо окну браузеру или пользователю операционной системы. Является аналогом LSO, пока не может быть использован как полноценный метод идентификации и отслеживание пользователя, из-за не широких методов сбора данных. Время жизни IS не ограниченно.
Кэшированные объекты (Кэш) – это ресурсы посещенных сайтов, необходимые для быстрой загрузки сайта в будущем. Несмотря на простую идею, Кэш имеет очень много мета-данных о месте откуда были добавлены, дату и время, версия сайта. В Кэш данных сайта даже можно встроить специальный идентификатор, который позволит с легкостью идентифицировать пользователя.
Один раз запрошенный пакет кэша браузера позволит отслеживать пользователя по всей сети-интернет. Время жизни Кэша задается временем хранения устанавливаемым браузером.
Дополнительные расширения браузера – это дополнительные модули, которые можно подключить к браузеру, чтобы добавить те или иные функции. Помимо встраиваемого в само расширения для браузера, отслеживающей и идентификационной возможности, также можно будет произвести выявление пользователя по набору этих расширений, с использованием других методов, описанных выше. Время жизни расширений для браузера ограничено самим пользователем.
HTTP referrer (Hr) – особый протокол обмен данных, который позволяет на запрос клиента серверу определить с какого сайта пользователь попал на данный сайт [1]. Такой метод основан на создание списка часто посещаемых сайтов с добавлением частоты перехода к другим постоянно посещаемым сайтам. Используется часто как вспомогательный метод идентификации и отслеживание активности пользователя.
Transmission Control Protocol (TCP) – особый протокол запроса данных, который активируется почти при каждом запросе в поисковых системах. Создан для получения данных об операционной системе, состояния сетевого устройства (открытость портов), времени часового пояса и др. параметров устройства. Метод является добавочным к перечисленным выше.
Цифровой отпечаток браузера (Fingerprint) – достаточно новая технология отслеживания и идентификации пользователя, сочетающие в себе целый комплекс методов: TCP, дополнительные расширения к браузеру, Hr, cookie (не обязательно), LSO/IS. Метод является одним из самых эффективных и быстрых в отслеживание и идентификации пользователя. Точность идентификации исходя из исследований 99.24%. [2]
Методики идентификации пользователя на временно используемом устройстве
До этого момента методики отслеживания и идентификации пользователя строились на основе протоколов обмена информации, настройках браузера, хранений данных сайтов. То методы идентификации пользователя на временно используемом устройстве строятся на уровне операционной системы и часто используемых действий пользователя. Методики отслеживания на временно используемом устройстве делятся на два огромных блока: клавиатурный почерк и повадки пользователя.
Клавиатурный почерк – действия, выполняемые пользователем (движение мыши, нажатия клавиш, использования горячих клавиш). Динамика и мелкая моторика человека являются уникальными физиологическими, анатомическими и психическими особенностями [4]. Для их регистрации и составления описания необходимом с максимально возможной точностью измерять временные промежутки нажатием и отпусканием кнопок на клавиатуре, мыши. Частота нажатий на определенные клавиши и связь между использованием с другими (горячие клавиши), делают возможную идентификацию пользователя на основе ранее собранных данных, когда пользователь использовал постоянно используемое устройство. Также передвижение мыши может служить вспомогательным методом к клавишному отслеживанию. Метод уже достаточно развит и позволяет определять пользователя достаточно точно. Основными пользователями такого метода являются IT-гиганты такие как: Microsoft, Apple.
Повадки пользователя – определенные привычные действия, которые пользователь выполняет почти рефлекторно. Такими данными для идентификации может служить: время пользователя (начало и конец пребывания в сети), часовой пояс, примерные темы и взгляды, использование слов и выражений, переход от одних сайтов к другим с высокой скоростью, использование определённого соотношения ширины и длины экрана, предпочитаемый основной и вспомогательный язык и др. характеристики, которые помогут отличить одного человека от другого. Как и с клавиатурным почерком идентификационные данные собираются, когда пользователь использовал постоянное устройство. Такой метод обычно используют различные специальные службы безопасности, для первичного сужения поиска среди пользователей.
Абсолютная анонимность и безопасность сейчас
Методики, перечисленные выше представляют угрозу анонимности и свободы пользователей по всему миру. Применение методов защиты против идентификации пользователя и отслеживание действия бесполезны, так как системы совершенствуются со стремительной скоростью. Вы можете снизить количество собираемых и отслеживаемых данных о вас, тем самым уменьшить риски, но не получить абсолютную безопасность. И следует знать, что данные о пользователе, которые собираются сейчас и собирались, не денутся никогда и некуда.