Колисниченко Денис Николаевич
Шрифт:
частота использования уникальных слов;
использование одних и тех же уникальных слов в открытых и анонимных публикациях;
активный словарный запас (количество уникальных словарных слов в тексте);
активный несловарный запас (количество уникальных выдуманных слов в тексте);
статистика использования частей речи – процент существительных, глаголов, прилагательных и т. п.;
биграммы частей речи, то есть частота употребления пар "существительное-глагол", "наречие-прилагательное" и т. п.;
позиции частей речи в предложении (по всем частям речи);
биграммы буквенных пар (подсчет по всем алфавитным парам "аа", "аб", "ав" и т. п.).
Для лингвистического анализа текста специалисты используют набор различных методов. С некоторыми из них вы можете познакомиться по адресу: http://filologia.su/metody. В Интернете также можно найти программы для лингвистического анализа текста – например, Лингвистический анализатор 2.0, который можно скачать бесплатно по адресу: http://softok.org/science/naukateh/7776prog.html. Программа не заменит вам опытного аналитика, но все же это лучше, чем ничего.
В общем, информации в Интернете по этой теме – очень много, но наша книга посвящена анонимности в Интернете, а не лингвистике. Главное, чтобы вы знали, что такой способ деанонимизации существует, а предупрежден – значит вооружен.
11.3. Наиболее частые ошибки
Исходя из всего ранее сказанного, выделим основные ошибки, совершаемые желающими быть анонимными пользователями:
использование анонимных и неанонимных сессий для одного и того же вида деятельности – например, при регистрации e-mail и блога вы не анонимизировали трафик, но начали это делать при ведении блога. Понятно, что легко запросить у администратора блога IP-адреса, которые были зафиксированы при регистрации блога, чтобы понять, кто вы;
элементарная забывчивость – забыли включить Tor, забыли перенастроить браузер (например, сначала отменили установку прокси-сервера Tor, чтобы скачать фильм, а затем забыли и продолжили работу, но уже не в анонимном режиме). Чтобы хоть как-то помочь себе, установите два браузера: один вы будете использовать в анонимном режиме, второй – для обычного серфинга;
публикация больших текстов сходного стиля написания под своим обычным именем. Или ничего не публикуйте под своим именем, или же измените стиль написания перед публикацией анонимного контента;
доступ к анонимному почтовому ящику без шифрования – всегда используйте шифрование трафика для доступа к своему анонимному почтовому ящику;
отказ от анонимизации трафика при работе с чужого компьютера – самая распространенная ошибка. Некоторые пользователи почему-то думают, что если они используют чужой компьютер (например, компьютер друга, родственника, соседа и т. п.), то уже анонимны. Это не так, и анонимизация трафика обязательна и в этом случае. Иначе вас очень легко будет выследить – придут к тому, у кого вы были, и спросят, он ли заходил на тот или иной ресурс. Он ответит, что не он и что вы были у него в гостях в то время.
В главе 12 вы узнаете, какие программы нужно использовать, чтобы остаться анонимным. Ведь иногда все старания идут насмарку, если программы для работы с Интернетом сами сообщают куда нужно всю информацию о вас…
Глава 12. Программы с "сюрпризом"
12.1. Программы с открытым кодом
Для обеспечения большей анонимности вы должны использовать программы с открытым исходным кодом (так называемые OpenSource-программы). Исходный код таких программ свободно доступен на сайтах разработчиков программ.
Возникает вопрос: почему именно OpenSource? У таких программ есть одно большое преимущество – их исходный код открыт, а это означает, что в коде программы нет "черных ходов" (backdoors), и эти программы не передают информацию о передаваемых с их помощью данных своим разработчикам или кому-то еще. Ведь если бы это было так, общественность очень быстро бы об этом узнала. В мире много энтузиастов, исследующих исходный код программ на наличие всевозможных ошибок. Если в исходном коде того же Firefox будет найдена "черная дверь", через пару минут об этом узнает весь мир.
Программное обеспечение, исходный код которого закрыт, называется проприетарным. Проприетарное программное обеспечение не обязательно является платным. Наоборот, в мире есть множество программ, распространяемых бесплатно (freeware), но исходный код этих программ закрыт. Взять ту же "Оперу" (браузер Opera) – ее исходный код никому не доступен, то же самое можно сказать и об IE. Да, Internet Explorer может скачать любой желающий с сайта Microsoft, но сама Microsoft до сих пор не открыла его исходного кода.