Шрифт:
Рис. 8.6. Тонкая настройка фильтра
• Working directory (Рабочий каталог) и Filter log (Файл журнала) – изменить рабочую папку фильтров и расположение файла журнала.
• Number of ranking tokens (Количество оценочных признаков) – показывает количество слов, которые будут участвовать в определении рейтинга: значение 15 является оптимальным, и изменять его не рекомендуется.
• Use enhanced evaluation (Расширенная оценка) – в случае необходимости разрешает отойти от жесткого значения параметра Number of ranking tokens (Количество оценочных признаков) и использовать нужное количество слов.
• Use «whitelist» of kludges («Белый» список заголовков) – здесь можно указать, какие технические заголовки следует игнорировать при обработке. Некоторые системы добавляют свои заголовки вроде X-Spam-Score; чтобы исключить их влияние на рейтинг, используется этот параметр.
• Splash screen on start/exit/waiting (Показывать заставку) – позволяет BayesIt! показывать окна с диагностическими сообщениями в случае выполнения некоторых продолжительных операций, чтобы пользователь не подумал, что программа зависла.
В области Logging options (Вести журнал работы) настраиваются сообщения, которые будут записаны в журнал работы модуля.
В подразделе Local alphabet (Локальный алфавит) настраиваются правила для декодирования русских слов, у которых часть букв заменена похожими по начертанию английскими. Применение такой функции позволяет на порядок повысить качество работы фильтра и уменьшить размер статистической базы словаря за счет того, что в ней будут храниться значения всех слов в едином виде.
Разделы Правила «белого» списка, Правила «черного» списка и Игнор-список по настройкам схожи. Назначение первых двух понятно, они уже рассматривались ранее. Игнор-список предназначен для обработки писем, которые не являются ни спамом, ни желательной почтой, например диагностические сообщения почтового сервера. Чтобы антиспам-фильтр не тратил ресурсы, их значения заносятся в этот список. В The Bat! невозможно фильтровать письма, основываясь на данных, записанных в Адресной книге, как это возможно в Thunderbird. Все правила придется создавать вручную.
Нажатие кнопки Добавить или Править при редактировании правила приведет к появлению окна настройки (рис. 8.7).
Рис. 8.7. Окно добавления/редактирования правила
В этом окне для заполнения доступны два списка и два поля.
• Область сообщения для проверки – здесь задается область письма, которая будет анализироваться с помощью этого правила. Доступны следующие варианты:
– Везде – все письмо целиком, без предварительного декодирования, в том виде, в котором оно получено;
– Заголовок – служебные заголовки письма;
– Тема, Отправитель, Получатель, Копия, Скрытая копия – фильтрация по содержимому одноименных полей письма;
– Тело – все тело письма, то есть практически Везде минус Заголовок.
• Условие – задается интерпретация выбранного поля в сравнении с заданной далее сигнальной строкой. Доступны варианты: Содержит, Не содержит, Начинается на, Не начинается на, Заканчивается на, Не заканчивается на, Совпадает с, Не совпадает с, Удовлетворяет условию, Не удовлетворяет условию.
• Тест сигнальной строки – содержит собственно строку, которую следует искать.
• Имя правила – название вновь созданного правила, которое будет выводиться в списке. Лучше выбрать имя, отражающее суть правила.
Теперь установите флажок Активизировать правило и нажмите ОК. Правило создано.
Использование вышеописанных списков и полей является дополнительной функцией, поэтому увлекаться не стоит. Основное их назначение – автоматическая коррекция поведения модуля, если он систематически ошибается для писем определенного вида. Его можно также использовать, чтобы гарантированно принимать некоторую почту. Например, если вам необходимо «засветить» свой почтовый адрес в Интернете, борьба со спамом вам обеспечена. Чтобы полезная информация не попадала в спам, попросите в теме письма писать определенное кодовое слово. После этого создайте правило для «белого» списка: в раскрывающемся списке Область сообщения для проверки выберите пункт Тема, в списке Условие – пункт Содержит или Начинается на, в поле Тест сигнальной строки введите свое слово. Теперь письма, содержащие в поле Тема кодовое слово, не будут анализироваться и будут беспрепятственно проходить через фильтр. Таким же образом можно отфильтровывать и сообщения серверов почтовых рассылок вроде subscribe.ru. Можно попробовать составить «черный» список, но угнаться за спамерами практически невозможно. Самое популярное в таких рассылках слово, viagra, состоящее всего из шести букв, может иметь бесчисленное множество вариантов (v1agra, vi@gra, v_i_a_g_r_a и т. д.).