Cерверный комплекс EservAgava mail server
Комплекс предназначен для построения комфортной и качественной работы с почтой в организации.
В комплект EservAgava mail server включены почтовый сервер (SMTP, POP3, IMAP4),
веб-сервер (HTTP), файловый сервер (FTP), SNMP сервер, SSL/TLS-версии
всех серверов (HTTPS, SMTPS, POP3S, IMAPS, FTPS), программы управления
комплектом серверов, статистический спам-фильтр
SpamProtexx,
Dr.Web antivirus plugin для антивирусной проверки почты в EservAgava (отдельно
Spamprotexx и Dr. Web скачивать не надо - они входят в комплект).
Данный почтовый сервер для Windows способен удовлетворить любые запросы
пользователей (подробнее ...)
ТРЕБОВАНИЯ К ОБОРУДОВАНИЮ, ОС и СЕТИ
Желательная минимальная конфигурация:
Celeron/600, 128 Mb RAM, Windows 2000
Будет работать и на более слабых машинах, и на более старых Windows -
9x и NT4. Некоторые компоненты (в частности FireWall plugin,
интерфейсный tasklist plugin) не будут работать на Windows9x/ME/NT4.
(Подробнее на http://www.eserv.ru/EservEproxy323 ) Рекомендумая
конфигурация сильно зависит от числа пользователей, работающих с
сервером. При 1200 пользователях хорошие результаты показывает сервер
PIII/1Ggz, 512 Mb RAM, 60 Gb HDD, Windows 200x.
Классификация почты с помощью SpamProtexx производится на стадии, когда письмо полностью принято в файл в spool, определен ящик-получатель, и осталось решить, в какую из папок пользователя положить письмо. Почта, классифицированная как спам, не попадает в INBOX пользователя (доступный по IMAP и POP3), а попадает в IMAP-подкаталог "spam" этого пользователя (по умолчанию доступный только по IMAP, но не по POP3), и копия в общий каталог на случай переклассификации отправителем. Отправителю спама во время почтовой сессии в ответ на команду DATA дается код ошибки 5хх и URL для "проталкивания письма" (с автоматической подстройкой словарей SpamProtexx). Все стандартные MTA возвращают такие письма отправителям и приводят в возврате текст из сообщения об ошибке. Таким образом отправитель будет знать, что его письмо попало в spam, и будет знать как его "обелить". Это исключает негативный эффект от возможных ложных срабатываний (false positives), которые и так составляют менее 0.01%. Если отправитель посещает приведенный URL, то сообщение автоматически копируется в папку reclassify (для контроля админом), а отправителю дается возможность нажатием одной кнопки обучить SpamProtexx впредь относиться к таким письмам терпимее (слова добавляются в словарь 'clear' классификатора). Для ручной переклассификации клиентом-получателем (например, false negatives - просочившийся спам - переклассифицировать как спам) достаточно в IMAP-клиенте переложить сообщение в папку spam или not_spam (любого каталога - можно создать эти папки, где вам удобно), и IMAP-сервер инициирует соответствующую процедуру обучения на SpamProtexx). Последующие письма будут классифицироваться уже с учетом этих изменений, ничего для этого перезапускать не нужно.
При перекладывании сообщения в папку not_spam, это письмо заново отправляется получателю и попадает в его INBOX.
Письма, классифицированные как 'unclassified' - кандидаты на переклассификацию для дообучения спам-фильтра, поэтому кроме INBOX, они также копируются в специальную административную папку 'ambiguous' ("неоднозначная классификация"), доступную администратору по IMAP.
Первичная настройка и проверка SpamProtexx
Режим работы с использованием SpamProtexx включается опцией SMTP[UseSpamProtexx] в Eserv 3.ini или в веб-интерфейсе EservAgava. После этого нужно перезапустить acSMTP для загрузки plugin'а SpamProtexx. Если он не запускается, см. диагностические сообщения в acSMTP.log - возможно истек срок тестовой эксплуатации SpamProtexx, или не удается активировать >SpamProtexx, и т.п.
Для проверки работы фильтра:
- отправить письмо на внешний сетевой интерфейс SMTP-сервера Eserv и смотреть результат классификации в журнале и ответы Eserv на команду DATA: если спам, то это будет видно по вставляемым в эти ответы ссылкам на переклассификацию. Пример записи в логе:
2005-09-07 15:01:01;anelko@mail.com;php@eserv.ru;38467;;82.36.175.74;spam;-;spam;0.999755 - в предпоследнем поле указана классификация, присвоенная на основе вычисленной вероятности, а в последнем поле числовое значение вероятности - от 0 до 1 - ближе к нулю не спам, ближе к 1 спам.Если базы еще не
"обучены", то скорее всего значение вероятности будет около 0.5, и unclassified.
Управление заключается в:
- начальном обучении словарей SpamProtexx (импортом вашей старой классифицированной почты или загрузкой наших примеров словарей).
- дообучение по ходу работы - перемещение неверно классифицированной почты в каталоги spam или not_spam при работе в IMAP. Папку 'not_spam' можно создать в любом месте иерархии папок IMAP-клиентом. При перемещении письма из папки spam (или другой) в папку 'not_spam' на сервере запускается процедура переклассификации этого письма - изменения статистических словарей фильтра. При перемещении в словарь 'spam' слова добавляются в словарь 'spam'. На основании этих частотных словарей и работает классификация SpamProtexx (см. www.eserv.ru/StatisticalSpamFiltering). И качество его работы всецело зависит от аккуратности действий того, кто выполняет эти операции переклассификации-дообучения фильтра. У самого SpamProtexx никаких заранее заданных критериев спама/не-спама нет. Если ваши собственные критерии оценки спам/не-спам остаются неизменными, и вы соответственно поправляете неверные срабатывания SpamProtexx, то в скором времени он станет не менее аккуратным в своих оценках. На практике достижима аккуратность 99.99% и выше . Поскольку добросовестность классификации является критическим фактором при применении SpamProtexx - некоторые администраторы берут роль переклассификатора полностью на себя (по умолчанию это могут делать и пользователи через IMAP). Для этого администратор может настроить себе доступ в папку reclassify или ко всей иерархии папок IMAP. Спец-каталоги для административных учетных записей IMAP настраиваются здесь: http://localhost:3140/main/CONF/lists/imap/SpecialFolders.txt. Для чтения reclassify можно завести особый IMAP-account, либо использовать заведенный по умолчанию popfile_admin.
- контроль работы фильтра по журналам Eserv или по статистическим отчетам в веб-интерфейсе.
После первичной настройки обрабатываются только ложные срабатывания и "ложные несрабатывания". Причем ложные срабатывания обрабатывает сам отправитель через веб, как описано выше. Если пользователи не используют IMAP, то переклассификацию "ложных несрабатываний" придётся делать админу, входя в корень иерархии всех IMAP-каталогов (supervisor@) или прося пользователей пересылать ему спам, попавший в их ящики.
Заранее создавать подкаталоги spam и not_spam не нужно. Каталог spam создастся автоматически при поступлении спама пользователю. not_spam нужно создать самому (где угодно), если требуется переклассификация. При помещении в not_spam письмо после переклассификации отправляется исходному получателю.
Все письма, которые при классификации опознаны как НЕ спам, попадают напрямую в INBOX пользователя. INBOX доступен как по IMAP, так и по POP3.