10 июня, 2005

Русские правила для SpamAssassin

Более 98% приходящей мне почты являются спамом, с чем я себя не поздравляю.

Раньше, всего, кажется, год назад или чуть больше, весь основной спам был англоязычным. Он хорошо фильтровался SpamAssassin-ом, а протечки типа Центра Американского Английского развлекали. Спаммеры казались далёкими заморскими чудаками, их наивные уловки не пугали и вообще проблем не было.

Многое изменилось. Основной спам сейчас идёт от своих. Неистовые легендарные грузчики, а также семинары для руководителей по отбору персонала рекламируются ежедневно и чрезвычайно обильно. К русским спаммерам автоматически испытывается какой-то особенный негатив, как к предателям. Ладно бы хоть виагру или там ролекс продавали, как все. Так нет же! Грузчики, семинары и базы емейлов. Пишут конечно всякие Софьи Леонардовны с Ашотами Мельхиоровичами, не хрен собачий, в теме письма вежливо помечают, что, мол, для главного бухгалтера. Да ещё и украшают свои опусы чудными кусочками классики с либ.ру для смущения самообучающихся фильтров. Я помню, мне однажды кусок Анны Карениной прислали. Умняшки такие, диву даёшься.

В общем второй день веду изнурительную битву. Одинокий SpamAssassin уже не справляется, куда ему до грузчиков-то. Введение в эксплуатацию greet-pause и аналогов, SPF, greylisting и прочего завершилось и помогло, но всё равно что-то просачивается.

Сейчас пробую русские правила к SpamAssassin имени Михаила Вербицкого. Чуть ниже несколько правил моего собственного сочинения.

P.S. С технической точки зрения задача рассылки спама в текущих условиях представляется очень интересной. Гонка вооружений зашла далеко, и теперь для спама требуется очень изощрённое программирование. Моральные аспекты сложные. Впрочем, «сайт знакомств» я однажды писал, а значит руки уже по локоть в грязи и чья бы корова мычала. Заткнулся.

header SUBJ_UNDERSCORE_2        Subject =~ /_[^_]+_/
describe SUBJ_UNDERSCORE_2      More than 2 distinct underscores in subj
score SUBJ_UNDERSCORE_2 0.3

header SUBJ_NO_SPACES           Subject =~ /^\s*\S+\s*$/
describe SUBJ_NO_SPACES         No spaces inside subject text
score SUBJ_NO_SPACES 0

meta SUBJ_SPACES_UNDERSCORES    SUBJ_UNDERSCORE_2 && SUBJ_NO_SPACES
describe SUBJ_SPACES_UNDERSCORES Spaces are likely to be underscores in subject
score SUBJ_SPACES_UNDERSCORES 3

header SUBJ_LATIN_MUSOR         Subject =~ /_\(\w+\)\s*$/
describe SUBJ_LATIN_MUSOR       _(musor) in subject
score SUBJ_LATIN_MUSOR 3

header SUBJ_PREFIX_NO_SPACE     Subject =~ /^(?:Re|Fwd):\S/
describe SUBJ_PREFIX_NO_SPACE   Subject prefix without space after colon
score SUBJ_PREFIX_NO_SPACE 2

header SUBJ_MIME_TOO_LONG       Subject:raw =~ /=\?[^ ?]+\?[qQbB]\?[^?]{75,}\?/
describe SUBJ_MIME_TOO_LONG     MIME encoded word in subject > 75 chars (RFC violation)
score SUBJ_MIME_TOO_LONG 3
Написал kappa в 10.06.05 17:02
Комментарии

А спамооборону яндекса не проще сделать?

Кто: Xex Когда: 15.06.05 11:21

Проще. 100 $ в год, но никаких возможностей адаптации под себя.

А текущая система у меня ловит спама больше, чем мой бесплатный ящик на яндексе. Такое вот качество.

Кто: кап Когда: 15.06.05 11:35

Может кому поможет )
http://www.spamassassin.tu2.ru/

Кто: nick Когда: 04.05.08 13:20

Спасибо чувак!!! Ресурс очень помог!!! )))

Кто: Jaja Когда: 27.06.08 18:27

сайт реально помог! спс!

Кто: Met Когда: 29.07.08 13:32
Добавить комментарий









Запомнить Вас?