« 研究室のサーバー故障 | トップページ | リンク集 »

2004年3月17日 (水曜日)

SPAMとの闘い

現在、3段階でSPAMを除去している。その手順を紹介しましょう。

(1)職場のメールサーバー全体の設定
まず、メールサーバーソフトsendmailのフィルタ機能を使い、特定のドメインからのメールに対し、サーバーへの着信を拒否する。私もこのブラックリストをいじれるので、自分宛にしつこく来たSPAM送信者をぼちぼち登録しています。
さらにSpamAssassinというソフトも連動しており、メール内容を分析して、どの程度SPAMらしいか評価してくれる。現在はこれが5.0点以上だと配信されずに削除される設定になっている。(SpamAssassinは私の管理外)

(2)メールサーバー上で、さらに自分宛のメールに対するフィルタ
これにはprocmailというソフトを使っている。これも職場サーバーにインストールされているものの、設定にはUNIXの知識が必要で、敷居が高いためか、数人しか使っていないようだ。
留学生がいるため、上記の職場サーバー全体の設定で韓国語・中国語のメールを拒否する訳にいかないが、この段階で私宛の韓国語や中国語のSPAMをブロックしている。
誤って大事なメールを失うのを避けるため、この段階までのフィルタのルールは、完全にSPAMと断定できるものしか削除しない。

(3)受信するパソコン上でのフィルタ
職場以外のアカウントのメールも、ここから合流してフィルタリング開始です。
ここで、サーバー上のメールを半自動で削除するソフトを使います。本文を受信せずに、ヘッダ情報だけで判断すれば、通信時間やディスク容量の節約にもなります。

使用するソフトはいくつか変遷してきました。

まず、MailWasher
自作のルールに加え、ネット上のブラックリスト情報もつかって、判断します。
一覧表示からの、メール冒頭プレビューなど、操作性はよかったのですが、英語版で日本語表示に難があったのと、そもそもシェアウェアで、旧版は試用制限なしだったのが、バージョンが上がった際に、未登録の試用ではマルチアカウントに対応しなくなってしまったので、乗り換えを考えました。

次に国産のフリーウェア、Spam Mail Killer
これはお勧め。かなり柔軟にルールを作れます。
自分は凝り性なので、さらなるSPAM撃退精度の向上を目指して、判定ルールの編集に明け暮れがち。最近このいたちごっこの作業に疲れてきました。

そして、最近話題のベイズ理論推定によるPOPFileを試し始めました。初めは誤判定しますが、学習機能があり、使うほど判定精度が上がってゆくとのこと。これが安定して動くようになれば、SPAM対策が手間いらずになります。

--------------------
3月5日追記
POPFileを使い始めて一週間。この間、(1)段階で拒否したSPAM数は不明。(2)段階のprocmailで拒否したSPAMは約100通。そこを抜けたメールと他プロバイダからのメールが合わせて330通。これらが(3)段階のPOPFileに入り、学習されました。このうち、SPAMは24通。SPAM/非SPAMの判定精度は約95%に達しました。

|

« 研究室のサーバー故障 | トップページ | リンク集 »

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/23831/314789

この記事へのトラックバック一覧です: SPAMとの闘い:

« 研究室のサーバー故障 | トップページ | リンク集 »