spam

1月分(以上)のメールマガジンを既読に。

spam がまぎれ込んでいるし、誤判定のものもある。 3日以上たっているので、PopFiile に間違いを教えることも出来ない。

勤め先から自宅宛に出したメールが spam に分類されている。

対策はなさそう id:matznaga:20040615

mule ML も汚染されてしまったか。あれ?全く同じメールが mule-ja では ham と判定されているな。(2通あったが両方とも mule では spam でmule-ja では ham と判定されている。)

会社で使っている ISP からの連絡通知が spam に判断されている。

spam もどき Subject: CALL FOR PARTICIPATION: EntNet @ SUPERCOMM 2005 というメールが4通も。 てっきり、ACM と IEEE とあとどこかからかと思ったのに、全部 IEEE からだった。これじゃ spam じゃないか。

対策で、アドレスを絞ったときに、プロシン連絡用のアドレスを残すのを忘れてしまったらしい。

service@intl.paypal.com から、またフィッシング(?)メール。使われているアドレスは squeak ML の物だし、 PayPal を使った記憶は無いし(忘れただけ?)、カードはとっくにエクスパイアしているのに、「もうすぐ expire するよ、」ってのはいくらなんでも……

某メイリングリスト(ML)で僕の投稿だけが届かない、という人がいる。 どうやら matznaga.net を詐称して spam を振り撒いている馬鹿のせいで、matznaga.net をフィルタリングしている ISP があるらしい。 「matznaga.net からのメールはもう受け取らない」主…

メール遮断処置が実効を奏したらしく、spam の数が1割にまで下がる。 さて、あちこちの ML にアドレス変更のコマンドを投げないと。

朝一の fetchmail が 1時間20分かかってしまう。当然ほとんどが spam. もう少し、From: を整理してから、と思っていたのだけれど、現状をメール転送の会社に連絡し、使っていないアドレスへのメールの遮断が出来ないか打診する。 会社としては、アドレスがあ…

会場は PHS がなんとか接がる。が 32kbps しか出ない。fetchmail をかけたら、1005 通のメールを 40分かけて取り込むも、90% 近くが spam. 電話代も時間ももったいない。

昨日はもう一息で 4000通 というところ。 えーと、POPFile のバージョンを上げた時にログの形式が変ったので、POPFile を通り抜けたタイムスタンプで振り分ける方式から、cron.daily を実行する時までに、POPFlie を通り抜けたメールの数を数える方式に変え…

エラーメールの取り扱い

参加していない、某ML から「あなたはこのメーリングリスト のメンバーではありません。」というメールが来る。 使われているアドレスは実際に参加している別の某 MLで使っているもの。 この類のメールは spam に分類すると、本物のときに困るな。reclassify…

spam の流量をグラフ化していたのだが、結局 ver. 0.22.1 では log にメールをどのバケツに入れたかの記録が残らないようだ。 そこで、spam だけ Subject: に [spam] を入れるように、(ham と unclassified は Subject: に手を加えない)設定して maildrop の…

Mail Address

昔、spam が週に数通だったころの習慣で ML 毎に別のアドレスで参加している。で、これらがアドレスを伏せずに archive を公開しているため、それら全部のアドレスに spam が来るのが敗因。 自前でサーバを上げていれば、いくらでも対策はあるのだが、固定 I…

今年に入ってから届いた spam メールの数

2004-01 9515 2004-02 10194 2004-03 12033 2004-04 15419 2004-05 19078 2004-06 33039 2004-07 55759 2004-08 62698 2004-09 57756 2004-10 75649 9月には実際減っていたわけだな。で10月にまた増加に転じたと。

cat /usr/local/bin/popfile/*.log|grep `date '+%Y/%-m/%-d' --date "1 days ago"` |egrep 'CLASS:(spam|appoint|unclassified)'|wc -l 3948 cat /usr/local/bin/popfile/*.log|grep `date '+%Y/%-m/%-d' --date "1 days ago"` |egrep 'CLASS:(spam|appoint…

大量。

Giveaway Cons から、96通(1日から12日までに108通合計204通) Product Testers から、72通 Award Dept. から 92通(1日から13日までに163通合計255通)

昨日の POPFile による振り分け結果 spam1621 ham495 unclassified11 誤認識0 見逃し18 appoint191 ということで落ちついたようだ。spam の見逃し率は 1% に戻っている。 (先日の日記の false-positive と false-negative は意味が逆だったような気がするの…

昨日の結果。 spam1684 ham311 unclassified249 false-positive0 fales-negative339 appoint80 appoint は全て、spam なので、実質的には spam が 1764通。 一昨日よりは少いのか。 しかし、fales-negative が 339通 じゃあ 2割近くを見逃しているわけで、フ…

昨日の false-negative は結局、238通、unclassified が 188通(全部 spam)、 appoint が 336通あった(内1通はham)。spam が 2003通、ham が 281通 ある状態での数字なので、spam の1割以上が false-negative だったわけだ。POPFile の効果がとっても悪くなっ…

spam の見逃しが大量(数十通)に出ている。午前中にそれらを spam に reclassify したが、午後も同じ(だと思われる) spam を大量に見逃している。unclassified なメールは100通を超えているみたい。文面から見ると今までの学習からして spam と判断されそうな…

今月に入ってからのメールの ham 率、22% 先月は確か 15%。 最近少し減っているように見えたのは気のせいではないらしい。 まさか、どこかでフィルタリングされたせいじゃないだろうな?

というわけで、先月の spam box で spam が使っているアドレスを調べてみる。 cd /Mail/junk-2004-09 ls|xargs grep '^To: '|sed -e 's/.*: //' -e 's/,/\ /g' -e 's/ //g' -e 's/.*とすると、次の結果が得られる。アドレスは伏字。 2945 art@私のドメイン 2…

誤判定が1通

見逃がしは毎日かなりあるが、誤判定は本当に久しぶりな気がする。 でも この高結果は unclassified の多さのせいだな。 まあ、unclassified で spam でないものも滅多に無いんだが。

noabuse ML

夕方、再度申請の確認メイルを投げる。今度は送れたみたい。 nice-tv.jp をブラックリストから外してくれたのかしら。 午後6時前に、noabuse ML からのメイルが流れてくる。 午後10時前に、ML 参加認証のメイルが流れてくる。(順序が逆のような気が)

noabuse ML 続き

結局 noabuse への Mail は出て行かなかった見たい。 自宅に帰ってから再送。 Cc: なアドレスへは直ちに届いた。To: はさて。 うむ。確認メイルが来たぞっと。返信を出す。 これが時間待ちをさせられる間はこのマシンを止めちゃいけない、ということはもう数…

noabuse ML

noabuse ML に subscribe を出したのだが、返事が来ない。 昨夜案内状の請求のときはすぐに来たのに。 まあ fetchmail と qbiff のタイミングの問題かも知れないが……。 会社の IP が black list に載っているとか、昨日とは違う環境だからとか、うーん、あと…

今日届いた spam は 2000通を超えた。しばらく減っていたのにまた元の状態に。