PopFile

7月の記録

(精度): バケツ名 ham 18,729 spam 23,944 unclassified 合計 42,673 分類精度 分類されたメール数: 20,439 分類エラーの数: 13 精度: 99.93% 分類されたメール数 バケツ 分類数 誤検出 見逃し ham 7,390 (36.15%) 2 0 spam 13,044 (63.81%) 0 13 unclassifi…

6月分データ

バケツ名 固有単語数 ham 18,729 spam 23,368 unclassified 合計 42,097分類精度 分類されたメール数: 19,213 分類エラーの数: 11 精度: 99.94%分類されたメール数 バケツ 分類数 誤検出 見逃し ham 6,789 (35.33%) 3 2 spam 12,420 (64.64%) 0 9 unclassifi…

5月分

バケツ名 固有単語数 ham 18,675 spam 23,142 合計 41,817分類精度 分類されたメール数: 18,512 分類エラーの数: 15 精度: 99.91% 分類されたメール数 バケツ 分類数 誤検出 見逃し ham 7,397 (39.95%) 3 4 spam 11,113 (60.03%) 2 11 unclassified 2 (0.01%…

4月分

バケツ名 固有単語数 ham 18,322 spam 22,438 unclassified 合計 40,760 分類されたメール数: 15,006 分類エラーの数: 6 精度: 99.96% 分類されたメール数 バケツ 分類数 誤検出 見逃し ham 6,114 (40.74%) 1 4 spam 8,891 (59.24%) 1 2 unclassified 1 (0.0…

Trouble

POP3 connection to pop1.nice-tv.jp failed: Connection refused なんで? Date: Sat Apr 1 15:27:18 2006 までは fetchmail が動いていた。その後エラーになっているらしい。 うーむ。人狼BBS への投稿は出来るから、ネットワークエラーでは無い。 ncftp …

今月のサマリー

バケツ名 固有単語数 ham 18,079 spam 22,054 unclassified 合計 40,133分類精度 分類されたメール数: 19,909 分類エラーの数: 15 精度: 99.92%分類されたメール数 バケツ 分類数 誤検出 見逃し ham 8,867 (44.53%) 1 8 spam 11,039 (55.44%) 2 7 unclassifi…

2月分データ

バケツ名 固有単語数 ham 17,473 spam 21,650 unclassified 合計 39,123 分類精度 分類されたメール数: 15,973 分類エラーの数: 6 精度: 99.96% 分類されたメール数 バケツ 分類数 誤検出 見逃し ham 6,776 (42.42%) 0 3 spam 9,193 (57.55%) 1 3 unclassifi…

/data/popfile-* にあるファイルを展開。 ./im/Config を修正(fetchmail では無く、get 用に) (qmail 設定を無効にする) imget 複数のメールが一つにまとまっているのがいくつか。 popfile-u と popfile-repute の複数メールが1通にまとまっていたものを全部…

12月データ

バケツ名 固有単語数 ham 16,958 spam 21,234 unclassified 分類精度 分類されたメール数: 15,467 分類エラーの数: 15 精度: 99.9% 分類されたメール数 バケツ 分類数 誤検出 見逃し ham 7,001 (45.26%) 3 6 spam 8,464 (54.72%) 0 9 unclassified 2 (0.01%)…

止まっている? なぜ?

11月分データ

バケツ名 ham 16,450 spam 20,570 分類精度 分類されたメール数: 15,590 分類エラーの数: 22 精度: 99.85% 分類されたメール数 バケツ 分類数 誤検出 見逃し ham 7,785 (49.93%) 5 11 spam 7,801 (50.03%) 4 11 unclassified 4 (0.02%) 13 単語数 バケツ 単…

10月の情報

バケツ名 固有単語数 ham 15,842 spam 19,154 分類精度 分類されたメール数: 17,015 分類エラーの数: 12 精度: 99.92% 分類されたメール数 バケツ 分類数 誤検出 見逃し ham 8,919 (52.41%) 3 6 spam 8,093 (47.56%) 1 6 unclassified 3 (0.01%) 8 単語数 バ…

9月の情報

バケツ名 ham 15,021 spam 18,868 分類精度 分類されたメール数: 16,591 分類エラーの数: 14 精度: 99.91% 分類されたメール数 バケツ 分類数 誤検出 見逃し ham 8,887 (53.56%) 2 8 spam 7,697 (46.39%) 2 6 unclassified 7 (0.04%) 10 単語数 バケツ 単語…

8月の POPFile 解析

バケツ名 固有単語数 ham 14,596 spam 18,515 unclassified 分類精度 分類されたメール数: 15,727 分類エラーの数: 18 精度: 99.88% 分類されたメール数 バケツ 分類数 誤検出 見逃し ham 8,423 (53.55%) 2 6 spam 7,301 (46.42%) 1 12 unclassified 3 (0.01…

先月の状況

バケツ名 固有単語数 ham 14,100 spam 17,951 unclassified 分類精度 分類されたメール数: 17,655 分類エラーの数: 15 精度: 99.91% 分類されたメール数 バケツ 分類数 誤検出 見逃し ham 9,715 (55.02%) 3 8 spam 7,936 (44.95%) 6 7 unclassified 4 (0.02%…

popfile-user, popfile-repute(pop@matznaga.net で参加していたML) に matznaga@matznaga.com で再入会。(pop@matznaga.com で入会するつもりが、失敗) popfile-repute は O.K. popfile-user は失敗。再試行。 あれ? http と mail の両方から申し込んで…

ML

popfile-repute が 04/11/11 で止まっている。 去年の秋に、spam 対策で受け取るユーザアカウントに制限をかけたときに、残し忘れたらしい。 pop@matznaga.net はいまや、メールの届かないアドレスなのだ。 必然的に popfile-users も同じ時期に止まっている…

mule ML も汚染されてしまったか。あれ?全く同じメールが mule-ja では ham と判定されているな。(2通あったが両方とも mule では spam でmule-ja では ham と判定されている。)

から受信確認メール。spam に分類。その後、同一アドレスから正常なメールが届く。 spam に分類されたので、ham に分類。そうしたら、最初のメールが「現在のコーパスでは ham」になってしまった。 うーむ。「受信確認メール」だけ spam に向けたいんだけど…

今月の POPFile 情報 バケツ名 固有単語数 ham 11,750 spam 15,749 分類精度 分類されたメール数: 17,873 分類エラーの数: 29 精度: 99.83% 分類されたメール数 バケツ 分類数 誤検出 見逃し ham 10,144 (56.75%) 5 16 spam 7,723 (43.21%) 4 13 unclassifie…

orca-users に届いていたメールが 3月1日から今日まで 137通、全部がspam と判断されていた。 3月23日に ruby-list で発見したのと同様の現象だね。当然(?)1通だけ、reclassify したら、ここ3日分は全部「現在のコーパスでは ham」になった。

落ちているみたい。14:28 にはメールを受け取っていて、今 15:30 だから、せいぜい1時間か。 でも、なぜ落ちたのだろう? また、1通だけ手で popfile を通さずにfetchmail しなければならないのかな?いや、無事流れ出した気配。

(原因が思い出せないが)マシンがダウンしたのでリブート。POPFile が使っていたポートがなかなか思い出せない。bookmark に登録してあるPOPFile は以前のものなので、現在のポートとは違う。(だから設定変更したらちゃんと bookmark も変更しておかなきゃ > …

mule-ja に5通来たメールが全部 spam として判定されている。 1通を ham に reclassify したら、残りは「現在のコーパスによれば ham」に変化したので、reclassify はしなかった。 が、つまり「バケツ」に表示されている分類精度などは間違っていることにな…

文字化け

昨日、気がついたら POPFile が落ちていた。原因を調べたら /var がフルになっていたためらしい。 /var を整理して /etc/init.d/popfile start で POPFileを再起動。 なぜか、コントロールセンターが英語になっているし、skin もdefault に戻っている。設定…

朝起きたときに、見逃しが2つ(片方を reclassify したらもう一方の「現在のコーパスによる」も直ったので、こちらは reclassify せず。) unclassified が2つ。一つは spam, もう一つは ham な内容. あれ? ham に reclassify 出来ない。なぜ?

(参加していない)becky-ml から、 「ATTENTION! Your mail is too big, so not processed!!!」 というメールが来て、unclassified になっていた。 チェックしてみたら、 ham (得点: 269.449) spam (得点: 269.368) とまさに拮抗している。こいつを spam に r…

エラーメールの取り扱い

参加していない、某ML から「あなたはこのメーリングリスト のメンバーではありません。」というメールが来る。 使われているアドレスは実際に参加している別の某 MLで使っているもの。 この類のメールは spam に分類すると、本物のときに困るな。reclassify…

spam の流量をグラフ化していたのだが、結局 ver. 0.22.1 では log にメールをどのバケツに入れたかの記録が残らないようだ。 そこで、spam だけ Subject: に [spam] を入れるように、(ham と unclassified は Subject: に手を加えない)設定して maildrop の…

10月30日の21時頃に version を 0.22.1 に上げて、10月31日24時までに届いた3506 通のメールのうち、最初の50本を含めて、79通を学習させた。 その結果、97.74% の分類精度に達した。31日の24時にリセットして、昨日と今日の2日間に(まだ今日は終っていない…