http://readmej.com/

2007 年 03 月 03 日(土)

 よくもまぁこんだけスパムなカキコが横行するもんです。非常にウザイので、以前「英語だけのカキコはスパムと看做してキンシする」という処置をプログラムに入れました。おかげで随分とスパムは減りました。しかし未だそのブロックを掻い潜る2種類のスパムがあるわけです。ひとつは掲示板のタイトルである【掲示板(BBS)】という文字を流用し、書き込み内容にそれを挿入してくるスパムです。もちろん日本語で掲示板と書かれているわけですから、前述のブロックが効きません。仕方がないので「本文から掲示板という文字を全て消し去り、残ったものが英語だけならスパムと看做す」という形式に変えました。果たして効き目があるかどうか。問題なのがもうひとつの方で、明らかに英語じゃない文章が内部に紛れているんです。そのせいか、部分的に文字化けしてしまっていて、そこが英語じゃなくなるんです。化けてますから、怪しい漢字になったりするんです。そのせいで英語だけのカキコじゃないと看做してスパムと判断できないんです。化ける文字は時により違うので、特定が難しいんですよね。何か上手い方法は無いものか悩んでいます。むむむ・・・

 私が思うに、プログラミングとはピクロスやカズオなんかより遥かに難しいパズルです。


← 前日 翌日 →