LWP(libwww-perl)を使う時には固有な agent を名乗らないとスパム扱いされる可能性がある罠

| コメント(0) | トラックバック(2)
このエントリーを含むはてなブックマークこのエントリーのはてなブックマーク数 Buzzurlへ追加このエントリーのBuzzurlブックマーク数 livedoorクリップへ追加このエントリーのlivedoorクリップ数 Yahoo!ブックマークへ追加人が登録 POOKMARK Airlinesへ追加 Saafへ追加 ニフティクリップへ追加 add to del.icio.us add to Digg add to Reddit

ここのところ、アクセスログばかり眺めています。ここのと、バレーボールのブログのやつ。503 頻発などが立て続けに起きたので、少しでも負荷を減らすためにはどうすベーと、毎日考えているのです。

で良く見ていると、以下の3つの Agent が目に付きました。

  • libghttp/1.0
  • TrackBack/1.6
  • TrackBack/1.02

こいつらが mt-tb.cgi(実際はリネームしています)を叩きまくっています。どうやら、トラックバックスパムの送信元のようです。

libghttp/1.0 に関しては、以下のようなことらしいです。

これは、もともとスパムウェアではないライブラリを、スパマがスパム送信に転用しているものと思われます。

ふむふむ。更に TrackBack/1.xx は以下の通り。

3番目にある『TrackBack/1.6』ですが、MovableType のトラックバック技術仕様書にあるサンプルコードから来ているのではないかという情報があります。

ふむふむ。

まぁ、どれもトラックバックスパムしか送って来ないようなんで、さくっと .htaccess で弾くことにしました。

SetEnvIf User-Agent "^TrackBack/1.6" tb_spam
SetEnvIf User-Agent "^TrackBack/1.02" tb_spam
SetEnvIf User-Agent "^libghttp/1.0" tb_spam
order allow,deny
allow from all
deny from env=tb_spam

で本題。

上記のことを調べている中で、以下のエントリを知りました。

その代表的な例が最初にも書いたGoogleで、ユーザーエージェント名に「libwww」が入っていると検索結果画面がことごとく「403 Forbidden」エラーを吐いてくれるようになります。

ええーそんなまさかーと思い、User Agent Switcher で Agent 変更してアクセスしてみると、ホントだ 403…。

日常的に LWP(libwww-perl)を利用し、しかし固有の Agent を名乗るなんて意識したことない身からすると寝耳に水ですが、まぁ、スパム扱いされたくなければ固有の Agent を名乗りなさいということですね。 Agent 変更するのはさっぱり難しくないですし。

Agent の設定、てか LWP の使用方法は以下を参考に。

しかし変更は簡単なんだから、そのうちスパム側も Agent 変更してくるんでしょうね…。

トラックバック(2)

トラックバックURL: http://www.hazama.nu/mt/mt-tb-jpLbM5mz.cgi/2667

迷惑トラックバックが大変多くてね。 まあ、ほとんどのスパムはMTが迷惑判定してく... 続きを読む

いつかちゃんと書こうと思っていた。 こういうタイトルのEntryをM回以上かく... 続きを読む

コメントする

月別 アーカイブ

ウェブページ

OpenID対応しています OpenIDについて

AD

 

被はてブ

Flickriver::Most Interesting

tai-tetsu - Flickriver

最近のコメント

アイテム

  • Love Letter
  • 20100710_extremememory.jpeg
  • 20100620_aoss.jpeg
  • Desire 液晶保護フィルム
  • IMG_5257.JPG
  • HTC Desire シリコンジャケット
  • 20100107_five_finger_sox_01.jpeg
  • 20100107_five_finger_sox_01.jpeg
  • 2010年賀状
  • 20091231_digital_camera_magazine_02

このブログ記事について

このページは、太鉄が2007年4月25日 20:51に書いたブログ記事です。

ひとつ前のブログ記事は「さくらインターネットが「さくらのレンタルサーバ・ビジネス」プロを提供開始」です。

次のブログ記事は「SPRINGRIGHT.COM は Spam Host か否か」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。