ウィークリーまぐまぐの広告をカット
ウィークリーまぐまぐの広告カットに成功しました。
まぐまぐの広告タグは、この2種類。
─[PR]─────────────────
【ここに広告】
─────────────────[PR]─
━[PR]━━━━━━━━━━━━━━━━━
【ここに広告】
━━━━━━━━━━━━━━━━━[PR]━
(本当は横72バイトのものを短縮しています)
この2バイト文字の罫線記号がくせ者でした。
サーバー上ではこれがJISエンコードで扱われて、例えば
.$B(!.(B[PR]
こんなふうに見えます。ここでピリオドで示したところはエスケープ文字0x1bです。
sedの検索条件に文字コード表現は使えないようなので、ここはワイルドカードでごまかすことにしました。結果、
.procmailrc 内の記述 |
:0 fw * ^Errors-To: (mag2@rabbit\.tegami\.com|M0000001@e\.mini\.mag2\.com) | sed -f $HOME/mag2_ad.sed |
スクリプトファイル mag2_ad.sed |
# Delete Banner from Mag2 # /^.\$B([\!,].(B\[PR\]/i\ [AD Deleted] /^.\$B([\!,].(B\[PR\]/,/\[PR\].\$B([\!,].(B.$/d |
こんなスクリプトになりました。
| 固定リンク
「パソコン・インターネット」カテゴリの記事
- 四則演算で10を作る(2016.07.20)
- ResearchGate(2015.12.30)
- PowerPoint操作のTIPS (PowerPoint 2013に改訂)(2014.05.22)
- プログラミン×宇宙兄弟 コンテスト(2013.10.23)
- Facebook(2011.10.05)
コメント