検索よけあれこれ

検索避け指南

人それぞれであり個人の考え方を尊重いたしますが、管理人個人としては特殊な嗜好(ボーイズカップリングなど)や、または未成年に悪影響を与える描写があるもの(アダルトなど)を扱っているサイトの場合は検索避け推奨派です。
理由としては、同人を知らない未成年の方避けや、同人を知らない層のファンの方避けという意味で行っていた方がいいと考えてます。なのでそういった方を間違って呼び込まないために、ある程度の自衛はしてしかるべきだと考えております。
勿論検索除けをしていても、他サイトからのリンクが多いサイト・またはロボットによっては拾われます。多くのサイトで言われているように検索避けは完璧ではありませんのでその点ご了承ください。
ここでは簡単な検索避けの導入について書き記しておきます。検索避けの意義や詳しい方法は各自で検索などしてお調べください。
なおこちらのページは 検索避け覚書 を参考・一部引用しております。



METAタグ

まずトップページでも入れるようにお願いしているMETAタグです。

これを<head>〜</head>の間に入れてやります。なるべく全ページに入れることをお勧めします。おまじない程度ですが。
メタタグは平たく言えば、『この先のページには何もないよ、ここで引き返してください』とロボットにお願いをし、行儀のいいロボットだと『あ、分かりました。これで失礼します』と帰ってくれます。



ブログ・日記

検索除けを検討してくださる方、または検索除けを既に導入している方は、借り物のブログや日記にも入れてみましょう。
特にテンプレートを変更した後にし忘れている場合がありますので、テンプレート変更の際には一番にメタタグを入れる癖を付けておくといいかもしれません。
後は検索除けをしていてもRSS発信、またはPingをそのままにしているサイトが多々見受けられますので、検索除けをしているサイトはRSSのリンクタグも削除、またPingの送信を切るようにしてください。

管理人が確認した限りでは、FC2・忍者・ジュゲムは検索避けのメタタグを挿入できます。
検索避け覚書さんではRSSの切り方なんかも乗ってます。【 こちら 】を参考にどうぞ。



robots.txt

METAと合わせてやって置いていただきたいのが、いわゆるロボテキ、robots.txtの作成と設置です。

User-Agent: *
Disallow: /

3行目の改行までが一つの書式です。これをただのテキストに書いてrobots.txtと保存し、サーバーの一番上のルート上におきます。
行儀の良いロボットならこれを読み込んだ時点で、『ここは見て欲しくないって言ってるから帰ろう』とホームページに入る前に引き返してくれます。ただし一部の無料サーバーなどでは設置できない場合がありますので、サーバーの規約を確かめてください。



.htaccess

現在一番効果のある検索除けだと思われます。これはMETAタグやrobots.txtでしている『お願い』ではなく、『帰れ、入れないっ!』と突っぱねる方法です。

SetEnvIfNoCase User-Agent "msnbot" shutout
SetEnvIfNoCase User-Agent "Googlebot" shutout
SetEnvIfNoCase User-Agent "Slurp" shutout
SetEnvIfNoCase User-Agent "Yahoo" shutout
SetEnvIfNoCase User-Agent "Y!J" shutout
SetEnvIf Referer "^http://www\.google\..*/search" shutout
SetEnvIf Referer "^http://images\.google\..*/images" shutout
SetEnvIf Referer "^http.*search\.yahoo\..*\?" shutout
SetEnvIf Referer "^http://search\.msn\..*/results\.aspx\?" shutout
SetEnvIf Referer "^http://search\.live\..*/results\.aspx\?" shutout
SetEnvIf Referer "^http://baidu\." shutout
SetEnvIf Referer "^http.*\.baidu\." shutout
order allow,deny
allow from all
deny from env=shutout

※上記タグは検索避け覚書さまから引用。
上記のように書いてください。最後は必ず改行を入れる。※上記はYahoo・グーグル・MSN・百度を指定してます。
これをメモ帳などで「htaccess.txt」として保存します。FTPなどでサーバーに転送後、.htaccessにリネームします。必ず最初の文字を.(ドット)にするのを忘れないこと。



SetEnvIfNoCase User-Agent と SetEnvIf Referer

SetEnvIfNoCase User-Agent はUAで判定する方法。
SetEnvIf Referer はリファラで判定する方法です。
SetEnvIf User-Agent "Googlebot" shutout ならば、グーグルからのロボットはシャットアウト(進入禁止)という意味になります。
増やしたい場合はUAとリファラそれぞれの、shutout前の"○○"で囲われている部分を追記するなどして下さい。