タグ

2013年4月12日のブックマーク (2件)

  • 大手サイトのrobots.txtでわかる「検索でヒットされたくないページ」の特徴

    robots.txtとは robots.txtは、検索エンジンのクローラー(bot)に、クロールされたいページや、クロールされたくないページを教えるテキストファイルのことです。多くの検索エンジンのクローラーは、そのドメインの最上位ディレクトリに設置されたrobotst.txtを最初に読み込んで、クロールするべきページとクロールするべきでないページを取得し、それに基づいて巡回します。ただ、一部のクローラーには、このrobots.txtを無視するものもあります。 robots.txtの書き方はおよそ以下の通りです。 User-agent:(ここにbotのユーザーエージェントを記述。ワイルドカード指定も可能) Crawl-Delay:(クロールの時間間隔を指定) Disallow:(クロールされたくないページやディレクトリを指定) Allow:(Disallowで指定されたディレクトリの小階層で

    大手サイトのrobots.txtでわかる「検索でヒットされたくないページ」の特徴
  • 実名Q&Aのキクシル、事前登録開始!

    Qixil(キクシル)は様々なジャンルの詳しい人に直接質問できる、スマートフォン用実名制Q&Aサービスです。ただいま事前登録、受付中!1.キク 気軽に質問してみよう 検索ではなかなかでてこなかった情報や、答えがないような悩みでも、それぞれのジャンルの詳しい人に気軽に質問・相談ができます。 2.シル 信頼できる情報が手に入る 相手の顔や所属が分かる実名制のQ&Aなので、従来の匿名制のものに比べ、質問も回答も高い信頼性になります。 3.ツナガル 広がる人脈と知識 趣味のある人やカテゴリを「フォロー」して繋がる事で、得られる有益な情報はどんどん増えていきます。