タグ

robots.txtに関するdrunkmottyのブックマーク (5)

  • robots.txtとは?設置する理由・SEO効果・書き方を解説

    ユーザーに届ける価値を徹底的に追求する マーケティングを提供します © Copyright 2022 バズ部. All rights reserved. robots.txtとは、Googleなどの検索エンジンのクローラーに対して、「どのURLにアクセスしていいか」を伝えるものである。 これを使えば、特定のページやフォルダのクロールを拒否できる(クロールさせない)ことができる。クローラーの動きを最適化することで、SEOの観点からも良い影響を得られる可能性がある。

    robots.txtとは?設置する理由・SEO効果・書き方を解説
    drunkmotty
    drunkmotty 2013/12/03
    メモメモ
  • [web制作]humans.txt ― webサイトに基本情報を設置しよう

    robots.txtとは robots.txtは、検索エンジン向けの情報を記述したテキストファイルで、書式に従って書くことで検索エンジンのクローラーにクロールして欲しくないページを知らせたりします。というか、まあ基的に出来ることはそれのみですね。例えば、 User-Agent: * Disallow: / こうrobots.txtに書くとルート以下全てのファイルへのクロールを禁止します。 決められた書式があって、それに沿った形で書かれていればクローラーはある程度いう事を聞きます。 humans.txtとは robots.txtがロボットの為の説明であるなら、humans.txtは人間の為の説明です。人間がサイトについて受け取りたい情報としては誰が書いたのか、何を使って書かれたのか、というようなことでしょうか。 そしてこのhumans.txtを設置する事を推奨するサイトもあり、面白いなーと

    [web制作]humans.txt ― webサイトに基本情報を設置しよう
  • robots.txtがないとグーグルのインデックスから消えるかも

    検索エンジンのロボットのアクセスを制御して、特定のページをインデックスさせないようにする手段の一つとして、robots.txtを用いる方法があります。 通常、特にロボットからブロックしたいコンテンツがないときは、robots.txtは不要です。 robots.txtが存在しなければ、すべてのファイルにアクセスしてインデックス(しようと)します。 ところが、robots.txtが存在しないと、Goolgebotにクローリングされず、「サイト全体」がGoogleのインデックスから消えてしまうことがあるという恐ろしい事実がGoogle Groupsのスレッドで、明らかになりました。 ウェブページを閲覧するときは、Internet ExplorerやFirefoxのようなブラウザと、ApacheやIISというウェブサーバーの間でHTTPと規格に従った通信が行われます。 HTTP通信の状態として、H

    robots.txtがないとグーグルのインデックスから消えるかも
  • 『robots.txt 作成から設置まで(まとめ)』

    ロボット排除プロトコル(以下REP)は、検索エンジンロボットのクロールやインデックスをコントロール可能な標準的仕様のことです。例えば「REPタグ(meta要素)」や「XMLサイトマップ」などがあります。 今回は、サイトレベルでクローラーに対して指示することが可能な「robots.txt」についてお話いたします。 WEBサイト運営を行っていて、いくつかのページは検索エンジンの検索対象外にしたいという場合があるかと思います。例えば、類似したコンテンツやPDF、/cgi/以下のページなどが考えられます。そのような時は、robots.txtを設置することによってクローラーをブロックすることが可能です。 robots.txtの記述ルール robots.txtは、テキストエディタで作成できます。中には以下2つを記述する必要があります。 User-Agent: 以降のルールを適用するロボット Disal

    『robots.txt 作成から設置まで(まとめ)』
  • 意外に知らない、robots meta タグの7つの正しい使い方

    [レベル:初級] 今日は、検索エンジンのロボットの動きを制御する「robots meta タグ」の記述の仕方について説明します。 robots meta タグにはいくつか種類がありますが、一般的によく使われる、noindex・nofollow・noarchiveの3つのrobots meta タグに関しては以前に詳しく説明しています。 十分に理解していないと思えば、併せて読んでください。 ちなみに日Yahoo!では、noydir の robots meta タグはサポートが終了しています。 なお原則的にGooglebotを対象にした話なので、他の検索エンジンのロボットでは違う動きをするかもしれません。 1. 複数の属性値はまとめられる 属性値が複数あるときは、ひとまとめにできます。 <meta name="robots" content="noindex" /> <meta name=

    意外に知らない、robots meta タグの7つの正しい使い方
  • 1