タグ

ブックマーク / www.suzukikenichi.com (27)

  • robots.txtでのnoindexをGoogleが完全にサポート終了、2019年9月1日から

    [レベル: 上級] robots.txt の noindex 構文のサポートを終了することを Google は告知しました。 REP のインターネット標準化にともなう決定です。 機能していたが未サポートだった robots.txt の noindex クローラのクロールを拒否するために robots.txt では Disallow 構文を用います。 User-agent: * Disallow: /dontcrawl.html Google では、クロールではなくインデックスを拒否するために Noindex 構文が使えていました。 User-agent: Googlebot Noindex: /dontindex.html HTML の head セクションで使える noindex robots meta タグと同じ働きをします。 しかし、robots.txt での noindex を G

    robots.txtでのnoindexをGoogleが完全にサポート終了、2019年9月1日から
  • Chrome 69で表示されなくなったwwwサブドメインを再び表示させる方法

    [レベル: 上級] この記事では、リリースされたばかりの Chrome 69 のオムニボックスで、URL のスキームとサブドメインを表示する方法を説明します。 【UPDATE 9/12/2018】 次のアップデートによって仕様がロールバックされた模様です。 この記事で説明している設定変更しなくても、スキームとサブドメインはデフォルトのままで以前のように表示されます。 【UPDATE 9/12/2018 (2)】 次のバージョンの Chrome 70 では www に関しては再び非表示にするようです(m は表示)。やはり設定変更しておいたほうがいいかもしれません。 詳細はこちらの記事でご確認ください。 https だけじゃなく www も Chrome 69 では表示されない! 先週お伝えしたように、Chrome 69 では、アドレスバー(“オムニボックス” と呼ぶ)に https:// の

    Chrome 69で表示されなくなったwwwサブドメインを再び表示させる方法
  • AMPがフォームをサポート、amp-formの実装でメールアドレス登録やECサイトのカラー選択などが可能に

    [レベル: 上級] AMPが正式にフォームをサポートしました。 <form> 要素と <input> 要素を使用したフォーム機能がAMPページでも利用できます。 フォームを利用するとたとえば、メールアドレス登録やサイト内検索、ECサイトでのカラー選択などユーザーからのアクションに応じた操作が可能になります。 amp-formでフォームを実装 AMPページでフォームを実装するためには、<amp-form> 拡張を使います。 コードの例です。 <form method="post" action-xhr="https://example.com/subscribe" target="_blank"> <fieldset> <label> <span>Your name</span> <input type="text" name="name" required> </label> <label

    AMPがフォームをサポート、amp-formの実装でメールアドレス登録やECサイトのカラー選択などが可能に
  • 非公開だった検索品質評価ガイドラインの最新版をGoogleが公開

    [レベル: 中級] 検索結果の品質を評価するためのガイドラインの最新版をGoogleは公開しました。 これまでのものとは変更がない部分がある一方で、新たにモバイルに関する章が加わったことが最新版の最大の特徴となっています。 検索品質評価ガイドラインとは? Googleは、ユーザーのクエリに対して関連性が高くかつ高品質なページを検索結果で返すことができているかどうかを、外部の評価者(Evaluator)に常に評価させています(評価者は普通に求人として募集されているらしい。日でさえも)。 評価者による評価は検索品質の改善のために役立てられます。 直接的にランキングを調整するためには用いられません。 どのように検索結果の品質を評価するかを説明した「General Guidelines」(一般ガイドライン)というマニュアルが評価者に提供されます。 このマニュアルは原則的に評価者だけに配布されます

    非公開だった検索品質評価ガイドラインの最新版をGoogleが公開
  • スマホユーザーの検索行動を変えるか? Now on Tapが日本語でも利用可能に

    [レベル: 中〜上級] Googleは、日語でのNow on Tapの提供を開始しました。 Now on Tapのおさらい Now on Tap(ナウ・オン・タップ)は、Android OSのバージョン6、Marshmallow(マシュマロ)で利用できる新しい機能です。 ホームボタンを長押しすることで、その状況に合わせて適切な情報を提供する“カード”を提供します。 今年5月のGoogle I/O 2015で発表されました。 1週間後に開催されたSMX Advancedでも紹介されています。 僕はこちらには参加していました。 Now on Tapに詳しくなければ、レポート記事を先に読んでもらいたいところです。 発表から約5か月後の10月にまず英語からNow on Tapがリリースされました。 その1か月後に2つ目の対応言語として日語でもNow on Tapが利用できるようになりました。

    スマホユーザーの検索行動を変えるか? Now on Tapが日本語でも利用可能に
  • 静的なHTMLサイトをモバイル対応サイトに変換する手順

    [レベル: 初・中・上級] 英語版のGoogle公式ヘルプフォーラムでGoogle社員のZinebさんが、CMSへの移行が難しい静的なHTMLサイトをモバイルフレンドリーなサイトに変換する際に考慮すべきことをアドバイスしました。 参考になるので日語に訳して紹介します。 なおリンク先ページは日語のものも英語のものもあります。 静的サイトをモバイルフレンドリーに転換する方法 Chromeのデバイスエミュレーションモード(※このブログでの解説はこちら)を使って、異なるスクリーンサイズと解像度でウェブサイト(がどのように表示されるか)をテストする。 viewport(ビューポート)を設定する。このタグによって、ページのコンテンツをさまざまなスクリーンで拡大縮小できるようになる。ビューポートがないと、PCで見たときのようにコンテンツが表示されてしまう。 <font>タグや他のインラインHTML

    静的なHTMLサイトをモバイル対応サイトに変換する手順
  • Google、ブログ検索を終了か? “tbm=blg”パラメータで引き続き利用可能 => ニュース検索のフィルタへ移動

    [対象: 中級] Googleは、Googleブログ検索の提供を終了したようです。 しかし専用のパラメータを付けて検索することで、ブログだけを対象にした検索を引き続き利用可能です。 Googleブログ検索ページは利用不可 www.google.co.jp/blogsearch や www.google.com/blogsearch にアクセスすると404エラーページが返ってきます。 blogsearch.google.co.jp や blogsearch.google.com にはアクセス可能ですがロゴが表示されないおかしなページです(https:// でアクセスすると404)。 検索してもブログ検索ではなくウェブ検索の結果が返ってきます。 検索結果ページの「もっと見る」オプションからも「ブログ」を選択できなくなっています。 どうやらサービスの提供終了の公算が強そうです。 ソーシャルでの言

    Google、ブログ検索を終了か? “tbm=blg”パラメータで引き続き利用可能 => ニュース検索のフィルタへ移動
  • 20万以上のURLを誤ってrobots.txtでブロック、対処策をマット・カッツがアドバイス

    [対象: 中級] WebmasterWorldフォーラムの有料エリアに投稿された質問にGoogleのMatt Cutts(マット・カッツ)氏がアドバイスしました。 Matt Cutts氏がWebmasterWorldに姿を表すのは非常に珍しいことです。 特に最近では極めて異例のことで、Search Engine Roundtableによれば実に3年ぶりだそうです。 久しぶりに登場したMatt Cuttsがどんなトラブルに対してどんなアドバイスを与えたのかをこの記事で紹介します。(有料エリアでのやりとりですが、一部だけなのでまぁいいでしょうw) 投稿者の質問 大量のURLを誤ってrobots.txtでブロックしたことが原因で検索トラフィックが減ってしまった。一刻も早く回復させたい。 どうしたらいいか? これが投稿者の相談です。 具体的には、次のような状況でした。 とても大規模なサイトで、CM

    20万以上のURLを誤ってrobots.txtでブロック、対処策をマット・カッツがアドバイス
  • schema.orgを使ったパンくずリストのマークアップ設定方法

    [対象: 上級] schema.orgの仕様に従ったパンくずリストの設定方法をこの記事では解説します。 パンくずリストを示すための構造化マークアップを適切に記述していなかったばかりに間違ったパンくずリストがGoogleの検索結果に表示されてしまったというトラブル事例を先日紹介しました。 パンくずリストであることを検索エンジンに伝える構造化データにはいくつか種類がありますが、ここではschema.orgを使います。 公式サイトでのガイダンスはこちらになります。 では行ってみましょう。 下のようなパンくずリストだったとします。 TOP > イタリア料理 > パスタ > カルボナーラ HTMLのソースコードはもっともプレーンな状態だと下のようになります。 <a href="/">TOP</a> > <a href="/italian/">イタリア料理</a> > <a href="/italia

    schema.orgを使ったパンくずリストのマークアップ設定方法
  • 30分以内に新しいコンテンツをGoogleにインデックスさせる方法

    [対象: 初級] 新しく公開したページを30分位内にGoogleにインデックスさせるにはどうしたらいいか? こんな質問がWebmasterWorldに投稿されました。 なぜ30分以内にインデックスさせたいんだ?という疑問も出てきますが、質問者は理由にまでは触れていないのでここでは置いておくとしてこの要望を叶えるにはどんな手段が考えられるでしょうか。 インデックスのスピードはさまざまな要因に依存しますね。 このスレッドに書き込まれた返信のコメントと僕の知識・経験から考えると主だった要因は次のようになりそうです。 更新頻度 Ping送信/RSS配信 サイトマップ送信 Fetch as Googleからのインデックス送信 サイトのオーソリティ サイトのタイプ ソーシャルメディアでの共有 それぞれを簡潔に説明します。 Googleのインデックスに影響を与える主だった要因 更新頻度 月に1回更新する

    30分以内に新しいコンテンツをGoogleにインデックスさせる方法
  • Ajaxコンテンツを検索エンジン(Google)にクロール・インデックスさせる方法

    [対象: 上級] Ajax利用したコンテンツをGoogleにクロール可能・インデックス可能にさせるための設定方法を今日は取り上げます。 すでにAjaxを理解している人向けなのと自分へのメモを兼ねているのでAjaxに対する細かな説明や用語解説は省きます。 「#」(ハッシュ)がURLに含まれている場合、#以下のURLをGoogleを含む検索エンジンはインデックスしません。 A. http://www.suzukikenichi.com/ajax.html#abc B. http://www.suzukikenichi.com/ajax.html#xyz 上のAとBはどちらも、http://www.suzukikenichi.com/ajax.html というURLをクロールしてインデックスするだけです。 #付きのURLをインデックスすることはありません(終わりに補足説明あり)。 Ajaxでは、

    Ajaxコンテンツを検索エンジン(Google)にクロール・インデックスさせる方法
  • 2012年1月にGoogleが実行した検索クオリティ改善×17

    [対象: 全員] 2012年1月に実行した検索品質向上のための17個の改善をGoogleは公表しました。 2011年12月のときと同じようにコードネームが与えられたものはその名前も付いています。 順に紹介します。 より最新の結果 [ローンチ・コードネーム: nftc] 11月に導入したフレッシュネス・アップデートをマイナー更新し、さらに新しく関連性のある結果を出すようにした。 オートコンプリートのスピードアップ [ローンチ・コードネーム: Snappy Suggest / プロジェクト・コードネーム: Suggest] オートコンプリートで予測する検索キーワード候補の提案をずっと速くした。 オートコンプリートのスペル訂正 [ローンチ・コードネーム: Trivial / プロジェクト・コードネーム: Suggest] オートコンプリートで使われるスペル訂正(綴り間違い修正)を改善し、検索で実

    2012年1月にGoogleが実行した検索クオリティ改善×17
  • robots.txtのファイルサイズは最大500KBまで

    [対象: 全員] robots.txtのファイルサイズは500KB以内に収めるべきで、それ以降の行は省略されてしまい望んだように読み取ってもらえなくなるかもしれない。 上のように、GoogleのJohn Mueller(ジョン・ミューラー)氏がGoogle+で投稿を共有しました。 「500KBを超えるテキストファイルってどんなだ?」を疑問に思わざるを得ませんが(ちなみに僕のは4KB)、きわめて稀ではあるけれど実際に存在するそうです。 robots.txtを自動生成するCMSがあることをミューラー氏は例に挙げています。 あるいは超巨大なサイトで、ワイルドカードを使わずに1つ1つのURLを記述していったらそうなってしまうことがひょっとしたらありそうです。 特別心配するほどでもない情報ですが豆知識ということで紹介しました。

    robots.txtのファイルサイズは最大500KBまで
  • “ページ レイアウト アルゴリズム”をGoogleが改良、Above the foldに広告が多いサイトの評価を下げる

    [対象: 全員] ページのレイアウトを理解するアルゴリズムを改良したことをGoogleは公式アナウンスしました。 このページ レイアウト アルゴリズムの変更により、Above the Fold(アバブ・ザ・フォールド、スクロールせずに見える画面の範囲、ファーストビュー)にメインコンテンツがほとんどなかったり広告が多すぎるサイトの評価が下がります。 全検索に与える影響は1%未満で、100件の検索に1つ影響を与えるか与えないかくらいです。 ひょっとしたら、検索結果の変化に気付くユーザーがいるかもしれません。 ページ レイアウト アルゴリズムは自動化されています。 もしこのアルゴリズムに影響を受けてランキング下がってしまったと自分で判断して修正した場合は、修正を評価するためにサイト内の十分な量のページを再クロールして処理した後に変更が自動的に反映されます。 反映までにかかる時間は、サイトのページ

    “ページ レイアウト アルゴリズム”をGoogleが改良、Above the foldに広告が多いサイトの評価を下げる
  • FacebookのコメントをGoogleがインデックスし始めた

    [レベル:上級] Javascriptによって外部サイトに表示されているFacebookのコメントをGoogleがインデックスし、そのサイトのコンテンツとして検索結果に表示し始めていることを、Digital Inspiration が発見しました。 Facebookが提供するコメントプラグインを利用すると、Facebookへの投稿とあなたのサイトへのコメントを連携させることができます。 あなたのブログに書き込まれたコメントがそのコメントを書き込んだユーザーのFacebookにも反映されます。 反対に、Facebookであなたのブログ記事についてコメントするとそのコメントはあなたブログのコメント欄にも現れます。 完全に双方向になっているわけですね。 だだしコメントとして書き込まれたテキストはあなたのサイトに存在しているわけではありません。 HTMLの中にコメント文がテキストとして存在するわけ

    FacebookのコメントをGoogleがインデックスし始めた
  • Google検索がSSL通信をデフォルトに、キーワード取得ができなくなる

    [レベル:全員] Googleは、通信の機密性・安全性を確保するためにGoogle検索と検索ユーザーの通信をSSLによって標準状態で暗号化することを発表しました。 2010年5月から、SSL通信で保護された検索をGoogleは試験的に公開していました。 今後数週間かけて、SSL検索を標準のウェブ検索として採用していきます。 ただしSSL検索が自動的に適用されるのはGoogleアカウントにログインしているユーザーで、Google.comを利用する場合に限られます。 ログインユーザーが http://www.google.com にアクセスすると https://www.google.com にリダイレクトされるようになります。 通信を暗号化することにより第三者に情報を盗み見られたり改ざんされたりすることを防ぐことができるので好ましい変更であることは間違いないのですが、1つ大きな問題が出てきま

    Google検索がSSL通信をデフォルトに、キーワード取得ができなくなる
  • Google +1ボタンはrobots.txtを無視する

    [レベル:中級] Googleのクローラのコンテンツへのアクセスを拒否するときはrobots.txtを使います。 しかし+1ボタンを設置しているページで、その+1ボタンが押されたときはGoogleは、robots.txtのブロック指定を無視して、クローリングし検索結果に表示することがあり得るそうです。 GoogleエンジニアのJenny Murphy(ジェニー・マーフィー)さんが、Google公式ヘルプフォーラムで2度に渡ってこれまでに説明しました。 Google+のヘルプページの+1ボタン セクションに次のように書かれています。 Does +1 affect how Google crawls my site? When you add the +1 button to a page, Google assumes that you want that page to be publi

    Google +1ボタンはrobots.txtを無視する
  • クローラをブロック“しない”時のrobots.txtの設定

    [レベル:初級] 検索エンジンのクローラをブロックする必要がない時のrobots.txtの設定は、次の3つのうちどれが適切か? 何も書いていないrobots.txtを設置する 下の記述を書く User-Agent: * Disallow: robots.txtそのものを置かない robots.txtについて、上の質問にGoogleのMatt Cutts(マット・カッツ)氏がビデオで回答しました。 1つ目か2つ目のどちらかが適切だろう。3つ目だと、ひょっとしたらほんの少しだけど危険かもしれない。 robots.txtを置いていないとサーバーのホスティング会社が404を埋めるために何かしてしまい、おかしな挙動を起こすことがあるからだ。 ほとんどの場合僕たちはうまく対処できるけど、1%といえど危険がないわけじゃない。 だからブランクのrobots.txtを置くか、すべてのアクセスをクローラに許可

    クローラをブロック“しない”時のrobots.txtの設定
  • スクレイピングサイト(コピーサイト)の発見にGoogleが助けを求める

    [レベル:全員] スクレイピングによる問題を発生させている事例についてGoogleにレポートを送信してほしいと、Googleのスパムチームの長であるMatt Cutts(マット・カッツ)氏がツイートで協力を求めました。 スクレイパーがあなた(のサイトの順位)を下げているとしたら、見つけたブログスクレイパーを僕たちに教えてほしい。goo.gl/S2hIh テストのための実データを必要としているんだ。 リンク先にアクセスするとスクレイパーをレポートするフォームに着地します。 このフォームから、問題を発生させているスクレイピングサイトをGoogleに通報できます。 特に求めているのはブログのスクレイパーとのことです。 “Scrape”(スクレイプ)というのは、聞き慣れた日語で表現するなら“コピー”のことです。 “Scraping Sites”(スクレイピング・サイト)や“Scraper Sit

    スクレイピングサイト(コピーサイト)の発見にGoogleが助けを求める
  • Googleリアルタイム検索、Google+のデータを取り込んで復活間近か

    [レベル:全員] Googleのリアルタイム検索が、Google+と他のソーシャルメディアのデータを取り込んで近いうちに復活するかもしれません。 Mashableによると、GoogleフェローのAmit Singhal(アミット・シンガル)氏は、Googleがリアルタイム検索の終了を決定した理由を次のようにコメントしたそうです。 そのプロダクトは十分な価値を提供していなかった。 そしてリアルタイム検索はいつ復活するのかという問いに対して次のように続けました。 Googleの検索チームはそのプロダクトを元に戻すために一生懸命に取り組んでいるところだ。Google+と他のソースからのデータを追加するテストを行っている。 リアルタイム検索の配信にTwitterのデータがなくてはならないものだとGoogleはもう感じていないようにも思えたそうです。 GoogleTwitterとの契約を更新せず、

    Googleリアルタイム検索、Google+のデータを取り込んで復活間近か
    amourkarin
    amourkarin 2011/08/05
    復活期待しておく