タグ

ブックマーク / www.suzukikenichi.com (9)

  • 構造化データのガイドラインをGoogleが更新 ― JSON-LD押し、schema.orgはナレッジグラフ向け?

    [レベル: 上級] ナレッジグラフでのソーシャルプロフィール リンクの表示機能の提供や新しい構造化データテストツールの公開と同時に、構造化データに関するガイドラインをGoogleは更新しました(今のところ英語だけでの提供)。 ひととおり目を通して僕が個人的に気になったことをこの記事では書きます。 JSON-LDをプッシュ schema.orgのシンタックスとして次の3つをGoogleはサポートしています。 Microdata RDFa (RDFa Lite) JSON-LD 新しいドキュメントでは、この3つのシンタックスのなかからJSON-LDの利用を推奨しています。 まずコードのサンプルがほぼすべてJSON-LDを使ったものです。 JSON-LDに加えて、Microdataも使った例がごく一部にあるだけです ナレッジグラフに表示するイベント講演者の説明ページでは次のように説明しています。

    構造化データのガイドラインをGoogleが更新 ― JSON-LD押し、schema.orgはナレッジグラフ向け?
    terazzo
    terazzo 2015/01/20
  • rel=canonicalで正規化した重複URLが検索結果にインデックスされる理由

    [対象: 初級] rel=”canonical”で正規化しているにもかからわず、重複URLが検索結果にインデックスされることがあります。 どうしてなのでしょうか? rel=”canonical”は第2段階、第3段階の処理 11月21日と12月5日のオフィスアワーハングアウトで、GoogleのJohn Mueller(ジョン・ミューラー)氏が説明しています。 簡潔にまとめると、GooglebotがクロールしたそのURLをまず最初にインデックスしその後にrel=”canonical”が処理されることが理由です。 rel=”canonical”の処理はすぐさま実行されるわけではなく、第2段階、第3段階のステップになります。 したがって正規化前のURLが一時的に検索結果に表示される状況は普通に起こりうることです。 rel=”canonical”を認識し処理が完了すれば、rel=”canonical

    rel=canonicalで正規化した重複URLが検索結果にインデックスされる理由
    terazzo
    terazzo 2014/12/08
  • Ajaxページでは“#”(ハッシュ)よりも“pushState”を使ったほうがGoogleのSEOに楽かも

    [対象: 上級] Ajaxを利用しているページでは、Googleのクロールやインデックスを考えた場合、pushStateを使ったほうが“#”(ハッシュ)を使うよりも労力が少なくなりそうです。 下の質問にGoogleのMatt Cutts(マット・カッツ)が回答しました。 Ajaxのナビゲーションを管理するために“#!”から“pushState”に更新すべきだろうか? Googleは両方ともサポートしている。だけどpushStateは特別な設定が不要だしGoogleも余分な処理をしなくて済む。 Matt Cutts氏の答えを一言でまとめると上のようになります。 ここからは僕からの補足です。 #を使ったAjaxページをSEO対応にするのは面倒 一般的に、Ajaxを使ったページではURLに“#”が含まれます。 検索エンジンは#以下をユニークなURL(の一部)として処理しません。 そこでGoogl

    Ajaxページでは“#”(ハッシュ)よりも“pushState”を使ったほうがGoogleのSEOに楽かも
    terazzo
    terazzo 2013/03/08
  • schema.orgを使ったパンくずリストのマークアップ設定方法

    [対象: 上級] schema.orgの仕様に従ったパンくずリストの設定方法をこの記事では解説します。 パンくずリストを示すための構造化マークアップを適切に記述していなかったばかりに間違ったパンくずリストがGoogleの検索結果に表示されてしまったというトラブル事例を先日紹介しました。 パンくずリストであることを検索エンジンに伝える構造化データにはいくつか種類がありますが、ここではschema.orgを使います。 公式サイトでのガイダンスはこちらになります。 では行ってみましょう。 下のようなパンくずリストだったとします。 TOP > イタリア料理 > パスタ > カルボナーラ HTMLのソースコードはもっともプレーンな状態だと下のようになります。 <a href="/">TOP</a> > <a href="/italian/">イタリア料理</a> > <a href="/italia

    schema.orgを使ったパンくずリストのマークアップ設定方法
    terazzo
    terazzo 2013/01/30
  • Googlebotはリンクをたどってクロールしたりはしない、人間のユーザーとは違う

    [対象: 中〜上級] Googlebotがどのようにしてウェブページへのクロールを開始するかが今日のトピックです。 Googlebotに限らず検索エンジンのロボットはリンクをたどってリンク先のページへ訪問すると言われます。 しかし正確に言うと、少なくともGooglebotにおいてはこれは正しくありません。 Googlebotは、僕たち人間のユーザーとは違って文字どおりリンクをたどってその先にあるページにアクセスしたりはしないのです。 では実際にどうやっているかというと次のようなプロセスなります。 ページをクロールした際にそのページにあるリンク(URL)を発見する サイトマップで送信されたURLの情報を参照する 上の2つの情報をもとにクロールするURLのリストを作成する そのURLリストに従ってクロールを開始する 端的に言うとクロール対象のURLのリストを作成して、そのリストにあるURLに対

    Googlebotはリンクをたどってクロールしたりはしない、人間のユーザーとは違う
    terazzo
    terazzo 2012/12/21
    アクセス順の話
  • Googleがtitleタグを修正する原因が明らかになった

    [対象: 全員] 検索結果に表示されるページのタイトルが、HTMLに記述したtitleタグとは異なりGoogleによって勝手に変更されてしまうことがあります。 このブログでもGoogleによるtitleタグ書き換えについて何度か記事を書いてきました。 検索結果のタイトルをGoogleが激しく書き換える理由 Googleによるtitleタグ書き換えを防ぐ方法 Google社員に4つ質問してみた 〜 rel=prev/next、titleタグ書き換え、不自然リンクへの警告、ツイッターの影響 Google、titleタグ書き換えのアルゴリズムを改善か? titleタグが修正されてしまう原因は多少は分かっているものの、合点がいかないことも多く対処が難しいのが実情です。 ウェブマスターからの問い合わせやクレームが多いのか、ウェブマスター向け公式ブログでついにtitleタグの書き換えについて説明があり

    Googleがtitleタグを修正する原因が明らかになった
    terazzo
    terazzo 2012/01/13
  • Googleマット・カッツが推奨する“PubSubHubbub”でスクレイパーから身を守れ

    [レベル:中級] PubSubHubbubを利用した、コンテンツの更新をいち早くGoogleに伝える方法を今日は紹介します。 PubCon Lasvegas 2011でGoogleのMatt Cutts(マット・カッツ)氏は、今すぐやる価値のあることの1つとして“Fat Ping”の設定を挙げました。 “Fat Ping”とは、具体的にはPubSubHubbubを指します。 ※「パブサブハブバブ/パブサブハバブ」と発音、または略して「PuSH(プッシュ)」と呼ぶ。 PubSubHubbubは、ほぼリアルタイムにコンテンツの更新を通知する仕組みです。 以前にこのブログで解説しました。 RSS購読している時のPubSubHubbubのメリットは、新着記事をすぐに読めることです。 ですが僕たちコンテンツ発行者にとってもっと大きなメリットがあります。 それは、いち早くコンテンツをインデックスさせ、

    Googleマット・カッツが推奨する“PubSubHubbub”でスクレイパーから身を守れ
    terazzo
    terazzo 2011/11/18
  • Google, Matt Cuttsによるrel=”canonical”タグの解説ビデオ

    Matt Cutts(マット・カッツ)氏による「rel=”cannonical”」タグの解説ビデオが、GoogleがYouTubeに開設したばかりのGoogle Webmaster Help Channelにアップされました。 こちらは、プレゼンテーションに使われたスライドです。 「rel=”canonical”」タグは、まだ導入されたばかりの新しい仕組みなので、理解度を深めるために重要と思われるポイントをお伝えします。 まず、「rel=”canonical”」タグを使う前に、できる限り重複コンテンツを防ぐために実行すべきことがあります。 望んだURLだけを生成するようにCMS(Content Management System)を構成しておく ※CMSは1つのページにいろいろなURLを割り当てることがある。たとえば、カテゴリ、月別アーカイブ、プリント用ページなど。 正規化した1つのURL

    Google, Matt Cuttsによるrel=”canonical”タグの解説ビデオ
    terazzo
    terazzo 2009/03/05
  • 301リダイレクトを使った「WWWあり」と「WWWなし」の統一

    僕のところに、毎月1,2件必ず寄せられる質問があります。 それは、「wwwあり」のURLと「wwwなし」のURLに関する質問です。 もう少し正確に言うと、「wwwあり」と「wwwなし」の統合です。 同じコンテンツを示すURLが、「http://www.example.com/」と「http://example.com/」のように、2つに分かれてしまっている場合があります。 人間にとっては同じでも、検索エンジンにとってはまったく別のページになります。 被リンクが両方に張られていたら分散してしまうし、それよりもなによりも異なるURLで同じコンテンツなので、複製コンテンツとしてマークされてしまう危険も付きまといます。 来ならサイトの構築を始める前に、「wwwあり」で運用するのか、「wwwなし」で運用するのか決めるべきですが、何らかの事情で分かれてしまっていることもあるでしょう。 そこで、「ww

    301リダイレクトを使った「WWWあり」と「WWWなし」の統一
    terazzo
    terazzo 2008/05/23
    いろいろ書き方あるんだねえ/よりシンプルな例→http://www.otsune.com/diary/2008/05/20/1.html#200805201
  • 1