タグ

ブックマーク / www.suzukikenichi.com (11)

  • Googleが検索で利用している主要なAIは4つ、RankBrain/Neural matching/BERT/MUM

    [レベル: 上級] 現在検索に使っている AI人工知能)について Google は公式ブログで紹介しました。 4 つの主要な 検索 AI いくつものモデルの AIGoogle は検索に利用していますが、主要な AI は次の 4 つです。 RankBrain(ランクブレイン) Neural matching(ニューラル マッチング) BERT(バート) MUM(マム) この記事では、それぞれの AI の特徴を簡潔にまとめます。 RankBrain は 2015 年に検索に導入されました。 Google 検索に初めて格的に使われるようになったディープラーニングを用いた AI です。 概念と単語の関係性を RankBrain は理解できます。 人間なら直感的にわかってもそれまでは機械にはわからなかったような質問(クエリ)の意味をわかるようになりました。 特に、未知に言葉に強い長所が R

    Googleが検索で利用している主要なAIは4つ、RankBrain/Neural matching/BERT/MUM
    inoueyuworks
    inoueyuworks 2022/06/14
    RankBrank, Neural Matching, BERT, MUM が現在利用されている機械学習系のシグナル
  • 外部サイトへの発リンクはSEOにプラスかマイナスか?

    [レベル: 初級] 外部サイトに向けてリンクを張るのは SEO に良いことなのでしょうか? それとも悪いことなのでしょうか? 良い SEO とは良い人間がするようにすること 「SEO の秘訣をシェアする」とプロフィール欄で自己紹介しているブロガーが次のような SEO の秘訣を Twitter で投稿しました。 リンクを張って情報源を引用するのは(SEO において)良いことだ。しかしながら、自分とまったく同じキーワードをターゲットにしている別の記事にはリンクしないようにしたほうがいい。そうしないと、その記事より上位表示できないかもしれない。確信が持てない場合は、リンクに nofollow を付ければいい。そうすれば PageRank を渡すことはない。 SEO tip #87: It’s good to cite your sources by linking to them. Howeve

    外部サイトへの発リンクはSEOにプラスかマイナスか?
    inoueyuworks
    inoueyuworks 2022/06/14
    google は、良いコンテンツを上位に表示しようとしている。良いコンテンツは、良いソースに対しては nofollow しないものではある。
  • Googleは、サイトマップのpriorityを無視する。lastmodは正確なら利用する。

    [レベル: 初級] サイトマップファイルで指定できる priority をGoogleは利用しません。 一方で、lastmod は利用します。 priority はノイズ、lastmod は正確なら priority はクロールの優先度を指定する要素です。 0.0 から 1.0 までの値を指定することで、検索エンジンのクローラに重要なページを知らせます。 lastmod は、URLの最終更新日を指定する要素です。 いつ更新されたのかを検索エンジンに伝えることができます。 Google の「priority の不使用」と 「lastmod の利用」はこのブログとWeb担当者Forumコラムで何回か説明したことがあります。 ゲイリーがこのことについて最近ツイートしていたのでおさらいしておきましょう。 priority は使わない @denstopa we ignore those. It's

    Googleは、サイトマップのpriorityを無視する。lastmodは正確なら利用する。
    inoueyuworks
    inoueyuworks 2022/03/07
    google は、 `priority` を無視する。 `lastmod` は、それが信用に足りる場合には利用する。
  • robots.txtでAllowを使うのはどんな時?

    [対象: 中〜上級] 調べる機会があったので忘備録も兼ねた「robots.txtの“Allow”の使い方」の解説が今日のテーマです。 robots.txtは検索エンジンのクローラのアクセスを拒否するために使用します。 英語で「許可しない」を意味する“Disallow”という命令をアクセスを拒否するために用います。 たとえば、以下のようにrobots.txtに記述したとします(ユーザーエージェントを指定する記述は省略してます)。 Disallow: /private/ この場合は、ルートディレクトリのなかにある「private」ディレクトリに含まれているすべてのコンテンツへのクローラのアクセスをブロックできます。 ところが英語で「許可する」を意味する“Allow”という命令をrobots.txtで使用することができます。 よくあるのが次のようなrobots.txtです。 User-Agent

    robots.txtでAllowを使うのはどんな時?
    inoueyuworks
    inoueyuworks 2022/03/07
    1. Allow は google 拡張 2. google 拡張においては、 Disallow と Allow の双方がマッチした時、最長一致させた方を優先する。
  • robots.txtでのnoindexをGoogleが完全にサポート終了、2019年9月1日から

    [レベル: 上級] robots.txt の noindex 構文のサポートを終了することを Google は告知しました。 REP のインターネット標準化にともなう決定です。 機能していたが未サポートだった robots.txt の noindex クローラのクロールを拒否するために robots.txt では Disallow 構文を用います。 User-agent: * Disallow: /dontcrawl.html Google では、クロールではなくインデックスを拒否するために Noindex 構文が使えていました。 User-agent: Googlebot Noindex: /dontindex.html HTML の head セクションで使える noindex robots meta タグと同じ働きをします。 しかし、robots.txt での noindex を G

    robots.txtでのnoindexをGoogleが完全にサポート終了、2019年9月1日から
    inoueyuworks
    inoueyuworks 2022/03/02
    robots.txt での Noindex ディレクティブは無効になったので、普通に noindex のメタタグを付与する形が妥当。
  • 存在しない404エラーページがGoogleのインデックスからなかなか消えないのはなぜ?

    [対象: 全員(一部、上級)] 404のURLを自然に削除するのにGoogleはどうしてそんなに時間がかかるのですか? 上の質問にGoogleのMatt Cutts(マット・カッツ)氏が回答しました。 理論的には、404は一時的なものということが、ともするとありえる。ページがなくなったとしても後で戻ってくるかもしれない。 このページは完全になくなってもう絶対に戻ってこないと当にシグナルを送りたいなら、技術的には410と呼ばれるHTTPステータスコードがある。だけど、少なくとも2007年に最後にチェックしたときには僕たちは両方とも実質的に同じように扱っていた。 どうしてそんな時間がかかるかという題に戻ると、ウェブマスターはちょっと変わったことをすることがあるんだ。 墓穴を掘るのをときどき見ることがある。たとえば(誤って)検索結果からサイトを完全に削除してしまったり、サイトを停止するときに

    存在しない404エラーページがGoogleのインデックスからなかなか消えないのはなぜ?
    inoueyuworks
    inoueyuworks 2022/03/02
    404 は、「そのアクセスのタイミングで見つからなかった」の意味なので、本当に削除されたのかが分からない。よって、 crawler はその後も定期的にクロールしにくる。
  • HTTPステータスコードの404と410の扱いをGoogleは今は微妙に区別していた

    [対象: 上級] Googleは、HTTPステータスコードの404と410を現在は区別して取り扱うようになっているようです。 そうは言っても404と410の差異は非常に小さなものになります。 英語版のGoogleウェブマスター向け公式ヘルプフォーラムで投稿のあった質問に対してGoogle社員のJohn Mueller(ジョン・ミューラー)氏が念入りに確認した結果明らかになりました。 we are now treating 410s slightly differently than 404s. In particular, as I mentioned above, when we see a 404 we’ll sometimes want to confirm it to make sure that it’s a permanent removal. With a 410 HTTP

    HTTPステータスコードの404と410の扱いをGoogleは今は微妙に区別していた
    inoueyuworks
    inoueyuworks 2022/03/02
    410: 管理者が意図してなくなったことを示す, 404: とにかくリソースがひとまず見つからなかったことを示す; 結果、 410 の方が、 recrawl の頻度が下がる。
  • Google社員が忠告、「メインのトラフィックソースとしてDiscoverを当てにすべきではない」

    [レベル: 上級] 主要なトラフィックソースとして Discover に頼らないほうがいいと Google の John Mueller(ジョン・ミューラー)氏は忠告しました。 Discover トラフィックは 0 か 1 Discover からのトラフィックがある日を境に突然ゼロになってしまったサイト管理者がオフィスアワーでミューラー氏に相談しました。 次のようにミューラー氏はコメントします。 Discover は常に扱いにくいものだと私は考える。 ゼロかイチだという話をよく耳にする。つまり、Discover からたくさんのトラフィックを獲得するか、そうでないかのどちらかだ。 これは、どんな変化であってもしっかり目に見えるということも意味する。 ということで、私の推奨は Discover のトラフィックを当てにするなということになる。メインのトラフィックソースとしてではなく、追加的なトラ

    Google社員が忠告、「メインのトラフィックソースとしてDiscoverを当てにすべきではない」
    inoueyuworks
    inoueyuworks 2022/01/05
    Discover は、主要なトラフィックとして頼るものではない、と Google の人が言っていた。
  • Google、rel=prev/nextのサポートを終了……実は数年前からすでに使っていなかったというオチあり

    [レベル: 中級] rel="prev" および rel="next" のリンク要素のサポートを終了したことを GoogleTwitter で告知しました。 Spring cleaning! As we evaluated our indexing signals, we decided to retire rel=prev/next. Studies show that users love single-page content, aim for that when possible, but multi-part is also fine for Google Search. Know and do what's best for *your* users! #springiscoming pic.twitter.com/hCODPoKgKp — Google Webmaste

    Google、rel=prev/nextのサポートを終了……実は数年前からすでに使っていなかったというオチあり
    inoueyuworks
    inoueyuworks 2021/07/09
    rel=prev や rel=next は、 google が発表した仕様であるが、その google 自身が最早使っていないらしい
  • Core Web VitalsがGoogle検索のランキング要因に、2021年以降の導入を予定

    [レベル: 中級] Core Web Vitals(コア ウェブ バイタル)を、検索のランキング要因に組み込むことを Google はアナウンスしました。 【UPDATE (2020/11/11)】 2021 年 5 月に導入することが決定しました。 詳細はこちらで。 【UPDATE (2021/04/20】 2021 年 6 月中旬の開始に延期しました。 詳細はこちらで。 Core Web Vitals とは ウェブページにおけるユーザー体験の向上を目指して Web Vitals というコンセプトを Google は先日導入しました。 具体的には次の 3 つのユーザー体験の健全性を対象とします。 ページの表示速度 ユーザー操作への反応性 視覚要素の安定性 Web Vitals を数値化するために特に重要な指標として次の 3 つを設定しました。 Largest Contentful Pai

    Core Web VitalsがGoogle検索のランキング要因に、2021年以降の導入を予定
    inoueyuworks
    inoueyuworks 2020/06/08
    技術的な usability を測定するのが、 Core Web Vitals. それが、ranking に考慮されるようになる、という Google のアナウンスがあった。2021年以降、6ヶ月以上の事前告知でもって。
  • 海外SEO情報ブログ - 海外のSEO対策で極めるアクセスアップ術

    Googleは、小規模な独立系サイトをより良く支援するために、ランキングシステムの継続的な改善に積極的に取り組んでいる

    海外SEO情報ブログ - 海外のSEO対策で極めるアクセスアップ術
  • 1