並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 127件

新着順 人気順

pagerankの検索結果1 - 40 件 / 127件

  • 大学で読んだ情報科学関連の教科書 - ジョイジョイジョイ

    先日、博士(情報学)になりました。学部と大学院をあわせた 9 年間で読んだ情報科学関連の教科書・専門書を思い出を振り返りつつここにまとめます。私は授業はあまり聞かずに独学するタイプだったので、ここに挙げた書籍を通読すれば、大学に通わなくてもおおよそ情報学博士ほどの知識は身につくものと思われます。ただし、特に大学院で重要となる論文を読み書きすることについては本稿には含めておりません。それらについては論文読みの日課についてや論文の書き方などを参考にしてください。 joisino.hatenablog.com 凡例:(半端)とは、数章だけ読んだ場合か、最後まで読んだものの理解が浅く、今となっては薄ぼんやりとしか覚えていないことを指します。☆は特におすすめなことを表します。 学部一年 寺田 文行『線形代数 増訂版』 黒田 成俊『微分積分』 河野 敬雄『確率概論』 東京大学教養学部統計学教室『統計学

      大学で読んだ情報科学関連の教科書 - ジョイジョイジョイ
    • 【図解】グーグルのリンク評価20の原則【2019年版】(前編#1~#10) | Moz - SEOとインバウンドマーケティングの実践情報

      22年前、グーグルの創業者らがPageRank(ペイジランク)を発明し、それ以降のウェブが変わった。既存のランキングアルゴリズムと比べてPageRankが大きく違っていたのは、次の点だ: ウェブ上のリンクを票と見なす。最初の段階では、票はすべて平等だ。 得票数が多いページほど重要度が増す(そして、より上位に表示される)。 重要なページほど票の重要度が増す。 しかしグーグルは、そこで止まらなかった。さらに、 アンカーテキストトピックモデリングコンテンツ分析トラスト(信頼)シグナルユーザーエンゲージメントなど、検索結果をよりいっそう改善する要素を取り入れたのだ。 リンクはもはや平等ではない。いや、平等とはほど遠い。 ランド・フィッシュキンがこの記事のオリジナルバージョンを公開したのは、2010年だ。はっきり言って、それはSEOの世界を震撼させた。ここでは、彼のオリジナル記事から非常に多くの部分

        【図解】グーグルのリンク評価20の原則【2019年版】(前編#1~#10) | Moz - SEOとインバウンドマーケティングの実践情報
      • Pythonで100万ドキュメントオーダーのサーチエンジンを作る(PageRank, tfidf, 転置インデックスとか) - にほんごのれんしゅう

        検索エンジンを何故作ってみたかったか もともとこのブログのコンセプトのNLP的なことで、情報を整理してなにか便利にしたかった(Googleと同じモチベーションの世界の情報を整理する) 4年前にほぼ同じシステムを作ろうとしたとき、500万を超える大量のインデックスを検索するシステムは、数学的な理解度が十分でない+エンジニアリング力が伴わないなどでギブアップした背景があり、今回再チャレンジしたくなった ほぼすべての機能をpure python(+いくつかの例外はある)で実装して、世の中の ソフトウェアを使うだけ の検索エンジンをやってみたなどではなく、実際に理解して組んでみることを目的としたかった 依存パッケージと依存ソフトウェア GitHubのコードを参照してください 様々なサイトを巡回する必要があり、requestsが文字コードの推論を高確率で失敗するので、nkf をlinux環境で入れて

          Pythonで100万ドキュメントオーダーのサーチエンジンを作る(PageRank, tfidf, 転置インデックスとか) - にほんごのれんしゅう
        • ロシアの検索エンジン「Yandex」のアルゴリズムが流出。GoogleのSEO対策でも使えるのか?|ブルマ@SEO

          こんにちはブルマ@SEOです。 フォローしてくれたら泣いて喜びます。 1/28にSEO業界に激震が走った。 ロシアの検索エンジン「Yandex」の独自ソースコードが流出した。 You probably heard about Yandex, it’s the 4th biggest search engine by market share worldwide. Yesterday proprietary source code of Yandex was leaked. The most interesting part for SEO community is: the list of all 1922 ranking factors used in the search algorithm [🧵THREAD] pic.twitter.com/6x82AAmbON — Alex Bu

            ロシアの検索エンジン「Yandex」のアルゴリズムが流出。GoogleのSEO対策でも使えるのか?|ブルマ@SEO
          • Googleがrel=nofollow属性の扱いを変更。sponsored属性とugc属性を新たに導入

            [レベル: 上級] rel="nofollow" 属性の扱いを Google は変更しました。 従うべき命令としてではなく、手がかりのためのヒントとして利用するようになります。 また、nofollow の派生型として、link タグと用いる 2 種類の rel 属性を新たに導入しました。 nofollow 属性の扱いを変更 rel="nofollow" 属性が付いたリンクを Google はこれまでランキング要因としては利用していませんでした。 PageRank を渡すこともないしアンカーテキストも評価しません。 そして、nofollow 属性を命令 (Directive) として Google は扱い、必ず従ってきました(nofollow リンクが評価されている状況があるという分析もあるけれど、公式見解では nofollow リンクはランキング要因から除外されることになっている)。 今後

              Googleがrel=nofollow属性の扱いを変更。sponsored属性とugc属性を新たに導入
            • 【SEOお宝情報】検索ランキングアルゴリズム主要19種一覧(グーグル公式)【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ

              「グーグルが検索ランキングに利用している主要なアルゴリズムを19種類、挙げて説明してみてください」―― こんな問いに胸を張って答えられるようになる公式情報が登場した! これはSEO担当者にとってはお宝だ。 今回は、ピックアップの検索アルゴリズム一覧以外にも、大ネタではないが小ネタでもない中堅レベルの興味深いトピックが多い。 「上位表示できるコンテンツの秘訣」「SEOでもサイテーションは評価されるか」「作った良コンテンツを知ってもらうには」「日付表記変更の原則」などなどなど、どれも見逃すともったいないネタだ。 海外SEO情報ブログの掲載記事からの情報も、今回は「Search Central Live Singapore 2022」からのネタとして3つ紹介している。 今週も、あなたのSEO力を底上げするネタを効率良く吸収してほしい。 グーグルで上位表示できるコンテンツ作成の秘訣✕3リンクなしの

                【SEOお宝情報】検索ランキングアルゴリズム主要19種一覧(グーグル公式)【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ
              • Secrets from the Algorithm: Google Search’s Internal Engineering Documentation Has Leaked

                Google, if you’re reading this, it’s too late. Ok. Cracks knuckles. Let’s get right to it. Internal documentation for Google Search’s Content Warehouse API has leaked. Google’s internal microservices appear to mirror what Google Cloud Platform offers and the internal version of documentation for the deprecated Document AI Warehouse was accidentally published publicly to a code repository for the c

                  Secrets from the Algorithm: Google Search’s Internal Engineering Documentation Has Leaked
                • サーバーメンテナス時に503を返す

                  自身のサイトがメンテナンス時に、どのようなページを表示しているか、把握してますでしょうか。 特に複数サイトを担当している方や、ドメイン内に複数システムが組み込まれているサイト、いつも深夜にメンテナンスしている場合などに、メンテナンス時に表示されるページの状態を把握できていないことがあると思います。 Google検索セントラルブログでは、メンテナンス時には503のhttp headerステータスを返すように推奨しています。 HTTP ステータス コードとして 503 (Service Unavailable) を返すように設定した方が、検索エンジンのクローラに対してダウン タイムが一時的であることを伝えることができます。 https://developers.google.com/search/blog/2011/01/how-to-deal-with-planned-site-downti

                    サーバーメンテナス時に503を返す
                  • 検索エンジン向けサイトマップはSEOに逆効果になる場合もある - ブログ - 株式会社JADE

                    SEO でよく語られるサイトマップは、一般的には www.example.com/sitemap.xml などのように保存されて公開される、XML やテキストファイルなどの形式で記述されたページ一覧ファイルです。 ここでは、通常の Web ページ上で人間が見る「サイトマップ」と区別するため、検索エンジン等向けで人間が直接読むことを想定しない HTML ではないサイトマップを「XML サイトマップ」として呼称します。 一般的には XML サイトマップは SEO のベストプラクティスとして扱われています。しかしそれは正しい認識ではありません。必ずしも全ての環境でのベストプラクティスではないのです。XML サイトマップを無配慮に公開することは、SEO 上のデメリットになりえます。 実際、私たちが特定サイトの SEO のアドバイスに入る際、既に公開されている XML サイトマップを撤去していただく

                      検索エンジン向けサイトマップはSEOに逆効果になる場合もある - ブログ - 株式会社JADE
                    • Twitter の検索システム、Earilybirdの論文を読む

                      2023-04-29 前回の記事の続き1で、Twitter の検索システムシリーズ第 2 弾です。 Earlybird とは?Twitter の検索システムであり、 Apache Lucene をベースにした、リアルタイム検索システム。 論文はここで、 Blog 記事は The Engineering Behind Twitter’s New Search Experienceは 2011 年に公開されている。 TODO: 論文に書かれず、Blog 記事にのみ書かれている内容もあったので読んで追記しておく Web 検索はある程度成熟してきた分野だが、SNS のリアルタイム検索はまだ 2011 年当時いまだ未成熟で未開拓な分野Twitter で新たに開発したのが、 Earlybird と呼ばれるリアルタイム検索に特化した検索エンジンLucene の NRT 機能が導入され始めたのが、2011

                        Twitter の検索システム、Earilybirdの論文を読む
                      • 2020年以降に必要なSEOの考え方をまとめたチェックリスト41項目 - SEO Japan|アイオイクスのSEO・CV改善・Webサイト集客情報ブログ

                        無料で資料をダウンロード SEOサービスのご案内 専門のコンサルタントが貴社サイトのご要望・課題整理から施策の立案を行い、検索エンジンからの流入数向上を支援いたします。 無料ダウンロードする >> もはや常識となりつつありますが、SEOのプロジェクトを行う際の対象範囲は、年々(日増し?)に増えていきます。 各施策についての知識はありつつも、優先順位は適切なのか、抜け漏れはないのか、常に確認を行うことが大事です。そのような場合、対象範囲を網羅したチェックリストがあれば非常に便利です。 今回はSEMrushが作成した、41の項目をまとめたチェックリストを紹介いたします。SEMrushの機能紹介が多めですが、内容も有用なものとなっています。 Googleの検索結果の上位に表示され、オーガニックのトラフィックを増加させる手助けとなるSEOのチェックリストをお探しだろうか。 我々は2020年にSEO

                          2020年以降に必要なSEOの考え方をまとめたチェックリスト41項目 - SEO Japan|アイオイクスのSEO・CV改善・Webサイト集客情報ブログ
                        • 【図解】グーグルのリンク評価20の原則【2019年版】(後編#11~#20) | Moz - SEOとインバウンドマーケティングの実践情報

                          リンクの原則#11 グーグルは、スパムリンクや低品質リンクの価値を引き下げているウェブ上には膨大な数のリンクがあるが、実際のところグーグルはその大多数を無視している可能性が高い。 グーグルの目的は、エディトリアルリンク(編集リンク)に重点を置くことだ。「エディトリアルリンク」とは、リンクを受ける側のサイトでは制御できず、他のユーザーが意図して配置する独自のリンクなどを指す言葉だ。 ペンギン4.0以降、グーグルはアルゴリズムによって「これらの基準を満たしていないと思われるリンクは単に無視するだけ」だとほのめかしている。たとえば、次のようなリンクがそうした扱いを受ける: ネガティブSEOとして張られたリンクリンクプログラムで生成されたリンクとはいえ、グーグルが本当に低品質のリンクをすべて無視しているかどうかについては、多くの議論がある。低品質のリンクが張られたサイトは実際に被害を受けかねないこ

                            【図解】グーグルのリンク評価20の原則【2019年版】(後編#11~#20) | Moz - SEOとインバウンドマーケティングの実践情報
                          • データサイエンス設計マニュアル

                            本書は広い視野からデータサイエンス全体を俯瞰し、問題を解決する上で重要なことは何か、その設計原則に焦点を当てた入門書です。データを収集、分析、解釈するためのシステムを構築するために必要な、確率・統計の基礎から線形代数、スコアとランキング、統計分析、データマンジング、可視化、数学的モデル、回帰、機械学習まで広範囲にわたってカバーするだけでなく、思考プロセスも重視します。著者は、ニューヨーク州立大学ストーニーブルック校で長年にわたりコンピュータサイエンス教育に携わってきた計算機科学者で、統計学と計算機科学の枠を越えた新しい学問としてデータサイエンスを捉え直し、著者独自のアプローチでデータサイエンスの本質に迫ります。 1章データサイエンスとは 1.1 計算機科学、データサイエンス、リアルサイエンス 1.2 データについての興味深い問い 1.3 データの性質 1.4 分類と回帰 1.5 データサイ

                              データサイエンス設計マニュアル
                            • 論文の読み方 [和訳] - Qiita

                              はじめに この文章のターゲット この記事は、S. Keshav 著の How to Read a Paper という論文をラフに日本語に訳してまとめたメモです。基本的な文章の流れや内容はそのままですが、ところどころ改変 (表現を柔らかくフランクにしたり削ったり) していますので、原論文と見比べながら読んでください。 論文の読み方がイマイチ分からない人が読むと絶対に何かの発見があると思います。 論文の読み方 和訳 タイトル、著者 タイトル: How to Read a Paper バージョン: 2016年2月17日 著者: S. Keshav 所属: David R. Cheriton School of Computer Science, University of Waterloo Waterloo, ON, Canada Introduction 研究者であれば、毎年ものすごい時間を割

                                論文の読み方 [和訳] - Qiita
                              • 大規模Webサイトの内部リンク最適化のための11個のポイント - SEO Japan|アイオイクスのSEO・CV改善・Webサイト集客情報ブログ

                                あくまで一般論ではありますが、Webサイトの規模が大きくなればなるほど、SEOの難易度も増加していくものです。 いわゆるデータベース系のサイトでは、アーキテクチャやユーザビリティ、クロールとインデックスなど、見るべき項目は多岐にわたります。 テクニカルな領域の難易度が高くなる状況ではありますが、その分、基本的なことを見落としてしまうこともあるかと思います。 その中でも、「内部リンクの最適化」に焦点をあてた、Search Engine Journalの記事を紹介いたします。 大規模なWebサイトの場合、内部リンクの構築には特別な注意を払うべきだ。 この記事では、内部リンクの最適化のためのシンプルなチェックリストとどこから始めるべきかを紹介しよう。 大規模なWebサイトにおける内部リンクは、その価値に見合うほど、愛され、注目され、最適化されているわけではない。 内部リンクは、Webサイトの権威

                                  大規模Webサイトの内部リンク最適化のための11個のポイント - SEO Japan|アイオイクスのSEO・CV改善・Webサイト集客情報ブログ
                                • Google、検索アルゴリズムの更新「Helpful Content Update」を実施 検索エンジンファーストで作成されたコンテンツを標的 - SEMリサーチ

                                  人間ではなく検索エンジンのために作成された、役に立たないコンテンツや満足度が低いコンテンツの評価を調整することを目的とした検索アルゴリズム更新「Helpful Content Update」(HCU)の情報について随時更新していきます。 一般的な情報は本ページに、詳細解説は SEMリサーチ+(プラス、有料版)に掲載します。 目次 Helpful Content Update 概要 アルゴリズム更新の実施時期 対象検索エンジンと言語 HCU 対象範囲 HCUが標的とするコンテンツの種類 HCU 検出の仕組み 「低品質」と判定されたときの影響範囲と期間 HCU に備えたウェブマスターの対応 ユーザーファーストのコンテンツ作成に注力する 以下の質問にすべて「はい」と自信を持って答えられるか HCU に関する注意事項 (2022.08.20更新) テクニカルな”抜け道”を探そうという発想が生まれた

                                    Google、検索アルゴリズムの更新「Helpful Content Update」を実施 検索エンジンファーストで作成されたコンテンツを標的 - SEMリサーチ
                                  • 人気ブログサービスMediumが検索トラフィック激減! ブランド構築に他社サービス依存は危険【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ

                                    英語圏で人気のブログサービスMedium(ミディアム)全体の検索トラフィックが激減し、情報発信をMediumに依存していた企業にも大ダメージとなった。企業の担当者がここから学ぶべきこととは? ほかにも、グーグル社員による「コア アルゴリズム アップデート」「中古ドメイン名」「グーグルの信頼性と安全性」に関する解説や、その他のSEO情報を、今年もまとめてお届けしていく。 コアアップデートで上がったサイトと下がったサイト、その違いをグーグル社員が指摘中古ドメイン名「僕ならやらない、リスクあるから」グーグル金谷氏が断言グーグル検索が過去5年で最大の飛躍!? BERT採用で言語理解能力が格段に向上巨大プラットフォームとしてグーグルが考える信頼性と安全性非セキュアなページからのリンクはオーソリティやPageRankが少ない!?トラフィックが減ったサイトからのリンクは否認すべきか?.com や .jp

                                      人気ブログサービスMediumが検索トラフィック激減! ブランド構築に他社サービス依存は危険【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ
                                    • にじさんじの配信者の類似性をチャットデータからネットワークグラフにして分析する - Qiita

                                      にじさんじの配信者間で"似ている"配信者はどういう人たちか 唐突ですが、一週間前は文化の日でしたね。せっかくだったので、文化らしいことをしたいなと思い、youtube data apiを使って遊んでみることにしました。 youtube のデータを使ってなにかしよう、となったとき、他の人はどういう分析をするんでしょうか。最近よくみるデータとしてはスパチャランキング・登録者数推移の予測などが思い当たります。 そしてまた唐突に語り始めるのですが、僕はvtuberの配信をラジオ代わりに流していることが多く、いわゆるvtuberのオタクです。オタクのあり方には諸説ありますが、僕はラジオ代わりということもあり雑談配信やマイクラ配信を流していることが多いです。「にじさんじ」の配信を見ることが多い気がします。 さて、「にじさんじ」は言わずとしれた大所帯グループです。約100人の配信者が一つの箱に所属してい

                                        にじさんじの配信者の類似性をチャットデータからネットワークグラフにして分析する - Qiita
                                      • ロシア最大の検索エンジン「Yandex」のソースコード流出で検索ランキングの決定要因が明らかに

                                        ロシア最大の検索エンジンであり、世界でも第4位の検索エンジン「Yandex」からソースコードが流出しました。ハッカーによる攻撃ではなく、元従業員がGitリポジトリを盗み出したものだとのことで、個人情報は含まれていませんが、アルゴリズム内で用いられている1922の検索ランキング決定要因が明らかになっています。 You probably heard about Yandex, it’s the 4th biggest search engine by market share worldwide. Yesterday proprietary source code of Yandex was leaked. The most interesting part for SEO community is: the list of all 1922 ranking factors used in t

                                          ロシア最大の検索エンジン「Yandex」のソースコード流出で検索ランキングの決定要因が明らかに
                                        • 【速報】リプライはいいねの54倍の効果!? 遂にTwitterがアルゴリズムを公開‼️ 要約+全文翻訳+今後の対応策を徹底解説。(総勢8000文字)|チャエン | 重要AIニュースを毎日発信⚡️

                                          【速報】リプライはいいねの54倍の効果!? 遂にTwitterがアルゴリズムを公開‼️ 要約+全文翻訳+今後の対応策を徹底解説。(総勢8000文字) 遂に米Twitter社は3月31日(現地時間)、予告通りプラットフォームを構成するソースコードの一部をGitHubで公開しました。本日はその内容を詳細に解説していきます。 主にはタイムラインの『おすすめ』欄に出てくるアルゴリズムの話です。(フォローしていないおすすめのツイートが出るタイムラインのことです。) 1.要約 では、早速要約から見ていきます。 1.1 アルゴリズムハック方法 ⭕️ポディシブ要素 フォローは少ない方が良い(フォロー・フォロワー比率が重要) 投稿に2分以上滞在:「いいね」×22倍の効果 投稿を経由してプロフィールにアクセス後に、他の投稿にいいねやリプライをされる場合:「いいね」×24倍の効果 投稿にリプライされる場合:「い

                                            【速報】リプライはいいねの54倍の効果!? 遂にTwitterがアルゴリズムを公開‼️ 要約+全文翻訳+今後の対応策を徹底解説。(総勢8000文字)|チャエン | 重要AIニュースを毎日発信⚡️
                                          • グラフってこんなにすごい!深層学習との融合をレビュー

                                            3つの要点 ✔️ GNNの表現力の強さから、急速にアプリケーションが進んでいる。 ✔️ GNNの柔軟かつ複雑な構造への、従来深層学習手法の展開についてのレビュー ✔️ 一方で、深層学習に共通、グラフに固有の課題も継続中 Graph Neural Networks: A Review of Methods and Applications written by Jie Zhou, Ganqu Cui, Shengding Hu, Zhengyan Zhang, Cheng Yang, Zhiyuan Liu, Lifeng Wang, Changcheng Li, Maosong Sun (Submitted on 20 Dec 2018 (v1), last revised 9 Apr 2021 (this version, v5)) Comments: Published on AI O

                                              グラフってこんなにすごい!深層学習との融合をレビュー
                                            • RAGで人間の脳を再現。「HippoRAG」を理解する

                                              はじめまして。ナレッジセンスの門脇です。生成AIやRAGシステムを活用したサービスを開発しています。本記事では、RAGの性能を高める手法である「HippoRAG」について、ざっくり理解します。 この記事は何 この記事は、RAGの新手法として最近注目されている「HippoRAG」の論文[1]について、日本語で簡単にまとめたものです。 「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 本題 ざっくりサマリー HippoRAGは、RAGの性能を高めるための新しい手法です。オハイオ州立大学の研究者らによって2024年5月に提案されました。HippoRAGを使うメリットは、複数の知識を組み合わせて回答する必要があるような、複雑な質問に強くなることです。HippoRAGが従来のRAGに比べて、複雑な質問に強い理由は、ナレッジグラフと、それを継続的に

                                                RAGで人間の脳を再現。「HippoRAG」を理解する
                                              • メルペイCTOと考える新しい経済学とエンジニアリング | メルカリエンジニアリング

                                                12月1日にhidekさんの記事から始まったメルペイアドベントカレンダーも今日で最後です。締めくくりを私(@sowawa)が務めさせていただきます。私からはメルカリやメルペイの振り返りと「新しい経済学とエンジニアリング」の話をしたいと思います。 はじめに 2019年は兎にも角にも「メルペイのリリース」の年でした。2017年ごろからメルカリの決済基盤をマイクロサービスで作り直していき、メルペイの会社の設立を経て今年2月のリリースに至りました。最初のリリース後もまさに五月雨のようなリリースを五月雨が降る5月、6月まで積み上げていきました。リリースを積み重ねながら改善やキャンペーンが始まり、気づいたら12月を迎えていました。 ベスト・オブ 2019 表彰された時の様子 今年の最後にやってきたハイライトは、メルカリがGoogle Playのベスト・オブ2019に選ばれたことです。メルカリ・メルペイ

                                                  メルペイCTOと考える新しい経済学とエンジニアリング | メルカリエンジニアリング
                                                • Google創業者たちの2006年の予言「広告ベースのビジネスモデルが検索エンジンの品質低下をもたらす」

                                                  「最近、Google検索で求めている情報にたどり着くのが難しくなっているな」と感じている人は多いはず。そんなGoogle検索の品質低下に関連して、Googleの創業者であるセルゲイ・ブリン氏とラリー・ペイジ氏が2006年に「広告ベースのビジネスモデルが検索エンジンの品質低下をもたらす」という興味深い発言をしていたことがわかりました。 Google: Advertising and search engine bias | ZDNET https://www.zdnet.com/article/google-advertising-and-search-engine-bias/ 両氏の「広告と検索エンディングの品質低下」に関する発言は、Chromeのリリースよりも2年前の2006年に記録されました。セルゲイ・ブリン氏の発言は以下の通り。 Currently, the predominant

                                                    Google創業者たちの2006年の予言「広告ベースのビジネスモデルが検索エンジンの品質低下をもたらす」
                                                  • SEO歴15年のプロが振り返る「検索の潮流」① グーグルの基盤とIPO、すべてをインデックスする時代 | Moz - SEOとインバウンドマーケティングの実践情報

                                                    僕は最近、自分を見つめ直すことがよくある。 2020年に入り(2005年にDistilledを設立してから15年だ)、僕たちはSEOのA/BテストやメタCMS技術に注力するため、新会社としてSearchPilotをスピンアウトし(これまでの名称はDistilled ODN)、事業のコンサルティングやカンファレンス担当の部分をBrainlabsと統合した。 僕も今では(主にDistilledの株主が所有する)SearchPilotの最高経営責任者(CEO)になったわけだが、BrainlabsのSEOパートナーでもあるため、依然としてSEO業界に関わり続けていることはご了承いただきたい。 したがって、僕にとっては終着点というより節目にすぎないような気もする。とはいえ、この業界にいた15年の間に変わったことと変わらなかったことについて振り返ってみたくなった。 僕はSEO専門家の第1世代に属してい

                                                      SEO歴15年のプロが振り返る「検索の潮流」① グーグルの基盤とIPO、すべてをインデックスする時代 | Moz - SEOとインバウンドマーケティングの実践情報
                                                    • Google創業者は最初から「広告を検索に入れると品質が悪化する」と言っていた

                                                      1998年にセルゲイ・ブリンとラリー・ペイジによってページランクという概念が発表されて以降、ページランクを用いたGoogleが誕生し、私たちのウェブの活用法は大きく変化しました。しかし時間が経過するにつれて、広告が表示されることが一般的になり、検索の質が悪化しているとKagiの最高経営責任者であるウラジミール・プレロヴァチ氏は指摘するとともに新たなインターネットの検索システムについて解説しています。 The Anatomy of a Large-Scale Hypertextual Web Search Engine (PDFファイル)http://infolab.stanford.edu/pub/papers/google.pdf The Age of PageRank is Over | Kagi Blog https://blog.kagi.com/age-pagerank-over

                                                        Google創業者は最初から「広告を検索に入れると品質が悪化する」と言っていた
                                                      • 『それでもやっぱり今は有料リンクスパムをおすすめできない理由』

                                                        それでもやっぱり今は有料リンクスパムをおすすめできない理由 | CyberAgent SEO Information  (サイバーエージェントSEO情報ブログ) 2ヶ月ほど前になりますが、GogoleのJohn Mueller氏が、有料リンクへの対応について、「ほとんどの場合、スパムを自動で無効化する」と話しています。 詳細は鈴木謙一さんの海外SEO情報ブログの記事をご覧いただきたいと思いますが、この問題について少し考えてみたいと思います。 私のことをご存知の方がいらっしゃればタイトルをご覧になった時点で「お前が言うな」だと思います。 私もそう思いますし、十数年前の私がスパムをやめようなんて記事を書くとはまったく思ってませんでしたから・・。 十数年前日本のSEOはリンクスパム大会のようになっていました。私もその渦中におりました。 日々納品されてくるテキスト(コンテンツというよりももはやテキ

                                                          『それでもやっぱり今は有料リンクスパムをおすすめできない理由』
                                                        • NDLデジタルコレクションについてのあれこれ

                                                          国立国会図書館のデジタルコレクションが、昨年暮れから今年の初めにかけてさらにヴァージョンアップされました。それは全文テキスト検索とそれによるスニペット表示が可能になったこと、そして、50コマまでの複写が可能になったことです。全文テキストというのは、資料の版面からスキャンして得た画像からOCR技術を通じて文字を抽出して作成するものです。これによってテキストに含まれる文字列での検索が可能になります。従来、書誌事項(タイトルや著者名など)や目次(これが検索対象になったことも重要だが)からの文字列が対象だったのが、本文が検索対象になったことは革命的なものをもたらします。今まで見えなかったものが見えるようになったということです。ただし、検索結果の表示は1行程度の部分的なものです。これは、著作権法(47条の5)に基づく措置です。また、50コマまでの複写が可能になったことも特筆すべきことです。だいたい1

                                                            NDLデジタルコレクションについてのあれこれ
                                                          • どのようにしてGoogleは重複URLを検出し正規化しているのか?

                                                            [レベル: 上級] Google の Gary Illyes(ゲイリー・イリェーシュ)氏と John Mueller(ジョン・ミューラー)氏、Martin Splitt(マーティン・スプリット)氏の 3 人が『Search Off the Record』というタイトルで SEO をテーマにしたポッドキャストを配信しています。 エピソード 9 では、重複コンテンツの処理についてゲイリーが詳しく説明しました。 Google 検索の内部の動きに関心がある人にはとても興味深い内容です。 この記事で内容を完結にまとめます。 Google が重複を検出し正規化する仕組み 重複コンテンツの処理は次の 2 つのプロセスで成り立っています。 重複検出 正規化 それぞれを順に説明します。 重複検出 重複検出は、URL は異なるけれど中身が同一のページを識別するプロセスです。 同じあるいはほぼ同じとみなしたペー

                                                              どのようにしてGoogleは重複URLを検出し正規化しているのか?
                                                            • Google 検索ランキング システムのご紹介 | Google 検索セントラル  |  ドキュメント  |  Google for Developers

                                                              フィードバックを送信 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。 Google 検索ランキング システムのご紹介 Google は、多種多様な要素やシグナルを検討する自動ランキング システムを使用して、検索インデックスにある数千億のウェブページやその他のコンテンツから、最も関連性の高い、有益な結果が一瞬で表示されるようにしています。 これらのシステムは厳格なテストと評価により定期的に改善されており、コンテンツの制作者などにとって有益と思われる場合には、ランキング システムのアップデートの通知を行っています。 このページは、Google の重要なランキング システムについて理解を深めていただくためのガイドです。ここでは、検索クエリに対して検索結果を生成する基盤テクノロジーである、コア ランキング システムの一部をご紹介します。また、特定のランキング ニー

                                                                Google 検索ランキング システムのご紹介 | Google 検索セントラル  |  ドキュメント  |  Google for Developers
                                                              • SEOでの流入数が減った時に確認したい22の項目 - SEO Japan|アイオイクスのSEO・CV改善・Webサイト集客情報ブログ

                                                                無料で資料をダウンロード SEOサービスのご案内 専門のコンサルタントが貴社サイトのご要望・課題整理から施策の立案を行い、検索エンジンからの流入数向上を支援いたします。 無料ダウンロードする >> SEOを担当している方であれば、誰しも一度はトラフィックの減少を経験したことがあるはずです。 いったい何が理由で、どういった対策を行えばよいのか、様々な角度から調査を行う必要があります。そうした場合、いくつかの可能性を思いつくのであれば、それに沿った効率的な調査が可能となります。 今回の記事は、トラフィックが減少した場合、調査対象とすべき理由をリストアップした記事となります。トラフィック減少の理由を調査するヒントになれば幸いです。 ※記事内のリンクは、原則英語記事へのリンクとなります。 運営しているWebサイトのトラフィックや順位が急降下したという経験はあるだろうか? この記事では、検索からのト

                                                                  SEOでの流入数が減った時に確認したい22の項目 - SEO Japan|アイオイクスのSEO・CV改善・Webサイト集客情報ブログ
                                                                • WPOとは? Web Presence Optimization - SEOのその先へ+これが本当のコンテンツマーケティング|高広伯彦(Ph.D. of Management Science)

                                                                  2013年12月にFPウェブシュフこと中川勉さんに対して「書きます書きます詐欺」をして一年半後に書いたものです。すみません。 これを2015年に書いてから4-5年経ちましたが、実際にやっていたのは2012年から2013年なので、もう7年とか8年前になります。 当時、株式会社マーケティングエンジンという日本初のHubSpotエージェンシーを作って代表をやっていて、その「インバウンドマーケティング」施策としてやっていたこととなります。当時から同社のサイトが検索結果などで圧倒的一位をとっていたのは、このWPOを行なっていたからです。 なので以下の文章は7年前の実践経験に基づくものでもあります。 ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー おそらくこういう話も皆さん知りたいと思うので、デジタルマーケティングの様々なコンセプト・手法についても追々ここに書いていきたいと思います。 さ

                                                                    WPOとは? Web Presence Optimization - SEOのその先へ+これが本当のコンテンツマーケティング|高広伯彦(Ph.D. of Management Science)
                                                                  • 【2021年版】被リンク獲得のアイデア – SEOおたく

                                                                    被リンクはSEOで最重要なランクシグナルです。現在でも。 シンプルにGoogleが公式発言として、トップ3で重要なランクシグナルだって言ってます。 特に海外では、リンクビルディングは当たり前でSEO担当者の仕事は”ほぼこれ“と言っても過言ではありません。 SEOの海外カンファレンスで飛び交う質問も基本的にリンクの話ばかりです。 ただ、リンク獲得するのって超難しいですよね。 良いコンテンツを書けばリンクが得られるとか当たり障りのない戯言は一切なしで、被リンク獲得(リンクビルディング)について書いていきます。 ※2021年のSEOについては下記のnoteに詳しくまとめてありますので、こちらもぜひ合わせてご覧ください 【2021年のSEO】 71サイトのSEOコンサルを通して見えた、14個の効果的なSEO施策。 リンクビルディングとは? リンクビルディングは、SEOで成功するために欠かすことので

                                                                    • cuGraph でページランクを計算したら爆速だった - Taste of Tech Topics

                                                                      概要 こんにちは、機械学習エンジニアの古賀です。 最近、人の動きを時系列で解析するためにグラフデータを扱ったのですが、データ量が大きくなると解析に時間がかかってしまい、効率が悪いと感じることがありました。 そんな中、cuGraph という高速にグラフ分析ができるライブラリが あることを知ったので、どれくらい高速なのか、有名なページランクの計算を題材に他のライブラリと速度を比較してみました。 目次は以下です。 概要 グラフとは Python によるグラフデータの分析 cuGraphとは ページランクとは ページランク値の定義 ページランクとグラフ 検証 実行環境 cuGraph ライブラリのインストール ライブラリのインポート データセット 検証内容・結果 1. NetworkX のグラフ、NetworkX のアルゴリズムを用いてページランクを計算 2. NetworkX のグラフ、cuGr

                                                                        cuGraph でページランクを計算したら爆速だった - Taste of Tech Topics
                                                                      • 【SEO初級者向け?】SEOによくある質問――301と302の違い、404と410の違い、上位表示の秘訣など

                                                                        [レベル: 初級] Google の John Mueller(ジョン・ミューラー)氏が SEO によくある質問に回答しました。 昨年のクリスマスに公開された動画で時期外れになっていますが、特に SEO 初級者に役立つ内容になっているので紹介します。 301 リダイレクトと 302 リダイレクトの違いは何? どちらもユーザーを転送する。違いは些細で小さい。 301 は恒久的なリダイレクトなので、最終到達 URL が Google が保持する URL になる。 302 は一時的なリダイレクトなので、再確認するために始まりの URL に戻るだろう。 301 と 302 はリダイレクトの方法が違うだけだ。可能なときは適切な方を使えばいい。SEO における魔法のような効果は気にしなくていい。どちらも機能する。 【すずきメモ】 技術的には、301 リダイレクトと 302 リダイレクトは異なります。で

                                                                          【SEO初級者向け?】SEOによくある質問――301と302の違い、404と410の違い、上位表示の秘訣など
                                                                        • 僕らが期待しているGoogle検索についての補足 - novtanの日常

                                                                          ツイッター…じゃなかったエックスに書いた話の転載。 Google検索が死んだって話を書いておいてなんだが、実際のところ、「ピンポイントで知りたい話を完全に適切なワードで検索をかける」のであれば、まだ目的のサイトにたどり着ける可能性はそれなりにある。— novtan (@NOV1975_2) 2024年2月16日 Google検索が死んだって話を書いておいてなんだが、実際のところ、「ピンポイントで知りたい話を完全に適切なワードで検索をかける」のであれば、まだ目的のサイトにたどり着ける可能性はそれなりにある。 一般人におけるインターネットの黎明期、すなわち1990年代後半において、当時にょきにょき生えてきた検索サイトの一つであり、検索パワーがそれなりにあった「goo」では、検索の鉄人なる検索コンテストを行っていました。もう残ってないけど、プレスリリースはまだ見れる pr.goo.ne.jp 僕

                                                                            僕らが期待しているGoogle検索についての補足 - novtanの日常
                                                                          • 【開催報告&資料公開】ML@Loft #6 × MLPP #4 – 自然言語・レコメンド・時系列解析 | Amazon Web Services

                                                                            AWS Startup ブログ 【開催報告&資料公開】ML@Loft #6 × MLPP #4 – 自然言語・レコメンド・時系列解析 ML@Loft #6 × MLPP #4 「自然言語・レコメンド・時系列解析 」 AWS 機械学習ソリューションアーキテクトの宇都宮 ( Twitter: @shokout ) です。本ブログでは ML@Loft 第6回 x MLPP 第4回「NLP/レコメンド/時系列解析」の開催概要を報告いたします。 ML@Loft は、 機械学習を AWS 上でプロダクション運用しているデベロッパー・データサイエンティストのためのコミュニティイベントです。毎月テーマを設定し、前半は各分野のエキスパートの方々からの LT、後半は機械学習のサービス導入のノウハウや様々なツラミについて、LT のご講演者の方々を交えて参加者全員参加型のお悩み相談ラウンドテーブルという構成で A

                                                                              【開催報告&資料公開】ML@Loft #6 × MLPP #4 – 自然言語・レコメンド・時系列解析 | Amazon Web Services
                                                                            • GitHub - codemix/deprank: Use PageRank to find the most important files in your codebase.

                                                                              Deprank uses the PageRank algorithm to find the most important files in your JavaScript or TypeScript codebase. It uses dependency-cruiser to build a dependency graph of your source files, then ranks those dependencies based on their importance. We define importance as those files which are directly or indirectly depended upon the most by other files in the codebase. Deprank is particularly useful

                                                                                GitHub - codemix/deprank: Use PageRank to find the most important files in your codebase.
                                                                              • HTTPステータスコードをGooglebotはどのように処理するのか? Googleが詳細に解説

                                                                                [レベル: 上級] HTTP ステータスコードとネットワーク/DNS エラーに関する技術ドキュメントを Google は検索セントラルサイトに新規に公開しました。 この記事では、概要と、特に重要な部分を紹介します。 Google 検索での HTTP ステータスコードの扱い HTTP ステータスコードの定義は RFC 7231 などで定められています。 しかしながら、Google 検索は独自の扱いをすることもあります。 Googlebot がウェブをクロールしてきたなかで最も多く返された 20 種類のステータスコードの扱いをドキュメントは説明しています。 2xx/3xx/4xx/5xx の最終的な扱いは基本的に同じ ステータスコードは次の 4 つのカテゴリに大別できます。 200 番台 (2xx) 300 番台 (3xx) 400 番台 (4xx) 500 番台 (5xx) 基本的に、それぞ

                                                                                  HTTPステータスコードをGooglebotはどのように処理するのか? Googleが詳細に解説
                                                                                • EEATとは?サイトや著者の経験、専門性、権威性、信頼を評価

                                                                                  E-E-A-Tとは E-E-A-Tとは、Google独自のウェブページの評価基準です。E-E-A-Tという用語はExperience(経験)、Expertise(専門性)、Authoritativeness(権威性)、Trust(信頼)のそれぞれの頭文字を取った頭字語であり、Google検索品質評価ガイドライン1の中で定義されています。 E: Experience 経験そのトピックに関してコンテンツ著者が持つ実体験や人生経験。著者が直接的に体験したことはコンテンツの独自性に表れる。E: Expertise 専門性そのトピックに関してコンテンツ著者が持っている知識や技術。著者が持つ知識や技術の広さや深さはコンテンツの品質に表れる。A: Authoritativeness 権威性そのトピックに関する有力な情報源としてのウェブサイトやコンテンツ著者の知名度。定量的に計測可能な指標としてPageR

                                                                                    EEATとは?サイトや著者の経験、専門性、権威性、信頼を評価