タグ

アルゴリズムに関するixion753のブックマーク (4)

  • Googleのアルゴリズムにおける検索順位に影響を与える200+個の要因のまとめ

    Googleの検索のアルゴリズムにおける検索結果の順位に影響を与える200+個の要因、コンプリートリストを紹介します。 量が多く翻訳するのに一週間かかりましたが、興味深いことが多々あり、とても面白かったです。 Google's 200 Ranking Factors: The Complete List 下記は各ポイントを意訳したものです。 ※当ブログでの翻訳記事は、元サイト様に許可を得て翻訳しています。 毎日のように海外のまとめ記事を無断転載してアクセスを稼いでいるあのブログの注意喚起を海外のブロガーから聞きます。問い合わせや削除依頼しても対応無しっていうから、たちが悪い。 ドメインによる要因 ページレベルによる要因 サイトレベルによる要因 バックリンクによる要因 ユーザーのインタラクションによる要因 アルゴリズムによる要因 ソーシャル シグナル ブランド シグナル サイト内部のスパム

  • ナンバープレース(数独)解法アルゴリズム

  • 1-byte.jp - PHPでテキストの類似度を求める

    テキストを扱うサービスでは表現の揺れが問題になることが多いですね。 Web上にあるテキストコンテンツは全て人間が入力したものと言っても過言ではありません。 人間が入力する、ということは必ず表現の揺れが発生します。 単純な入力ミスや、複数存在する表現などによるものです。 お知らせメールでもこの例に漏れず、表現の揺れが問題になりました。 ユーザが登録したアーティストや著者に関する情報は、漏れなくユーザに届ける必要があります。 届かなければサイトの信頼に関わりますからね。 内部の処理として文字列の類似度を計算している部分があります。 類似度をプログラムで計算し、登録したアーティストや著者に関連する情報か否か、をフィルタリングしています。 ここで言う文字列の類似度とは、”田中太郎”と”田中次郎”の文字列としての近さを言います。 “田中太郎”と”田中次郎”では”太”と”次”が違うだけなの

  • diffの動作原理を知る~どのようにして差分を導き出すのか | gihyo.jp

    UNIXの基的なコマンドの1つであるdiff。 これに実装されているアルゴリズムは実に興味深い世界が広がっています。 稿では、筆者が開発した独自ライブラリ「dtl」をもとに「diffのしくみ」を解説します。 はじめに diffは2つのファイルやディレクトリの差分を取るのに使用するプログラムです。 ソフトウェア開発を行っている方であれば、SubversionやGitなどのバージョン管理システムを通して利用していることが多いかと思います。稿ではそのdiffの動作原理について解説します。 差分の計算の際に重要な3つの要素 差分を計算するというのは次の3つを計算することに帰結します。 編集距離 2つの要素列の違いを数値化したもの LCS(Longest Common Subsequence) 2つの要素列の最長共通部分列 SES(Shortest Edit Script) ある要素列を別の要

    diffの動作原理を知る~どのようにして差分を導き出すのか | gihyo.jp
  • 1