タグ

類似度に関するni66lingのブックマーク (7)

  • 論文まとめ:Image Quality Assessment: From Error Visibility to Structural Similarity - Qiita

    論文まとめ:Image Quality Assessment: From Error Visibility to Structural SimilarityImageProcessingComputerVisionMachineLearningDeepLearning はじめに depth系の論文読んでるとlossのところで何かと出てくる以下の論文 [1] Z. Wang, et. al. "Image Quality Assessment: From Error Visibility to Structural Similarity". IEEE transactions on image processing. vol.13, no.4, april 2004. のまとめ IEEE: https://ieeexplore.ieee.org/document/1284395 pdfも転が

    論文まとめ:Image Quality Assessment: From Error Visibility to Structural Similarity - Qiita
  • 株式会社 Accel Brain – 活用なき「AI論」は、無学に等しい。

    語られている事柄は全て、観察者によって語られている。Alles was gesagt wird, wird von einem Beobachter gesagt. Maturana, H. R. (2013). Erkennen: die Organisation und Verkörperung von Wirklichkeit: ausgewählte Arbeiten zur biologischen Epistemologie. Springer-Verlag., S.34.

    株式会社 Accel Brain – 活用なき「AI論」は、無学に等しい。
  • Twitterの投稿時間で類似度を計算してみた - 確率分布の類似度 - 唯物是真 @Scaled_Wurm

    以前集合やベクトルの類似度の記事を書いたんですが、確率分布の類似度には触れていなかったのでついでに書きました ツイート時間分布の類似度を求める 今回はツイート時間ごとの頻度を正規化して、確率分布とみなして類似度を計算してみます 私のアカウント(以下mainと表記)に対して、私のもう一つのアカウント(以下subと表記)+私がリプライを送ってる数が多い(以下friendと表記)上位5人と比較します subがfriendよりも似た結果になることを期待しています 以下にツイート時間の分布(main + sub + friend 5人)を載せました ある程度似ていますが、人によってそこそこ形が違っていて、特に午前中の投稿時間の差は特徴的に見えます またfriend1の一人だけは大きく違った傾向を示しています 以下ではこれらが定量的にどれぐらい異なるのか類似度を計算して比較していきます グラフを描くの

    Twitterの投稿時間で類似度を計算してみた - 確率分布の類似度 - 唯物是真 @Scaled_Wurm
  • MinHashによる高速な類似検索 - Preferred Networks Research & Development

    年が明けてもう一ヶ月経ちましたね.岡野原です. 今日はMinHashと呼ばれる手法を紹介します.これは特徴ベクトルの高速な類似検索に利用することができます(クローラーの文脈だとShingleとして知られている). 今や世の中のあらゆる種類のデータが,高次元のバイナリベクトルからなる特徴ベクトルで表されて処理されるようになってきました.例えば文書データであれば文書中に出現する単語やキーワードの出現情報を並べた単語空間ベクトル(Bag of Words)で表し,画像データも,SIFTをはじめとした局所特徴量を並べた特徴ベクトル(とそれをSkecth化したもの)として表せます.行動情報や時系列データも特徴量をうまく抽出する.グラフデータもFast subtree kernels[1]と呼ばれる方法で非常に効率的に特徴ベクトルに変換することができ,グラフの特徴をよく捉えることができるのが最近わかっ

    MinHashによる高速な類似検索 - Preferred Networks Research & Development
  • ベクトル空間法を利用した類似度計算

    ベクトル空間法を利用した類似度計算 澁谷 翔吾 ,廣安 知之,三木 光範 ISDL Report  No. 20081110002 2008年 5月 22日 Abstract 1 はじめに 近年, 異なる文書間の類似度を定量的に計る手法が盛んに研究されている. レポートでは, ベクトル空間モデルを用いることにより, それぞれの文書のベクトルを比較することにより類似度を定量的に計る手法について調査した. 報告では, それらの手順について解説する. 2 形態素解析 形態素解析(Morphological Analysis)とは, コンピュータ等の計算機を用いた自然言語処理の基礎技術の1つであり, かな漢字変換等にも応用されている. 対象言語の文法の知識(文法のルールの集まり)や辞書(品詞等の情報付きの単語リスト)を情報源として用い, 自然言語で書かれた文を形態素(Morpheme)の列に分

  • 文書間関連度の基礎

    Abstract 近年,異なる文書間の関連度(類似度)を定量的に計る手法が盛んに研究されている.レポートではそれらの基礎的な手法について調査し,得られた知見について述べる. Word PressやMovable TypeといったCMS(コンテンツマネージメントシステム)や,アメーバブログやはてなダイアリーなどのブログサービスの普及により,簡単にWeb上に文書を作成・公開することが可能となってきており,膨大な量のデータがテキスト(文書)として公開されている.それらはGoogleYahooといった大規模な検索エンジンサービスなどによってクロール*1されることで検索対象となる.これらの膨大な量のデータを有効活用する方法の一つとして,文書を類似するグループにクラスタリングすることで,ユーザが得たい情報を効率良く収集することができる.また,AmazonのレコメンデーションシステムのようにWebサ

  • 類似度と距離 - CatTail Wiki*

    2つのデータが似ている度合いを,類似度の大きさや距離の近さといった数値にしてあらわすことで,クラスタ分析や,k-近傍法,多次元尺度構成法(MDS)をはじめとするいろいろな分析を行うことが可能となる. ここでは,よく知られている類似度や距離について述べる. 類似度という概念は,2つの集合の要素がまさにどれだけ似ているかを数量化したものであり,距離とは,要素同士の離れ具合,従って非類似度とちかい概念と考えてもよい. 参考までに数学における距離の概念の定義を示すと, 距離空間の定義 Sを1つの空でない集合とし,dをSで定義された2変数の実数値関数 d(SxS) → R が,以下の4条件(距離の公理) D1 : (非負性) 任意のx,y∈Sに対して d(x,y)≧0. D2 : (非退化性) x,y∈Sに対し d(x,y)=0  ⇔ x=y. D3 : (対称性) 任意のx,y∈Sに対して d(x

    類似度と距離 - CatTail Wiki*
  • 1