[B! Infomatics] yuku_tのブックマーク

yuku_t id:yuku_t

Infomaticsに関するyuku_tのブックマーク (7)

Tsujii Lab. Enshu3 -- Latent Semantic Analysis (LSA)
Latent Semantic Analysis (LSA) 目次背景課題の流れ背景近年、情報検索が非常に重要となる一方で、その検索手法は未だにキーワード入力によるものが事実上標準となっています。しかし単語には同義語や、多義語が存在するために目的とする結果がなかなか得られない場合があります。例えば、木を用いたデータ構造を検索しようとして、treeと入力しただけでは目的のものが得られず、tree data structureでようやく狙った検索結果が上位に来ます（多義語の例）。全ての単語に対し、どの単語同士が似た意味を持っているのか、または持っていないのかを調べることで、より柔軟性をもった情報検索ができる可能性があります（例えば、キーワードに「東大」としか入力していないのに検索結果では「東京大学」「最高学府」「University of Tokyo」が含まれる文書も検索できる）。
yuku_t 2011/06/20
labo

Infomatics
リンク
インターネット・プロトコル・スイート - Wikipedia
インターネット・プロトコル・スイート（英: Internet protocol suite）は、インターネットを含む多くのコンピュータネットワークにおいて、標準的に利用されている通信プロトコルのセットである。TCP/IPプロトコルあるいは単にTCP/IP (Transmission Control Protocol / Internet Protocol) とも呼ばれる。従来のインターネットワーキングの手法は、このTCP/IPプロトコルに基づいている[1]。元々は確固たる仕様や定義はなく、IPやTCPやUDPなどの仕様中に個々に、あるいは暗黙の前提として存在していたものだが、後から RFC 1122 で1つにまとめられた。これに対応する参照モデルはTCP/IPモデルと呼ばれる。有線、無線などの物理層の違い、イーサネット、モデムによるシリアル通信などの物理層とデータリンク層の違い、異なるベ
yuku_t 2010/10/12
あとで読む

Infomatics
リンク
クラフトの不等式 - Wikipedia
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。（このテンプレートの使い方）出典検索?: "クラフトの不等式" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2022年11月) クラフトの不等式（クラフトのふとうしき、英: Kraft's inequality）は、符号理論における不等式の1つで可変長符号が一意復号可能である為の必要条件を与える。等号成立条件は符号が完全である事である。クラフトの不等式は可変長符号が一意復号可能である為の十分条件ではないが、クラフトの不等式を満たす任意のパラメータに対し、そのパラメータを実現する一意復号可能な可変長符号の存在性が保証される。計算機科学や情報理論で利用される接頭符号やトライ木で
yuku_t 2010/10/06
Infomatics

labo
リンク
カルバック・ライブラー情報量 - Wikipedia
カルバック・ライブラー情報量（カルバック・ライブラーじょうほうりょう、英: Kullback–Leibler divergence）は2つの確率分布の差異を計る尺度である。確率論と情報理論で利用され様々な呼び名がある。以下はその一例である：カルバック・ライブラー・ダイバージェンス（KLダイバージェンス）情報ダイバージェンス（英: information divergence）情報利得（英: information gain）相対エントロピー（英: relative entropy）カルバック・ライブラー距離ただしこの計量は距離の公理を満たさないので、数学的な意味での距離ではない。応用上は、「真の」確率分布 P とそれ以外の任意の確率分布 Q に対するカルバック・ライブラー情報量が計算される事が多い。たとえば P はデータ、観測値、正確に計算で求められた確率分布などを表し、Q
yuku_t 2010/10/06
statistics

labo

Infomatics
リンク
潜在意味解析 - Wikipedia
潜在意味解析（せんざいいみかいせき、英: Latent Semantic Analysis、略称: LSA）は、ベクトル空間モデルを利用した自然言語処理の技法の1つで、文書群とそこに含まれる用語群について、それらに関連した概念の集合を生成することで、その関係を分析する技術である。潜在的意味解析とも。 1988年、アメリカ合衆国でLSAの特許が取得されている[1]。情報検索の分野では、潜在的意味索引または潜在意味インデックス（英: Latent Semantic Indexing, LSI）とも呼ばれている。 LSA では、各文書における用語の出現を表した文書-単語マトリクスが使われる。これは各行が各単語に対応し、各列が各文書に対応した疎行列である。この行列の各成分の重み付けには tf-idf (term frequency–inverse document frequency) が用いられ
yuku_t 2010/10/04
Infomatics

algorithm

nlp
リンク
動的計画法 - Wikipedia
動的計画法（どうてきけいかくほう、英: Dynamic Programming, DP）は、計算機科学の分野において、アルゴリズムの分類の1つである。対象となる問題を複数の部分問題に分割し、部分問題の計算結果の記録を利用して全体の問題を解く手法を総称してこう呼ぶ。細かくアルゴリズムが定義されているわけではなく、下記2条件を満たすアルゴリズムの総称である。帰納的な関係の利用：より小さな問題例の解や計算結果を帰納的な関係を利用してより大きな問題例を解くのに使用する。計算結果の記録：小さな問題例、計算結果から記録し、同じ計算を何度も行うことを避ける。帰納的な関係での参照を効率よく行うために、計算結果は整数、文字やその組みなどを見出しにして管理される。「動的計画法(dynamic programming)」という言葉は1940年代にリチャード・E・ベルマンが最初に使いはじめ、1953年に現
yuku_t 2010/10/04
algorithm

Infomatics
リンク
情報検索 - Wikipedia
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。（このテンプレートの使い方）出典検索?: "情報検索" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2024年3月) 情報検索（じょうほうけんさく、英語: information retrieval）とは、コンピュータを用いて大量のデータ群から目的に合致したものを取り出すこと。検索の対象となるデータには文書や画像、音声、映像（動画）、その他さまざまなメディアやその組み合わせとして記録されたデータなどが含まれる。インターネットの発達により検索はインターネットを介して行われることも多いが、ここでは情報を検索[1]するためのコンピュータ側における仕組みを記述している。情報検索に対
yuku_t 2010/10/04
labo

Infomatics
リンク
1