blueleのブックマーク - はてなブックマーク

事例の重み付けに基づく自動獲得されたコーパスの効果的な利用法と評価極性分類への応用 | CiNii Research
bluele 2014/09/09
article
リンク
高次元ベクトル空間モデルによるテキスト分類問題について : 分類性能と距離構造の漸近解析(理論・技術) | CiNii Research
近年,インターネットの普及により膨大なテキストデータからの知識発見を扱うテキストマイニングの技法が注目されている.本研究では,テキストマイニングが取り扱う問題の中でも,特に文書分類の問題を取り上げ,形態素解析後の単語の出現分布としてある確率モデルのクラスを仮定し,文書分類の性能,並びに分類に用いられる距離について漸近的な分析を行う.一般に,文書分類に不必要な単語の混入を完全に排除することは難しく,様々な重要単語の重み付け法などが提案されている.本論文で扱う最初の問題は,このような分類に不必要な単語が混入することが,文書分類に与える性能劣化の程度を把握することである.さらには,単語の出現頻度に基づく文書分類においては,個々の単語の生起頻度は少なく,多くの単語の頻度がゼロとなってしまうというスパースネスの問題がある.すなわち,このベクトル空間上で一つの文書を表す点は,ゼロを多くの要素に持つベク
bluele 2013/01/21
vector

cinii
リンク
サイバー空間での近未来型エンターテインメント : サイバーホメオスタシス仮説の視点から(<小特集>遊び・エンタテインメントとメディア) | CiNii Research
bluele 2013/01/10
article
リンク
N.M-gram : ハッシュ値付きN-gram法による空間効率の改善(データ構造,テーマ : 「デジタルアーカイブの活用(応用)」および一般) | CiNii Research
bluele 2011/12/11
cinii

search
リンク
1

はてなブックマーク

タグ

ブックマーク / cir.nii.ac.jp (4)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / cir.nii.ac.jp (4)

事例の重み付けに基づく自動獲得されたコーパスの効果的な利用法と評価極性分類への応用 | CiNii Research

高次元ベクトル空間モデルによるテキスト分類問題について : 分類性能と距離構造の漸近解析(理論・技術) | CiNii Research

サイバー空間での近未来型エンターテインメント : サイバーホメオスタシス仮説の視点から(<小特集>遊び・エンタテインメントとメディア) | CiNii Research

N.M-gram : ハッシュ値付きN-gram法による空間効率の改善(データ構造,テーマ : 「デジタルアーカイブの活用(応用)」および一般) | CiNii Research

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス