タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

PythonとtextMiningとtutorialに関するs-fengのブックマーク (2)

  • 「テキストアナリティクスの基礎と実践」をpythonで読む4 トピック分析 - Qiita

    この内容は金明哲さんの「テキストアナリティクスの基礎と実践」のRでの実装をpythonで書き換えながら読んでいくものです。 提供されているデータは、すでに形態素解析されてある程度集計されたデータとなります。 説明が不十分であること、参考書通りの解析ができているわけではないことはご了承ください。 詳しくはを読んでいただければと思います。 前回 テキストの特徴分析 4. トピック分析 4.1 トピックモデルとは テキストにおける名詞は文章の主題や内容から大きく影響を受けるため、人による読みを経なくても、語句を集計したデータから、テキストの話題を推定できる可能性がある。 テキストをテキスト内に出現する毒と頻度によってのみ捉えるという点で、主成分分析や対応分析、潜在意味解析の手法と変わらないが、 線形代数の行列分解をベースとした方法では、高次元データの場合にデータの内在構造を十分に理解できない可

    「テキストアナリティクスの基礎と実践」をpythonで読む4 トピック分析 - Qiita
  • Pytorch-BigGraphによるWikipedia日本語記事のグラフ埋め込み - Sansan Tech Blog

    こんにちは、DSOC R&Dグループ研究員の 奥田 です。最近はYouTubeでコーギーの動画ばかり見ているのですが、あのパンみたいなお尻が最高です。 今回は大規模グラフに対するグラフ埋め込み(Graph Embedding)を計算するPytorch-BigGraphについて紹介いたします。また、記事の後半ではWikipediaの実データを対象に、約200万ノード1億エッジという大規模グラフに対するグラフ埋め込みの計算や類似記事検索の結果などをご報告できればと思います。 概要 グラフ埋め込み グラフ埋め込みとは、ノードとエッジから構成されたグラフ構造から、ノードの埋め込み表現を得るための手法やその表現自体のことを指します。直感的には、自然言語処理における単語埋め込み(Word Embedding)のグラフ版だと考えると理解しやすいかもしれません。 単語埋め込みにおいては、ある単語の意味は

    Pytorch-BigGraphによるWikipedia日本語記事のグラフ埋め込み - Sansan Tech Blog
  • 1