エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
BLOG::broomie.net: WEB+DB PRESS Vol.59 大規模データ分析
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
BLOG::broomie.net: WEB+DB PRESS Vol.59 大規模データ分析
[実践]大規模データ分析というテーマで特集を組ませていただき、 1章 データマイニング入門 2章 テキ... [実践]大規模データ分析というテーマで特集を組ませていただき、 1章 データマイニング入門 2章 テキストマイニング 3章 クラスタリング 4章 ログデータマイニング 5章 リンクマイニング という章立てで僕は「テキストマイニング」について書かせていただきました。 テキストマイニングということで、とても幅の広い話なので、どのようにまとめるかに苦難しました。専門家の方には物足りないかもしれませんが、紙面にも限りがあるため、今回はテキストマイニングの概要とhadoopを使った効率的な頻度分析、共起分析についてまとめ、全体的に基本的な内容でまとめさせていただく運びとなりました。 キーワードを抽出し、特徴ベクトルさえできてしまえば、応用できる手法を掲載した書籍がたくさんあることもあり、今回はキーワード抽出のところに重きを置かせていただきました。hadoopを使ってmixiの日記から簡単にキーワード