タグ

テキストマイニングに関するp_tanのブックマーク (3)

  • KH Coder: 計量テキスト分析・テキストマイニングのためのフリーソフトウェア

    概要と特長 KH Coderとは、計量テキスト分析またはテキストマイニングのための自由ソフトウェアです。 アンケートの自由記述・インタビュー記録・新聞記事など、さまざまなテキストの分析にお使いいただけます。 プログラミング不要、マウス操作で格的な分析 安心の分析プロセス完全公開、研究利用も多数 New! 機能紹介(スクリーンショット) スクリーンショット集 [旧ページ:言葉・文書・可視化・他] KH Coder 3 正式版の新機能 New! 機能追加プラグイン「文錦®」シリーズ New! ダウンロードと使い方 KH Coder 3 正式版ダウンロード (Version 3.02) 使い方を知るためのチュートリアル ヘルプ 質問&エラー報告用の掲示板 ※投稿にはGitHubへの登録が必要(無料)[旧掲示板] よくある質問(FAQ) 開発者が語る公式セミナー & サポート:㈱SCREEN A

  • 第5回 青空文庫のテキストマイニングをRMeCabパッケージでやってみた|Tech Book Zone Manatee

    2016.09.13 Rではじめよう![モダン]なデータ分析 第5回 青空文庫のテキストマイニングをRMeCabパッケージでやってみた 松村優哉(著者)、匿名知的集団ホクソエム(著者) RMeCabパッケージを使った青空文庫のテキストマイニングを行い、芥川龍之介と太宰治の作品を判別します。サポートベクトルマシンによる著者判別・チューニングまですべてをRで行います。 1. はじめに テキストマイニング(Text Mining)とは、テキストを対象にしたデータマイニングの理論や技術の総称です。 一般にデータマイニングを行うためにはデータが必要になりますが、テキストマイニングやそれを文学作品の分析に応用した計量言語学の分野では文章データに加えて、しばしばコーパスが用いられます。 コーパスとは、書き言葉や話し言葉をジャンルなどを考慮した上で網羅的に収録したデータベースのことを指します。 また、日

    第5回 青空文庫のテキストマイニングをRMeCabパッケージでやってみた|Tech Book Zone Manatee
  • 第6回 訪日外国人の発言内容の「感情分析」を行う|Tech Book Zone Manatee

    近年増加し続けている「訪日外国人」旅行者は日でどのような物事に関心を示しているのでしょうか。SNS発言内容の「感情分析」を行うことで動向についてRと拡張パッケージを使って明らかにすることを試みます。 1. はじめに 海外から日へ訪れる「訪日外国人」旅行者の数(訪日外客数)は、近年増加をし続けています。市街地や観光地を歩けば、日語よりも海外の言語が多く聞こえてくる、ということも珍しくなくなりました。国際観光の振興を図る日政府観光局の発表では、昨年2015年の訪日外客数は過去最高の1,973万人超であり [1]、その勢いは年間2,000万人に達する見込みです。訪日外国人の国内での行動や消費の概要に関しては統計データなどを通して読み解くことができますが、その詳細は統計データからは見えにくいものです。一体彼らは日でどのような物事に関心を示しているのでしょうか。 訪日外国人の詳しい動向を知

    第6回 訪日外国人の発言内容の「感情分析」を行う|Tech Book Zone Manatee
  • 1