NAME SYNOPSIS DESCRIPTION Sample Script Methods get_imp_word SEE ALSO COPYRIGHT NAME TermExtract::MeCab -- 専門用語抽出モジュール(「和布蕪」版) SYNOPSIS use TermExtract::MeCab; DESCRIPTION 入力テキストを、「和布蕪」(奈良先端大学で作成している日本 語形態素解析プログラム)にかけ、その結果をもとに入力テキス トから専門用語を抽出するプログラム。 なお、「和布蕪」の出力はデフォルトのフォーマット指定を前 提としている。 使用法については、親クラス(TermExtract::Calc_Imp)か、以下の サンプルスクリプトを参照のこと。 Sample Script #!/usr/local/bin/perl -w # # ex_mecab.p
紙芝居キーグラフ(仮) † 次世代型キーグラフ?、紙芝居キーグラフ(仮)のWikiです。 ダウンロード インストール チュートリアル 基本編 応用編 研究編? 更新履歴 掲示板 バグ・要望 FAQ 募集 事例紹介 名前募集 アイコン募集 ↑ 紙芝居キーグラフについて † 紙芝居キーグラフは、2006年3月までの(株)博報堂と東京大学の 共同研究成果を起点として、現在も伊藤貴一と大澤幸生助教授 (東京大学)の共同で改良を続けているツールです。学術利用は フリーですが、商用利用は要相談です。 ↑ 参考文献 † 大澤幸生.チャンス発見のデータ分析―モデル化+可視化+コミュニケーション→シナリオ創発,2006 大澤幸生. ビジネスチャンス発見の技術. 岩波アクティブ新書, 2004. 大澤(編著)ほか. チャンス発見の情報技術. 東京電機大学出版, 2003. ↑
共起尺度について説明します。 共起とは、まさに ある一組の「共に起きる」程度を表したものです。 例えば、 amazonで本を検索するときに、 この商品を買っている人は、この本も買っています と紹介されますが、それは、過去の購買データから、 共起が高い商品を勧めているのです。 共起尺度として、 主なものは、 共起頻度、Jaccard係数、Simpson係数、コサイン距離があります。 これらの指標について、「X」と「Y」という一組の共起性がどう測られるか示します 「X」と「Y」の単独での出現数を|X|、|Y|、 どちらか一方が出現した回数を|X∪Y|、 両方が出現した回数を|X∩Y|とします。 A)共起頻度 共起の回数であり、 |X∩Y|で計算される。 B)Jaccard係数 どちらかが出現したうち、何回同時に出現するかで、 |X∩Y|/|X∪Y|で計算される C)Simpson係数 Jacc
Focus on the Markets No.24 テキストマイニング手法を用いた経済市場分析の試み No.24 2007.12.28 テキストマイニング手法を用いた経済市場分析の試み ∼日銀金融経済月報を題材として 円貨資金証券部 1.はじめに 我々市場参加者は、日々膨大なファンダメンタル情報・テクニカル情報に接している。 経済指標、マーケットのテクニカル指標、また市場に影響を及ぼす要人の発言、中央銀行 や他の市場参加者の分析資料など、我々は膨大な情報に目を通し、取捨選択しつつ最大限 に活用して日々の操作を実施している。 一方、コンピューター技術の進展により、中央銀行の HP や証券会社の分析レポート、 更には個人のブログ、掲示板等まで経済市場を分析したコンテンツは益々増加しており、 個人、またはある組織がその全てに目を通すことは不可能に近い。 かかる環境下、我々は膨大な情報
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く