タグ

ブックマーク / mjin.doshisha.ac.jp (4)

  • [連載]フリーソフトによるデータ解析・マイニング第61回 統計的テキスト解析(6)~語のネットワーク分析~

    [連載] フリーソフトによるデータ解析・マイニング 第61回 統計的テキスト解析(6)~語のネットワーク分析~ 1.ネットワーク分析とは ネットワーク分析は、社会学や通信ネットワークなどの分野で多く用いられている。数学のグラフ(Graph)理論に基礎を置いている。したがって、分野によってはグラフ分析とも呼ぶ。ネットワークは、頂点(V: Vertex)と辺(E: Edge)を基構成要素とする。頂点を「点」「ノード」、辺を「線」とも呼ぶ。ネットワークは、線で点と点の関係を示す。線が方向性を持つグラフを有向グラフ(Directed Graph)、線が方向性を持たないグラフを無向グラフ(Undirected Graph)と呼ぶ。図1に、有向グラフと無向グラフの例を示す。

    Kshi_Kshi
    Kshi_Kshi 2012/12/20
    共起語ネットワークをRで作成する話。
  • Microsoft Word - 第21Weak.doc

    [ 連載 ] フリーソフトによるデータ解析・マイニング第 21 回 決 定木と集団学習 研 究ノード 1 . 決 定木 樹 木 モ デルに よ る 分類木 ( 決 定 木 ) は 、 計 算の速 さ 、 結果の 読 み やすさ 、 説 明のし や す さ な ど から多くの分野で応用されている。 決 定木は多くのアルゴリズムが提案されている。 WEKA には、 10 種類の樹木に関するアル ゴリズムが実装されている。しかし、その中ではデータ形式に特化したものもある。データの への制約が少ないのは J48 、 NBTree 、 RandomForest 、 RandomTree 、 REPTree などである 。 先 月号で、すでに説明したとおり、 J48 は C4.5 の WEKA バージョンである。 N BTree は、ナイーブベイズの分類器 (naive Bayes c lass

  • Microsoft Word - 第20Weak.doc

    [ 連載 ] フ リーソフトによるデータ解析・マイニング 第 20 回 WEKA と樹木モデル 1 . WEKA とは 樹 木モデルに関するアルゴリズムは多く提案されているが、R には CART のファミリーの一 族 tree 、 rpart 、 randomForest 以外には見当たらない。樹木モデル ( 決定木 ) の話題で欠かせな いのは C4.5 のアルゴリズムである。そこで、稿では、 C4.5 のアルゴリズムが実装されてい るデータマイニングのフリーソフト WEKA を紹介する。 W EKA は、 ニュージーランドのワイカト大学 (University of Waikato) の Ianh. Witten 、 Eibe. Frank を中心とした機械学習の研究者によって開発され続けている、 Java 言語によるオープ ンソースのデータマイニングのフリーソフトである。実

  • Microsoft Word - SVM.doc

    [ 連載 ] フリーソフトによるデータ解析・マイニング第 31 回 R とカーネル法・サポートベクターマシン 1. カーネル法とは 図 1 に示すように、非線形データ構造を線形構造に変換することができれば、線形データ解 析手法で非線形データを容易に扱うことができる。 図1 変換による線形化のイメージ デ ータを変換することで、非線形構造を線形構造に変換することが可能である。例えば、図 2(a)に示す 2 次元平面座標系( x, y )上の 4 つの点 A1(1,1)、A2(1,-1)、A3(-1,-1)、A4(-1,1)を 考えよう。仮に A1 と A3 がひとつのクラス、A2 と A4 がひとつのクラスだとすると、平面上で クラスの境界線を一の直線で引くことができない。しかし、新しい変数 z = xy を導入し、2 次 元 平 面 ( x, y )上 の 4 つ の 点

    Kshi_Kshi
    Kshi_Kshi 2011/11/18
    カーネル法
  • 1