を入力データとし, TF-IDF法と TF-IDayF法で重み付けさ. れた単語から、1日上位20 単語を重要単語として抽出し. て比較した。その結果 TF・IDF 法で3579 単語. TF-IDayF.
2007年01月14日04:56 カテゴリ●datamining 時系列データマイニング① これまで専門についてほとんど触れなかったが (むしろブログでは周辺ネタというか趣味を中心に扱ってたので) 実はこれを研究してる(た?)。 ようはデータマイニング屋さんが時系列を扱ったやつ。AI屋からの参入もあるので知的処理との融合も進みつつある。 通常、時系列解析っていっても多様にある。例えば思いつくのをあげると ・統計的時系列解析:どっちかというと計量経済と親和性が高い。ARIMA,GARCH ・信号解析系:フーリエ解析、ウェーブレット解析 ・状態空間モデル(統計数理研究所:北川先生、らで盛ん。) ・カオス時系列解析 ・KM20ランジュバン方程式論 (・音声認識関連) などがあろう。 時系列マイニングはこれらとは違って(実はとある理由で音声認識の技術に近いところもあるが) ①大量の時系列データから
また、多次式、指数、対数、ロジスティック方程式は、変数を1次に変形した回帰方程式で表せる。 単係数の有意性[編集] 最後に、単回帰分析によって得られた最小二乗推定量の棄却可否は、最小二乗推定量が定数項と説明変数の数の和を自由度とするt分布に従うことから、T検定によって検定される。帰無仮説で係数を0とするt値が高いほど有意である確率、つまりモデルが棄却される確率であるP値が低くなる。 統計的仮説検定の論理を厳密に辿るなれば、この検定では係数が0か否かを検定しているに過ぎず、たとえ帰無仮説を採択できなくなったとしても、それが係数が他の特定の値であることを支持している訳ではない。対立仮説の設定いかんにより、片側検定・両側検定の違いはあっても、検定していることは0かどうかということだけである。 多重回帰[編集] 説明変数を2つ以上にする場合を多重回帰または重回帰という。 推定量の導出[編集] 重回
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く