$Id: dic-detail.html 161 2008-02-03 09:58:46Z taku-ku $; 概要 単語辞書の構造を理解することで, MeCab を汎用的なテキスト変換ツールとして利用することができます. 例えば, ひらがな to カタカナ変換, ローマ字 to ひらがな変換, Auto Link等を MeCab だけで実行できます ファイル 単語辞書を構築するには, 最低以下のファイルを作成する必要があります. *.csv ファイル (単語辞書) matrix.def (連接表) unk.def (未知語用品詞定義) char.def (未知語の文字定義) dicrc (設定ファイル) *.csv ファイル 単語辞書です エントリは, 以下のような CSV で追加します. test,1223,1223,6058,foo,bar,baz 最初の4つは必須エントリで,
次へ: はじめに サポートベクターマシン入門 栗田 多喜夫 Takio Kurita 産業技術総合研究所 脳神経情報研究部門 Neurosceince Research Institute, National Institute of Advanced Indastrial Science and Technology takio-kurita@aist.go.jp visitors since Jul. 19, 2002. 概要: 最近、サポートベクターマシン(Support Vector Machine, SVM)と呼ばれるパター ン認識手法が注目されており、ちょっとしたブームになっている。カーネルトリッ クにより非線形の識別関数を構成できるように拡張したサポートベクターマシン は、現在知られている多くの手法の中でも最も認識性能の優れた学習モデルの一 つである。サポートベクターマ
ハッシュとはなにか いよいよハッシュです. ハッシュは便利です. ハッシュが使えるようになると,Perl でできることの幅がぐんと広がります. ハッシュを使いこなしてこその Perl です. ハッシュはたくさんのデータをまとめて管理してくれるという点で配列に 似ていますが,何番目の要素かを指定するのではなくて, キーになる文字列(キーワード)を手がかりに要素を指定するデータ構造です. 配列は(スカラー)変数がたくさん順番に並んだデータ構造, ハッシュは,キーになる文字列と,対応する値とのペアが たくさん順不同で並んだデータ構造 です. 例を見るまえに,表記上のルールを説明します. まず,ハッシュ全体の名前は最初に % をつけます (配列のように @ を付けるのではなく). 個々の要素を指定するときは,キーになる文字列を {} で囲んでハッシュ名の うしろにつけます(配列のように [] で囲
この文書は何だ? この文書では「いい作品とは何か」という本質にはまったく迫らず、 作品をよく見せるための、手っ取り早く実践できるお手軽なテクニッ クを紹介する (実は難しいものも混ざっているが)。ここでいう作 品とは主にソフトウェアや研究成果のことを想定している。他にも いいテクニックがあればぜひ教えていただきたい。 目次 作品の公開 公開する Webページを作る いい名前をつける 宣伝する 作品を公開する理由 作品を公開しない理由 作品の表現 作品の見せ方に気を配る プレゼン資料の作り方 プレゼンの仕方 ソフトのデモの仕方 Webページの作り方 図の描き方 色の選び方 フォントの選び方 クリップアートの使い方 グラフの描き方 表の描き方 ビデオの作り方 写真の撮り方 文章の書き方 その他 他人の作品および作品の表現 参考文献 あとがき 謝辞 作品の公開 公開する 公開されていない作品は存
次へ: はじめに サポートベクターマシン入門 栗田 多喜夫 Takio Kurita 産業技術総合研究所 脳神経情報研究部門 Neurosceince Research Institute, National Institute of Advanced Indastrial Science and Technology takio-kurita@aist.go.jp visitors since Jul. 19, 2002. 概要: 最近、サポートベクターマシン(Support Vector Machine, SVM)と呼ばれるパター ン認識手法が注目されており、ちょっとしたブームになっている。カーネルトリッ クにより非線形の識別関数を構成できるように拡張したサポートベクターマシン は、現在知られている多くの手法の中でも最も認識性能の優れた学習モデルの一 つである。サポートベクターマ
最近よく巷で耳にするモノ. SVM, Support Vector Machine, さぽーとべくたーましん. これっていったい,どんなもんなんでしょう. なにやら便利そうなモノらしいので,ちょいと調べて要点をまとめてみようかな,なんて. でも,ただまとめただけだとそのへんの記事を読むのとなんにも変わらないので, コーディングするために必要な知識を中心にまとめてみることにします.
Profile 名前 工藤 拓 (くどう たく) 職業 研究者 写真 お台場にて ルスツにて 暇つぶし ウクレレ, スノーボード, ジャグリング, ダーツ Research Topics 統計的自然言語処理 形態素解析 テキストチャンキング 統計的統語解析 統計的係り受け解析 機械学習 Support Vector Machines Boosting Maximal Margine Classifiers データマイニング 半構造化データの高速マイニング テキストマイニング 評判分析 Software MeCab (次世代 形態素解析 エンジン) CaboCha (係り受け解析器) CRF++ (汎用 Tagger,Chunker based on CRF) YamCha (汎用 Tagger,Chunker based on SVM) TinySVM (SVM 学習パッケージ) Tin
第4章 マルコフ連鎖 4.1 確率行列 4.1.1 確率行列 4.1.2 同時確率 4.1.3 同時確率行列 4.1.3.1 例1 4.1.3.2 例2 4.1.4 条件付確率行列 4.1.5 確率行列の式 4.1.6 行列演算 4.1.6.1 例 4.2 マルコフ連鎖 4.2.1 マルコフ連鎖の定義 4.2.2 マルコフ連鎖における同時確率 4.2.2.1 例1 4.2.2.2 例2 4.3 定常性 4.3.1 定常性 4.3.2 非定常的ランダムウォーク 例1 4.3.3 非定常的ランダムウォーク 例2 4.3.3.1 余談(エントロピー増大) 4.3.3.2 余談(ブラウン運動) 4.4 状態遷移図とエルコード性 4.4.1 状態遷移図 4.4.2 エルコード性 4.4.2.1 例 〇 章末テスト
ようこそ! 長岡技術科学大学 電気系 自然言語処理研究室へようこそ。本研究室では、自然言語処理とテキストマイニングに関する様々な研究を行っています。 最近の研究室 国際会議に2件採録されました(9/4) 今年11月にフィリピンのセブ島で開催される自然言語処理に関する国際会議 PACLIC 22に本研究室から2件の論文が採録されましたので ご報告します。 Extracting Troubles from Daily Reports based on Syntactic Pieces [ 国際会議#08PACLIC-kakimoto ] Generating Story Reviews Using Phrases Expressing Emotion [ 国際会議#08PACLIC-ota ] オープンハウスを開催しました(8/25-29) 今年度もオープンハウスを開催して、「人工無
人工無脳、またはチャットボットは人間のような知能を持っていません。 にもかかわらず私達は彼らとの会話に魅力を感じ、癒やされ、 時には感情を揺さぶられます。 それはなぜなのか。 チャットボットとは何なのか。 一見単純に見えるプログラムの奥に潜む、ディープな世界を探ります。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く