sigewoのブックマーク / 2008年11月10日

sigewo id:sigewo

2008年11月10日のブックマーク (12件)

ビタビアルゴリズム
ビタビ・アルゴリズム　Ｖｉｔｅｒｂｉ　ａｌｇｏｒｉｔｈｍホーム情報通信のハイパーテキストは下記へ移動しました。 http://www.mnc.toho-u.ac.jp/v-lab/ お探しの内容は、下記の目次にあります。 http://www.mnc.toho-u.ac.jp/v-lab/yobology/index.htm
sigewo 2008/11/10
リンク
http://ir.cs.yamanashi.ac.jp/~ysuzuki/taiwa/
sigewo 2008/11/10
NLP

lesson

pdf
リンク
文節数最小法を用いたべた書き日本語文の形態素解析 | CiNii Research
JaLC IRDB Crossref DataCite NDLサーチ NDLデジコレ（旧NII-ELS） RUDA JDCat NINJAL CiNii Articles CiNii Books DBpedia Nikkei BP KAKEN Integbio MDR PubMed LSDB Archive 極地研ADS 極地研学術DB OpenAIRE 公共データカタログムーンショット型研究開発事業
sigewo 2008/11/10
cinii

dissertation

morphological analysis
リンク
形態素解析仕様書(案)
株式会社Jurabi 概要形態素解析では、与えられた原文を形態素に分解する処理を行う。形態素とは、文節を構成する最小単位である。文節を正規表現風に記述すると、 (接頭辞)*(自立語)+(接尾辞|付属語)* という構造をもつ。ここで、接頭辞、自立語、接尾辞、付属語が形態素になる。以下の記述においては、形態素のことを、単に「語」と呼ぶことがある。形態素解析は以下のようなステップで実行される。形態素同定形態素間の連接可能性によるラティス構造の生成コスト最小法に基づく n -best解の取得最終的に得られたn 個の解が、次のフェーズである構文解析に渡される。形態素同定形態素の同定とは、与えられた原文文字列の中で、どの部分が形態素になりうるかを決定する作業である。形態素は、辞書引き未知語解析局所解析によって同定される。辞書引き原文中のあるポイントが与えられたとき
sigewo 2008/11/10
morphological analysis
リンク
文書間の類似度に基づく論文検索システムの開発と評価 Development and Evaluation of Thesis Retrieval System Based on Document Similarity 八太絵美* 福本徹** 横山節雄* 赤堀侃司** Emi HATTA Toru FUKUMOTO Setsuo YOKOY
sigewo 2008/11/10
dissertation

pdf

NLP
リンク
ChasenとKakasiとMeCabの形態素解析・わかち書きの比較
Chasen(2.3.3)とKakasi(2.3.4)とMeCab(0.91)の形態素解析の結果を比較できます。Chasenはここに書いてある設定をしてあります。処理の比較等はMeCabのページ等に載っています。MeCabも近いうちに追加いたします。 04.7.8 - MeCabを追加しました。形態素解析するテキスト解析するテキストを入力して送信ボタンをクリック >>
sigewo 2008/11/10
morphological analysis
リンク
形態素解析の茶筅
ChaSen -- 形態素解析器はじめに形態素解析器とは、入力文を単語単位に分割し品詞を付与するツールである。新着情報 2011-11-16 (wed) See JPCERT Report. 茶筌の配布ダウンロードあらかじめ iconvと Darts-0.31のインストールが必要です。 chasen-2.3.3 辞書は別配布になっています。 ipadic-2.7.0 日本語辞書 UniDic 日本語辞書 NAIST-Japanese-dic 日本語辞書（奈良先端大より公開予定） NAIST-Chinese-dic 中国語語辞書（奈良先端大より公開予定）著作権および仕様条件について茶筌システムは，広く自然言語処理研究に資するため無償のソフトウェアとして開発されたものである．茶筌の著作権は，奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座(松本研究室)が保持する．本ソフ
sigewo 2008/11/10
NLP

morphological analysis
リンク
SFC-GC
http://www.sfc.keio.ac.jp/~ishizaki/jugyou/nl06.htm 人間がコンピュータに話しかけて電子メール文を作ったり､インターネットで日本語を入力すると翻訳して世界中の情報を検索できれば､コンピュータはさらに一段と使いやすくなるでしょう｡このように､近い将来にコンピュータの言語能力は大きく進歩するに違いないと思います｡しかし､人間が日常生活で言葉を使用するとき､意識はしないけれども実に多くの種類の知識を駆使しています｡テレビを見たり新聞を読む時､文章を書く時､電話で友達と話す時など多数あります｡そのときは日本語の文法だけでなく内容に関する知識や一般的な常識も重要です｡この授業では､コンピュータが自然言語を理解するために必要な概念や手法を学ぶと同時に､入力した文の構文と意味を解析する簡単なシステムで実習します｡コンピュータ
sigewo 2008/11/10
NLP

pdf

lesson
リンク
今日の井原. - 文章要約プログラムを書いてみよう！<br>　その３　～Chasen～　
エンジニアの未来サミット天才プログラマの人たちは自分にふさわしい場所をちゃんと選ばないとだめだよ断酒の件 [読書] 転職活動のために読んだ本、６冊　（プレゼント企画もあるよ！）りくなびねくすと Joshua Davis 会社を辞めるのは悪いことじゃないよ [読書]人工知能のパラドックス僕のお給料寝転がりながら本を読む GoogleFileSystemの開発者として知られるHoward Gobioff氏が死去 [読書]3年で辞めた若者はどこへ行ったのかはてな広告商品のご案内（PC版） 500日ぶりのこんにちは！ feedmeterなリファラスパム？　の謎
sigewo 2008/11/10
morphological analysis

NLP
リンク
ゆう度付き形態素解析用の汎用アルゴリズムとそれを利用したゆう度基準の比較 | CiNii Research
sigewo 2008/11/10
cinii

dissertation

morphological analysis

NLP
リンク
漢字と読み方があれば、対応できるアルゴリズムがありますか？ - たとえば、東京工業大学[とうきょうこうぎょうだいがく]こうなります：東... - Yahoo!知恵袋
自然言語処理の研究をしているものです。基本的には、ご指摘のWikipediaのページ書かれているchasenかmecabを使用するのが一般的です。商用を含め、多くの応用・研究場面で、単語に分割する目的で使用されているはずです。自作するのは大変なので、単に単語に分割をしたいのであれば、chasenかmecab、JavaであればSen（mecabのJavaへの移植バージョン）を使用するのがよいと思われます。 http://www.mlab.im.dendai.ac.jp/~yamada/ir/MorphologicalAnalyzer/Sen.html Webサービスで利用したいのであれば、Yahooが去年、形態素解析エンジンをWeb APIとして公開していますので、それを利用するのがよいかと思います。 http://www.itmedia.co.jp/news/articles/070
sigewo 2008/11/10
morphological analysis

question
リンク
Taku Kudo
Profile 名前工藤拓 (くどうたく) 職業研究者写真お台場にてルスツにて暇つぶしウクレレ, スノーボード, ジャグリング, ダーツ Research Topics 統計的自然言語処理形態素解析テキストチャンキング統計的統語解析統計的係り受け解析機械学習 Support Vector Machines Boosting Maximal Margine Classifiers データマイニング半構造化データの高速マイニングテキストマイニング評判分析 Software MeCab (次世代形態素解析エンジン) CaboCha (係り受け解析器) CRF++ (汎用 Tagger,Chunker based on CRF) YamCha (汎用 Tagger,Chunker based on SVM) TinySVM (SVM 学習パッケージ) Tin
sigewo 2008/11/10
NLP

morphological analysis
リンク
- 2008年11月13日
- 2008年11月10日
- 2008年11月9日