[B! nlp] maxyのブックマーク

maxy id:maxy

nlpに関するmaxyのブックマーク (16)

Loading...
maxy 2012/03/02
corpus

japanese

python

nltk

nlp
リンク
LIBLINEARを用いた機械学習入門(単語分割)
このページでは機械学習のツール(LIBLINEAR)を利用して、実際に分類問題を解くにはどういう手順を経るかということについて解説します。つまり、Kytea(京都テキスト解析ツールキット)における簡易版の単語分割モデルを作ってみようということです。なお今回はプログラミング言語としてRubyを用いますが、Rubyの知識がなくても実装ができるように解説するよう心がけます。また、必要以上に細かく書いてあるかもしれませんが、不要な方は適宜読み飛ばして下さい。細かい説明はすっとばしてやり方を見る機械学習って？朱鷺の杜Wiki 「機械学習」がわかりやすいかと思います。ひとことで言うと、「訓練データを与えてそこから機械に問題の解き方を学んでもらい、別の問題を解いてもらうこと」です。教師あり学習・教師なし学習機械学習は大きく「教師あり」と「教師なし」に分かれます。「教師あり学習」とは
maxy 2011/05/30
ruby

nlp

liblinear
リンク
FLCLjp/iPhone-libmecab - GitHub
HTTP Git Read-Only This URL has Read+Write access
maxy 2010/12/29
iphone

nlp

mecab
リンク
ヽ（´・肉・｀）ノログ(2010-12-08)
_ [ruby][planet] Ruby で日本語を簡単にバラバラにする方法（この記事はRuby Advent Calendar jp: 2010 : ATNDの8日目です。前日はtakano32さんでした。）日本語をバラバラにする方法っていくつかあるみたいですが，そのうちn-gramと形態素解析を簡単に使えるようにしてみました．形態素解析を使う場合にはYahooの日本語形態素解析を内部で用いているのでYahooのアプリケーションIDを登録して下さいね．Ruby1.9 で動きます． # -*- coding: utf-8 -*- module StringTokenizer require 'uri' require 'net/http' require 'rexml/document' class IdIsNotSetException < Exception; end def
maxy 2010/12/08
ruby

n-gram

nlp
リンク
perlで高速な類似検索エンジンを構築できるようにしてみた - download_takeshi’s diary
すみません。タイトルはやや釣り気味です。類似検索エンジンというか、そのアイデア程度の話なんですが、以前から考えていた類似検索エンジン風のネタがあったので、ちょっとperlで書いてみたので、そいつを晒してみます。 Luigi 　 https://github.com/miki/Luigi 類似検索なのでLuigi。ルイージとか読みたい人はそう読んじゃっても良いです。（冷）考え方と仕組み類似文書の検索、となりますと一般的には超高次元での空間インデックスとかが必要になります。昔からR-TreeやSR-Treeなど、いろいろと提案されていますが、より高次元になると「次元の呪い」によりパフォーマンスが出なくなる、なんて言われていますね。そこで最近ではLSHに代表されるような、より高度な「近似」型のインデキシング手法が人気を集めているようです。で、今回考えたLuigiも実は近似型のインデッ
maxy 2010/11/22
perl

nlp
リンク
Loading...
maxy 2010/11/09
python

japanese

nlp

nltk
リンク
nltk - Google Code
Code Archive Skip to content Google About Google Privacy Terms
maxy 2010/11/09
python

nltk

nlp
リンク
NLTK :: Natural Language Toolkit
Natural Language Toolkit¶ NLTK is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning, wrappers for industrial-strength NLP libraries, and an ac
maxy 2010/11/09
nlp

python

nltk
リンク
Perl で自然言語処理
PyData Tokyo 05 でのLTのプレゼン資料です。絵文字に対応した mecab-ipadic-NEologd は以下からダウンロードできます。 https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md 以下は資料のまとめです。 - mecab-ipadic-NEologdで絵文字に読みを付与するためのエントリを”試験的”に追加したという話 -mecab-ipadicと併用すれることで、絵文字の読み・原型の文字列で検索が可能になりました - 応用 => 言語処理・音声処理・コンテンツ監視等が考えられます - 今後アノテーションは徐々に改善していきます
maxy 2010/10/17
perl

nlp
リンク
Google Code Archive - Long-term storage for Google Code Project Hosting.
Code Archive Skip to content Google About Google Privacy Terms
maxy 2010/10/10
tokenizer

china

nlp
リンク
テキスト解析 - Yahoo!デベロッパーネットワーク
LINEヤフーが提供するテキスト解析WebAPI 日本語形態素解析日本語文を形態素に分割し、品詞、読みがなの付与、統計情報を取得できる機能を提供します。かな漢字変換ローマ字、ひらがなの文を文節に区切り、変換候補を提示します。短い文字列から変換候補を推測するモードも提供します。VJEと同じ方式のかな漢字変換です。ルビ振り漢字かな交じり文に、ひらがなとローマ字のふりがな（ルビ）を付けます。校正支援日本語文の校正作業を支援します。文字の入力ミスや言葉の誤用がないか、わかりにくい表記や不適切な表現が使われていないかなどをチェックします。日本語係り受け解析日本語文の係り受け関係を解析する機能を提供します。キーフレーズ抽出日本語文を解析し、特徴的な表現（キーフレーズ）を抽出します。自然言語理解日本語文を解析し、情報の抽出を行う機能を提供します。固有表現抽出日本語文を解析し
maxy 2009/07/28
yahoo

nlp

text mining

api

morphological analysis
リンク
Introduction to Information Retrieval
This is the companion website for the following book. Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. You can order this book at CUP, at your local bookstore or on the internet. The best search term to use is the ISBN: 0521865719. The book aims to provide a modern approach to information retrieval from a co
maxy 2008/09/12
algorithm

information retrieval

nlp

research
リンク
茶まめ用E-KWIC - コーパス日本語学のための情報館
ダウンロードはこちらから使用法の詳細や問い合わせは、上記リンクのzip内にあるreadme.txtをご覧ください。あなたはこのページの - 番目の閲覧者です。
maxy 2008/03/27
corpus

japanease

nlp
リンク
汎用連想計算エンジン GETA ファミリー
汎用連想計算エンジンGETA ファミリー公開 Siteこのページでは, 汎用連想計算エンジンGETA を紹介しています. GETA の実装はいくつかありますが, そのうち公開されているものは現在 2 つあります. 汎用連想計算エンジンGETA ファミリー公開ＨＰ初代 GETA はこちらから配布されています. 最新版は GETA3.2u です.GETAssocGETAssoc は, もうひとつの GETA の実装です. Last Modified Tue Jul 21 14:12 JST 2009
maxy 2008/03/15
engine

geta

search

search engine

nlp

text mining
リンク
Speech and Language Processing (2nd Ed.): Updates
Chapter 1: Introduction This chapter is largely the same with updated history and pointers to newer applications. (top) Chapter 2: Regular Expressions and Automata This chapter is largely the same with some bug fixes. (top) Chapter 3: Words and Transducers This new version of the chapter still focuses on morphology and FSTs, but is expanded in various ways. There are more details about the formal
maxy 2008/03/12
nlp

research
リンク
FrontPage - 情報論的学習理論と機械学習の「朱鷺の杜Wiki」
朱鷺の杜Wiki（ときのもりうぃき）† 朱鷺の杜Wikiは，機械学習に関連した，データマイニング，情報理論，計算論的学習理論，統計，統計物理についての情報交換の場です．これら機械学習関係の話題，リンク，関連事項，書籍・論文紹介などの情報を扱います．更新されたページを確認するにはRSSリーダを使って右下のRSSリンクをチェックするか，最終更新のページを参照してください．ページの中でどこが更新されたかを見るには，上の「差分」をクリックして下さい．数式の表示に MathJax を利用しています．数式の上でコンテキストメニューを使うと各種の設定が可能です．特に設定をしなくても数式は閲覧できますが，フォントをインストールすれば数式の表示がきれいで高速になります．詳しくは数式の表示のページを参照して下さい．ごく簡単なWikiの使い方がこのページの最後にあります．トップページやメニューなど
maxy 2008/03/12
datamining

nlp

research

statistics
リンク
1