タグ

形態素解析に関するKOBA5884のブックマーク (5)

  • 人工無能を作ろう〜形態素解析(php)

    phpでChaSenを使って形態素解析をする際のサンプルです。 プログラムの文字コードはEUC-JPで、CGIとして実行できブラウザから実行結果を確認できるように書いてます。 下記ソースは汚染チェック・エラーチェック等を行ってませんので、ご利用の際にはご注意下さい。 実行結果: このソースを実行すると、以下のように表示されます。 僕 / ボク / 僕 / 名詞-代名詞-一般 / / は / ハ / は / 助詞-係助詞 / / 今日 / キョウ / 今日 / 名詞-副詞可能 / / 牛 / ウシ / 牛 / 名詞-一般 / / 丼 / ドンブリ / 丼 / 名詞-一般 / / を / ヲ / を / 助詞-格助詞-一般 / / べ / タベ / べる / 動詞-自立 / 一段 / 連用形 まし / マシ / ます / 助動詞 / 特殊・マス / 連用形 た /

  • mecab + PHP で形態素解析(出現頻度) - 真夜中のプログラミングTips

    mecab + PHP形態素解析をやってみたときのメモです。Yahoo!さんの日形態素解析API や mecab PHP 用の拡張モジュールもありますが、windows vista PC にインストールした mecab を直接使用し、その結果をPHPでパースして出現頻度を算出する、ということをやってみました。 - ※もしかしてはまった人も?? 手元の Windows Vista PC では、mecab を 「C:\Program Files」フォルダ以下にインストールしたところ、mecab を実行できませんでした。「C:\myapp\mecab」のようにスペースを含まないフォルダにインストールしたら実行できました。 - 参考にしたのは以下の人力検索。 PHPについて質問致します。 形態素解析を行うにあたっていくつかの形態素解析エンジンを比較していった結果、 MeCab(http:/

    mecab + PHP で形態素解析(出現頻度) - 真夜中のプログラミングTips
  • JUMAN

    形態素解析システム JUMAN システムは, 計算機による日語の解析の研究を目指す多くの研究者に共 通に使える形態素解析ツールを提供するために開発されました。その際, 学校 文法が計算機向きではないという問題を考慮し, 使用者によって文法の定義, 単語間の接続関係の定義などを容易に変更できるように配慮しました。 新バージョン5.Xの拡張点の概要は以下の通りです. 日語の基的語彙,約3万語(固有名詞を除く)を選定した. 表記バリエーションの整備を行い,代表表記を出力することとした. その他の整備(読みの音訓情報の付与,「読ます」「読まされる」などの使役形への対応) 例えば,以下のような解析結果がえられます. % cat sample.txt 子どもはリンゴがすきだ かぜでおくれた % juman -B -e2 < sample.txt 子ども こども 子ども 名詞 6

  • 形態素解析の茶筅

    ChaSen -- 形態素解析器 はじめに 形態素解析器とは、入力文を単語単位に分割し品詞を付与するツールである。 新着情報 2011-11-16 (wed) See JPCERT Report. 茶筌の配布 ダウンロード あらかじめ iconvと Darts-0.31のインストールが必要です。 chasen-2.3.3 辞書は別配布になっています。 ipadic-2.7.0 日語辞書 UniDic 日語辞書 NAIST-Japanese-dic 日語辞書(奈良先端大より公開予定) NAIST-Chinese-dic 中国語語辞書(奈良先端大より公開予定) 著作権および仕様条件について 茶筌システムは,広く自然言語処理研究に資するため無償のソフトウェアとして開発されたものである.茶筌の著作権は,奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座(松研究室)が保持する.ソフ

  • ChaSen's Wiki

    メニュー 茶筌の配布 Anonymous CVS による配布 ソースからのインストール 辞書の作り方 FAQ 新着情報 茶筌バージョンアップ履歴 MailingList 関係者一覧 LINK 最新の20件 2007-03-23 FrontPage 2006-09-20 ソースからのインストール 2005-10-24 Anonymous CVS による配布 2005-08-20 LINK 2005-07-22 質問箱 SideMenu 2005-03-09 WinChaのインストール 2004-11-10 茶筌の配布 2004-11-09 新着情報 茶筌サーバ 2004-03-26 MailingList 2004-01-26 制約つき解析 2003-12-26 辞書定義ファイルのフォーマット 2003-12-25 辞書の作り方 2003-11-27 バグ情報 2003-10-24 FAQ:

  • 1