並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 102件

新着順 人気順

chasenの検索結果1 - 40 件 / 102件

  • ChaSen.org

    サービス Ajax IME: Webベースの日本語入力。特別なソフトは必要ありません。 Ajax 手書き文字認識: Webベースの日本語手書き文字入力� 個人ページ Taku Kudo's page 本サイトの運営者です

    • ChaSen's Wiki

      メニュー 茶筌の配布 Anonymous CVS による配布 ソースからのインストール 辞書の作り方 FAQ 新着情報 茶筌バージョンアップ履歴 MailingList 関係者一覧 LINK 最新の20件 2007-03-23 FrontPage 2006-09-20 ソースからのインストール 2005-10-24 Anonymous CVS による配布 2005-08-20 LINK 2005-07-22 質問箱 SideMenu 2005-03-09 WinChaのインストール 2004-11-10 茶筌の配布 2004-11-09 新着情報 茶筌サーバ 2004-03-26 MailingList 2004-01-26 制約つき解析 2003-12-26 辞書定義ファイルのフォーマット 2003-12-25 辞書の作り方 2003-11-27 バグ情報 2003-10-24 FAQ:

      • ChasenとKakasiとMeCabの形態素解析・わかち書きの比較

        Chasen(2.3.3)とKakasi(2.3.4)とMeCab(0.91)の形態素解析の結果を比較できます。Chasenはここに書いてある設定をしてあります。処理の比較等はMeCabのページ等に載っています。MeCabも近いうちに追加いたします。 04.7.8 - MeCabを追加しました。 形態素解析するテキスト 解析するテキストを入力して送信ボタンをクリック >>

        • 【コラム】Yet Another 仕事のツール (45) 日本語形態素解析ツール「ChaSen」 | エンタープライズ | マイコミジャーナル

          ITの世界は理系の人間が幅をきかせていると思われがちだが、システムインテグレーションの現場では、意外と文系的な素養が求められることも多い…… などという無理なこじつけはさておき、今回は「日本語」を扱う上で欠かせないツールを紹介しよう。 以前、「MUSASHI」というオープンソースのツールを使って「データマイニング」の基本的な手法を紹介したことがあったが、データはなにもデータベースやXMLとして整理されたものばかりではない。むしろ日本語なら日本語という自然言語で記述されたデータの方が、量的には圧倒的に多いはずだ。例えば、顧客や同僚と毎日のようにやりとりしているメールなどは、データとしてみれば宝の山だし、実際昔のメールを消せずにずっと残しているという人も多いだろう。ただ、日々増え続けていくメールを溜まるがままにしておいても、せいぜいメールソフトの検索機能を使って備忘録にするぐらいしか有効な使い

          • 【コラム】Yet Another 仕事のツール (45) 日本語形態素解析ツール「ChaSen」 | エンタープライズ | マイコミジャーナル

            ITの世界は理系の人間が幅をきかせていると思われがちだが、システムインテグレーションの現場では、意外と文系的な素養が求められることも多い…… などという無理なこじつけはさておき、今回は「日本語」を扱う上で欠かせないツールを紹介しよう。 以前、「MUSASHI」というオープンソースのツールを使って「データマイニング」の基本的な手法を紹介したことがあったが、データはなにもデータベースやXMLとして整理されたものばかりではない。むしろ日本語なら日本語という自然言語で記述されたデータの方が、量的には圧倒的に多いはずだ。例えば、顧客や同僚と毎日のようにやりとりしているメールなどは、データとしてみれば宝の山だし、実際昔のメールを消せずにずっと残しているという人も多いだろう。ただ、日々増え続けていくメールを溜まるがままにしておいても、せいぜいメールソフトの検索機能を使って備忘録にするぐらいしか有効な使い

            • chasen & Namazu のインストールメモ

              説明と環境 このメモは、日本語の全文検索システムとして広く利用されている Namazu をソースからインストールしたときのメモです。 最近、Namazu をもっと簡単にインストールすることを目指すプロジェクトとして、Kabayaki があります。楽をしたい人はそちらからバイナリパッケージなどをダウンロード、インストールを行った方がいいかもしれません。また、VineLinux などでは、最初から Namazu がインストールされていますので、特別な理由がない限りソースからインストールする必要はありません。 このメモは、RedHat Linux 7.3 で作成しました。ソースからインストールを行っていますので、Unix 系の OS であれば、同じような手順でインストールできると思います。 ただし、ツールのバージョンの変更や、OS の固有の設定などの違いにより、このメモの通りに操作しても、うまく

              • JVN#16901583: 茶筌 (ChaSen) におけるバッファオーバーフローの脆弱性

                奈良先端科学技術大学院大学の提供する茶筌 (ChaSen) には、バッファオーバーフローの脆弱性が存在します。 茶筌 (ChaSen) version 2.4.4 およびそれ以前茶筌 (ChaSen) version 2.3.3 およびそれ以前上記バージョンの茶筌 (ChaSen) を組み込んでいるソフトウェアが本脆弱性の影響を受けます。 奈良先端科学技術大学院大学の提供する茶筌 (ChaSen) は、日本語の形態素解析をするためのソフトウェアです。茶筌 (ChaSen) には、文字列の読み込みに問題があり、バッファオーバーフローの脆弱性が存在します。 なお、茶筌 (ChaSen) は一時的に開発が停止していましたが、2011年12月8日より、ChaSen legacy プロジェクトによって開発が再開されました。

                • [を] Text::ChaSen のインストールメモ

                  Text::ChaSen のインストールメモ 2006-02-24-3 [Tips][NLP] Perl モジュール Text::ChaSen を使ってみたい!というわけで、 すっかりメンテナンスされてない chasen をソースからインストール。 オフィシャルページ <http://chasen.naist.jp/> にある 「ソースからのインストール」を参考に。 ■darts の install のポイント: <http://www.chasen.org/~taku/software/darts/> darts 0.3 だと chasen-2.3.3 のコンパイルに失敗する。 理由は darts 0.3 からのメソッド名変更。 メッソド名の一部変更 (setArray を set_array になど) そこで darts 0.2 を使う。リンクはないので、以下のUR

                  • ChaSen.org

                    サービス Ajax IME: Webベースの日本語入力。特別なソフトは必要ありません。 Ajax 手書き文字認識: Webベースの日本語手書き文字入力� 個人ページ Taku Kudo's page 本サイトの運営者です

                    • UTF8対応のChaSenインストール : blog.nomadscafe.jp

                      UTF8対応のChaSenインストール UTF-8対応のChaSenのインストールメモ 環境はCentOS 4.1です。 PcWebのYet Another 仕事のツールの「 第45回 日本語形態素解析ツール「ChaSen」」を参考にしました。 Dartsのインストール # wget http://chasen.org/~taku/software/darts/src/darts-0.2.tar.gz # tar zxf darts-0.2.tar.gz # cd darts-0.2 # ./configure --prefix=/usr # make # make install ChaSenのインストール # wget http://chasen.aist-nara.ac.jp/stable/chasen/chasen-2.3.3.tar.gz # tar zxf chasen-2.3

                      • ChaSen's Wiki - FrontPage

                        Generated by Hiki 0.5-devel-20030823. Powered by Ruby 1.8.6 and Amrita. Founded by NAIST Computational Linguistics Lab.

                        • [を] ChaSenで半角文字列を文字に区切らないようにする

                          ChaSenで半角文字列を文字に区切らないようにする 2006-02-25-3 [Tips] 茶筌ネタ。 半角アルファベット・数字を文字単位に区切らないようにするには? デフォルトだとこうなってしまいます: % chasen 第26回Wiki小話 第 ダイ 第 接頭詞-数接続 2 ニ 2 名詞-数 6 ロク 6 名詞-数 回 カイ 回 名詞-接尾-助数詞 W ダブリュー W 記号-アルファベット i アイ i 記号-アルファベット k ケイ k 記号-アルファベット i アイ i 記号-アルファベット 小話 コバナシ 小話 名詞-一般 EOS そこで chasenrc を ~/.chasenrc にコピーして、 ;(COMPOSIT_POS ((名詞 数)) ; ((記号 アルファベット))) のコメント(行頭のセミコロン)を取ります。 するとアルフ

                          • ChaSen のインストール方法

                            日本語全文検索システム Namazu では、分かち書きに茶筌(ChaSen)を使用することができます。 ここでは ChaSen の標準的なインストール手順をしめします。 (chasen 2.3.3 のインストール方法は、こちら。) インストールに必要なもの: 下記のバージョンを対象として、インストール手順をしめします。 (バージョンが異なる場合は、多少インストール手順が異なることがあります。詳しくは付属ドキュメントをご覧ください。) (必要に応じて)libiconv-1.10.tar.gz 日本語パッチ libiconv-1.10-ja-1.patch.gz darts-0.32.tar.gz ipadic-2.7.0.tar.gz chasen-2.4.5.tar.gz darts のインストール: 解凍 tarball を解凍したい場所に置いて、tar でアーカイブを解凍します。

                            • ChaSen's Wiki - FrontPage

                              メニュー 茶筌の配布 Anonymous CVS による配布 ソースからのインストール 辞書の作り方 FAQ 新着情報 茶筌バージョンアップ履歴 MailingList 関係者一覧 LINK 最新の20件 2007-03-23 FrontPage 2006-09-20 ソースからのインストール 2005-10-24 Anonymous CVS による配布 2005-08-20 LINK 2005-07-22 質問箱 SideMenu 2005-03-09 WinChaのインストール 2004-11-10 茶筌の配布 2004-11-09 新着情報 茶筌サーバ 2004-03-26 MailingList 2004-01-26 制約つき解析 2003-12-26 辞書定義ファイルのフォーマット 2003-12-25 辞書の作り方 2003-11-27 バグ情報 2003-10-24 FAQ:

                              • Ubuntuに形態素解析(ChaSen,Mecab)をインストール - taoru's memo

                                形態素解析も扱いたくなったのでインストール Chasen、MeCab、Igoやら色々あるけれど、 Chasen の方が MeCabより早い(?) いや、でもMeCabの方が早いって書いてあるし…こことか もう両方インストールしておく。 $ apt-cache search chasenで、chasenが含まれるパッケージ検索できるっぽい。 たくさんでるけど、 $ sudo apt-get install chasenで必要なもの一式はインストールされるようだ。 次、MeCab $ sudo apt-get install mecab libmecab-devmecab(0.97-1)が入った。 辞書データ(utf8の)もいれる $ sudo apt-get install mecab-ipadic-utf8 mecab-jumandic-utf8上記Mecabインストールを全部まとめて $

                                  Ubuntuに形態素解析(ChaSen,Mecab)をインストール - taoru's memo
                                • ChaSen legacy プロジェクト日本語トップページ - OSDN

                                  ログインしていません。投稿を区別するために投稿者のニックネームをつけてください(ニックネームの一意性は保証されません。全く別の人も同じ名前を利用することが可能ですので本人であることの特定には利用できません。本人であることを保証したい場合にはログインして投稿を行なってください)。 ログインする

                                    ChaSen legacy プロジェクト日本語トップページ - OSDN
                                  • ChaSen - Wikipedia

                                    ChaSen(茶筌)は、形態素解析ツールのひとつ。奈良先端科学技術大学院大学松本研究室で開発された。 ベースとなった形態素解析ツールは JUMAN であるが、統計的な手法を用いており、解析速度と使い勝手の向上を目指している。現在はIPA品詞体系を使用しており、JUMAN とはその方向性が異なっている。 開発元が所在する奈良県生駒市高山町では茶筌が特産品であり、本ツールの名称はこの茶筌に由来する[1]。 参考文献[編集] ^ “ChaSen -- 形態素解析器”. 2013年1月27日閲覧。 関連項目[編集] 形態素解析 MeCab 外部リンク[編集] chasen legacy (最新バージョンの一次配布元) chasen legacy ソースコード (最新バージョンの一次配布元) 形態素解析システム『茶筌』version 2.4.0使用説明書 ChaSen's Wiki (旧ChaSen

                                    • ChaSen's Wiki - 茶筌の配布

                                      茶筌システムは,広く自然言語処理研究に資するため無償のソフトウェアとして開発されたものである.茶筌の著作権は,奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座(松本研究室)が保持する.本ソフトウェアの使用,改変,再配布については,特に制限を課すことはしない.詳しくはマニュアル裏表紙の copyright notice を参照のこと. なお,本ソフトウェアの著作権者である奈良先端科学技術大学院大学は,原形あるいは改変された形で配布された本ソフトウェアに関連して生じる一切の損失に対して保証の責を負わないこととする. 2.3.0 より、広告条項がなくなりました。また、Dartsを必要としますので、 Darts をリンクした場合、Darts のライセンスが生成物に波及する場合がありますので御注意ください。 辞書とシステムの分離に伴ない、2.2.1 よりシステムの Copyright の記

                                      • 【コラム】Yet Another 仕事のツール (45) 日本語形態素解析ツール「ChaSen」 | エンタープライズ | マイコミジャーナル

                                        ITの世界は理系の人間が幅をきかせていると思われがちだが、システムインテグレーションの現場では、意外と文系的な素養が求められることも多い…… などという無理なこじつけはさておき、今回は「日本語」を扱う上で欠かせないツールを紹介しよう。 以前、「MUSASHI」というオープンソースのツールを使って「データマイニング」の基本的な手法を紹介したことがあったが、データはなにもデータベースやXMLとして整理されたものばかりではない。むしろ日本語なら日本語という自然言語で記述されたデータの方が、量的には圧倒的に多いはずだ。例えば、顧客や同僚と毎日のようにやりとりしているメールなどは、データとしてみれば宝の山だし、実際昔のメールを消せずにずっと残しているという人も多いだろう。ただ、日々増え続けていくメールを溜まるがままにしておいても、せいぜいメールソフトの検索機能を使って備忘録にするぐらいしか有効な使い

                                        • XREAでPHPからChasenを使う (2007-03-17)

                                          MeCabは利用できないみたい。SSH経由でいろいろ見てみたけれどもMeCabはインスコされていないぽい。なのでChasenを使う。Chasenは連続する数字を一塊にしてくれないのが残念。あと半角英単語もそうなるので、半角文字については適宜全角に置き換えるようにする。 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html401/loose.dtd"> <title>Chasenテスト</title> <table> <?php $path = '/usr/local/php/bin/chasen'; $str = "浜松駅の耐震工事のために長いこと利用できなかったekimachi eastの工事が、予定通り3月15日までに終了した。これでマクドナルドやミスドにまた行

                                          • Text::ChaSen

                                            Text::ChaSenは、奈良先端科学技術大学が開発した日本語形態素解析 ソフトウェア 茶筌を、perlから利用するためのモジュールです。 同様のものに 茶筌サーバとそれをperlから利用するためのモジュールがありますが、 こちらのモジュールはスタンドアロンに動作する点が異なります。 Text-ChaSen-1.03.tar.gz 問題点 ChaSen 2.3.x 以降より、ChaSen 側で C++ template libray darts を 利用するようになり、この module を build する際に C++ libray のリンクが 必要になりました。 Makefile.PL の WriteMakefile に 'LD' => 'c++' 等を追加するか、 LIBS に -lstdc++ 等を追加して下さい。 pod の記述の不具合について、川合さんより報告がありました。次

                                            • ChaSen のインストール

                                              Landscape トップページ | < 前の日 2004-04-30 2004-05-01 次の日 2004-05-02 > Landscape - エンジニアのメモ 2004-05-01 ChaSen のインストール 当サイト内を Google 検索できます * ChaSen のインストールこの記事の直リンクURL: Permlink | この記事が属するカテゴリ: [ソフトウェア] 形態素解析をしたくなったので ChaSen をインストール。 cygwin 上の Perl か Ruby スクリプトから ChaSen に文字列を渡そうと思っている。パフォーマンスは考えなくていい用途なので、ChaSen 側インターフェイスは何でもいい。パイプかファイルで渡すのが楽そうだな。あ、でも Perl だったら chasen.pm があるんだっけ。Namazu のドキュメントに書いてあったような気

                                              • darts 0.32 + chasen 2.3.3 のインストールでエラーになる件

                                                mecab 使えよって言われそうですけど、サーバ切替で手数を少なくするため、アプリにはなるべく手を入れたくないであります。 といいつつも、必要最低限の部分には手を入れているわけですが、一部の古いアプリで chasen 2.3.3 を使ったヤツがありまして、仕方なく chasen のインストールをしました。ほとんどのアプリが mecab ベースで作ってあるので、当然のように darts は最新の 0.32 をインストールしてあります。 chasen 2.3.3 は darts 0.2 をベースとして作られているので darts が 0.3 系にあがったときの一部の仕様変更について行けてません。 結果としてコンパイルエラーが発生します。 dartsdic.cpp: In function 'darts_t* da_open(char*, char*, char*)': dartsdic.cpp

                                                • ChaSen's Wiki - 辞書の作り方

                                                  茶筌の辞書をつくるためには以下のファイルが必要です。 辞書定義ファイル *.dic 文法定義ファイル grammar.cha - 品詞定義ファイル ctypes.cha - 活用型定義ファイル cforms.cha - 活用形定義ファイル connect.cha - 連接表定義ファイル 一般に、ユーザーが変更を加えるのは辞書定義ファイルのみです。 辞書のコンパイルには makeda コマンドを使います。 この作業は文法定義ファイルのあるディレクトリでおこなう必要があります。 $ makeda dic_name input1.dic input2.dic dic_name には出力したい辞書ファイルのベースネーム(拡張子を除いたファイル名)を指定します。たとえば、user を指定すると、user.da、user.lex、user.dat が生成されます。 入力の辞書定義ファイルは複数指定でき

                                                  • rchasen: ChaSenの新たなRubyバインディング - llameradaの日記

                                                    SWIGの練習も兼ねて、ChaSenのRubyバインディングを書いてみた。 ChaSenのRubyバインディングは既に公開済みのものがある。しかし、メンテナンスされておらず、コンパイルに修正作業が必要だった。また、ChaSenが提供するAPIの内、一部しか利用できなかった。 今回、公開したバインディングでは、これらの問題を解決した(はずである)。 ダウンロードは下記のプロジェクトページから。 http://sourceforge.jp/projects/rchasen/ SWIGを使ったので、javaやpythonバインディングも作成可能です。暇ができたらチャレンジしてみます。

                                                      rchasen: ChaSenの新たなRubyバインディング - llameradaの日記
                                                    • MacにChasenをインストールする - はてブロ@ama_ch

                                                      研究に使うChasenを6時間かけてインストールしたので、備忘録としてメモ。 茶筌本体の用意 アップル - ダウンロード - ユーティリティ - Chasen Appleからパッケージが配布されているので、これをダウンロード、インストール。/usr/local/bin/chasen にインストールされます。 茶筌自体のインストールはこれで完了。コマンドで"chasen"と打てば動きます。 ただ、初期状態ではutf-8に対応していないので大体の変換がうまくいきません。utf-8に対応させるために、辞書ファイルを用意します。 辞書のセットアップ 茶筌から、日本語辞書ipadic-2.7.0をダウンロード。 ターミナルで、解凍したディレクトリ「ipadic-2.7.0」へ移動し作業します。 インストール作業はroot権限で行わないと完了できないので、まずrootでログイン $ cd ipadic

                                                        MacにChasenをインストールする - はてブロ@ama_ch
                                                      • Text::ChaSen のインストールメモ

                                                        Text::ChaSen のインストールメモ 2006-02-24-3 [Tips][NLP] Perl モジュール Text::ChaSen を使ってみたい!というわけで、 すっかりメンテナンスされてない chasen をソースからインストール。 オフィシャルページ <http://chasen.naist.jp/> にある 「ソースからのインストール」を参考に。 ■darts の install のポイント: <http://www.chasen.org/~taku/software/darts/> darts 0.3 だと chasen-2.3.3 のコンパイルに失敗する。 理由は darts 0.3 からのメソッド名変更。 メッソド名の一部変更 (setArray を set_array になど) そこで darts 0.2 を使う。リンクはないので、以下のURLで直接入手。 <h

                                                          Text::ChaSen のインストールメモ
                                                        • MacにChaSenをインストールするには - murapong's blog

                                                          形態素解析ツールのChaSenをMacにインストールするには以下のコマンドを実行します。Dartsやらnkfやらipadicもまとめてインストールしてくれます。 $ sudo port install chasenデフォルトのエンコーディングがEUC-JPになっているため、UTF-8やShift_JISのファイルを扱う場合は、-r と -i オプションを使います。 UTF-8: $ chasen -r /opt/local/etc/chasenrc-UTF-8 -i w <input>Shift_JIS: $ chasen -r /opt/local/etc/chasenrc-Shift_JIS -i s <input>早速テストしてみます。単語単位に分割され、品詞が付与された形式で結果が出力されます。 $ echo '私の名前はmurapongです。' | chasen -r /opt/

                                                            MacにChaSenをインストールするには - murapong's blog
                                                          • Chasen/辞書の更新 - 飴屋(ソフトウェア制作)

                                                            2008-08-22 開発日記 2008-05-28 WPF/日記13 WPF 2008-05-25 WPF/日記12 2008-05-20 WPF/日記11 2008-05-06 WPF/日記10 2008-05-02 WPF/日記9 2008-04-28 WPF/日記8 飴屋 2008-04-24 WPF/日記7 2008-04-22 WPF/日記6 2008-04-21 WPF/日記5 2008-04-07 WPF/日記4 WPF/日記3 2008-04-06 WPF/日記2 2008-04-04 WPF/日記1 プライバシーポリシー MenuBar 開発進捗 開発進捗/PP3アイテムビューワーver.1.70の開発 Chasen(茶筅)を使っていると、辞書に登録されていない単語がうまく 解析されないケースに出くわすことがままあります。少しぐらいの間違いは 精度の誤差の範囲内に片付け

                                                            • 形態素解析ツールMeCab, ChaSen, KyTea, JUMANをまとめてインストールしてみた - わいさわのエンジニアリング

                                                              形態素解析ツールをインストールするときに、毎回調べるのが億劫なので、まとめて備忘録にしてみました。最後には、簡単な形態素解析を時間計測しながら動作確認として行いました。 今回、インストールするOSは Cent OS 7 を対象にしています。 MeCab は、誰もが知っている有名な形態素解析ツールです。MeCab をインストールするのはかなり、簡単です。 # rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-1.noarch.rpm # yum install -y mecab mecab-ipadic mecab-jumandic mecab-devel これで、インストールは完了です。以下、辞書指定での mecab の起動方法です。 $ mecab -d /usr/lib64/mecab/dic/ipadi

                                                                形態素解析ツールMeCab, ChaSen, KyTea, JUMANをまとめてインストールしてみた - わいさわのエンジニアリング
                                                              • 茶筌chasen-2.4.2, Darts 0.31, UniDic1.3.5のインストール

                                                                最新版茶筌chasen-2.4.2をDarts 0.31、UniDic1.3.5と組み合わせてインストールしました。結構落とし穴があるようなので、参考のためにブログに記します。 Darts 0.31のインストール wget http://chasen.org/~taku/software/darts/src/darts-0.31.tar.gz tar xvzf darts-0.31.tar.gz cd darts-0.31 ./configure *configure error: C++ prerrocessor "/lib/cpp" fails sanity check などのエラーが出たら、C++のコンパイラがインストールされていないということなので、gcc-c++をインストールする。 yum install gcc-c++ そして作業再開。 make make install ch

                                                                • ChaSen のインストール方法

                                                                  日本語全文検索システム Namazu では、分かち書きに茶筌(ChaSen)を使用することができます。 ここでは ChaSen の標準的なインストール手順をしめします。 (chasen 2.3.3 のインストール方法は、こちら。) インストールに必要なもの: 下記のバージョンを対象として、インストール手順をしめします。 (バージョンが異なる場合は、多少インストール手順が異なることがあります。詳しくは付属ドキュメントをご覧ください。) (必要に応じて)libiconv-1.10.tar.gz 日本語パッチ libiconv-1.10-ja-1.patch.gz darts-0.32.tar.gz ipadic-2.7.0.tar.gz chasen-2.4.5.tar.gz darts のインストール: 解凍 tarball を解凍したい場所に置いて、tar でアーカイブを解凍します。

                                                                  • ChaSen のインストール方法

                                                                    日本語全文検索システム Namazu では、分かち書きに茶筌(ChaSen)を使用することができます。 ここでは ChaSen の標準的なインストール手順をしめします。 (chasen 2.3.3 のインストール方法は、こちら。) インストールに必要なもの: 下記のバージョンを対象として、インストール手順をしめします。 (バージョンが異なる場合は、多少インストール手順が異なることがあります。詳しくは付属ドキュメントをご覧ください。) (必要に応じて)libiconv-1.10.tar.gz 日本語パッチ libiconv-1.10-ja-1.patch.gz darts-0.32.tar.gz ipadic-2.7.0.tar.gz chasen-2.4.5.tar.gz darts のインストール: 解凍 tarball を解凍したい場所に置いて、tar でアーカイブを解凍します。

                                                                    • ChaSen をインストールしてみた。 - Solr, Python, MacBook Air in Shinagawa Seaside

                                                                      今朝、家から銀座のサーバーにログインしてコーディングしていたら ターミナルに「熱くてやばいっす」的なメッセージがガンガン出まくったので 慌ててサーバをシャットダウンしました。 おそらく何らかの理由でサーバルームの空調が止まったのだと思います。以前にもあったので。 仕方ないので開発環境を普段プライベートで使っている さくらインターネットに作ることにしました。 ラッキーなことに うひゃ検索 の開発である程度環境はできているので 足りないのは Chasen と CaboCha ぐらいです。 以下は、さくらインターネットに ChaSen をインストールした履歴です。 root 権限のないレンタルサーバなのでインストールはすべてホームディレクトリにの下に行います。 通常 /usr/local にインストールされるものを /home/ユーザ名/local にインストールしています。 辞書の文字コードを

                                                                        ChaSen をインストールしてみた。 - Solr, Python, MacBook Air in Shinagawa Seaside
                                                                      • 「茶筌(http://chasen.aist-nara.ac.jp/hiki/ChaSen/)」を利用し、商用ソフトウェアを開発しようと考えています。…

                                                                        「茶筌(http://chasen.aist-nara.ac.jp/hiki/ChaSen/)」を利用し、商用ソフトウェアを開発しようと考えています。 茶筌ではDartsというオープンソースライブラリを使用しているのですが、開発したソフトを販売する場合、ソース等の公開をしなければならないのでしょうか? (そもそも商用利用可能なのでしょうか?) 根拠となるURL等ございましたらお教えいただけると助かります。

                                                                        • Stigma - in the public_enemy - -  [Chasen] 茶筅 - インストール

                                                                          Namazuの環境構築をしているのですが… ちょっと面白い事件があったので報告したいと思います。 1.前提条件 OS:RedHat Linux ES ver.4 茶筅:chasen-2.3.3.tar.gz darts:darts-0.3.tar.gz 2.インストール手順 (1) darts $ gzip -dc darts-0.3.tar.gz | tar -xvf - $ cd darts-0.3 $ ./configure $ make # make install (2) 茶筅 $ gzip -dc chasen-2.3.3.tar.gz | tar -xvf - $ cd chasen-2.3.3 $ ./configure --with-darts=/usr/local/include --with-libiconv=/usr/local/lib $ make # make

                                                                          • ChaSen - 長岡技術科学大学 電気系 自然言語処理研究室

                                                                            [編集] option 変換文字機能 %m 見出し(出現形) %M 見出し(基本形) %y, %y1 読みの第一候補(出現形) %Y, %Y1 読みの第一候補(基本形) %y0 読み全体(出現形) %Y0 読み全体(基本形) %a 発音の第一候補(出現形) %A 発音の第一候補(基本形) %a0 発音全体(出現形) %A0 発音全体(基本形) %rABC ルビつきの見出し(“A 漢字B かなC” と表示)(※ 1) %i, %i1 付加情報の第一候補 %i0 付加情報全体 %Ic 付加情報(空文字列か“NIL” なら文字c)(※ 1) %Pc 各階層の品詞を文字c で区切った文字列 %Pnc 1〜n(n:1〜9) 階層目までの品詞を文字c で区切った文字列 %h 品詞の番号 %H 品詞文字列 %Hn n(n:1〜9) 階層目の品詞(なければ最も深い階層)

                                                                            • 83's : ruby-chasenのインストールメモ

                                                                              茶筌をRubyから使うためにruby-chasenを 入れようとしたんだけど、なかなか入らなかった。こういうのは茶筌の本家に行けば情報があるんだろうけど、 なんか昨日今日と落ちてるみたい。ショボーン こういうときはGoogleのキャッシュがほんとありがたいすね。 > %ruby -rmkmf -e'dir_config("chasen","/usr/local"); > create_makefile("chasen") if have_library("chasen") > > を実行しましたが, have_library("stdc++") を追加してみてください. てことで、添付されているextconf.rbを使わずに $ ruby -rmkmf -e 'dir_config("chasen", "/usr/local"); create_makefile("chasen") if

                                                                              • Zelch on Twitter: "ついに出た。形態素解析の分野適応。これができるのが JUMAN/ChaSen/Mecab との決定的な違いです。 http://www.phontron.com/kytea/active-ja.html 医療テキストでやると、「圧倒的じゃないか、わが軍の戦力は」です。"

                                                                                ついに出た。形態素解析の分野適応。これができるのが JUMAN/ChaSen/Mecab との決定的な違いです。 http://www.phontron.com/kytea/active-ja.html 医療テキストでやると、「圧倒的じゃないか、わが軍の戦力は」です。

                                                                                  Zelch on Twitter: "ついに出た。形態素解析の分野適応。これができるのが JUMAN/ChaSen/Mecab との決定的な違いです。 http://www.phontron.com/kytea/active-ja.html 医療テキストでやると、「圧倒的じゃないか、わが軍の戦力は」です。"
                                                                                • chasen legacy -- an old morphological analyzer

                                                                                  ChaSen -- 形態素解析器 はじめに 形態素解析器とは、入力文を単語単位に分割し品詞を付与するツールである。 新着情報 2011-11-16 (wed) See JPCERT Report. 茶筌の配布 ダウンロード あらかじめ iconvと Darts-0.31のインストールが必要です。 chasen-2.3.3 辞書は別配布になっています。 ipadic-2.7.0 日本語辞書 UniDic 日本語辞書 NAIST-Japanese-dic 日本語辞書(奈良先端大より公開予定) NAIST-Chinese-dic 中国語語辞書(奈良先端大より公開予定) 著作権および仕様条件について 茶筌システムは,広く自然言語処理研究に資するため無償のソフトウェアとして開発されたものである.茶筌の著作権は,奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座(松本研究室)が保持する.本ソフ