require "cabocha" include CaboCha parser = Parser.new tree = parser.parse("吾輩は猫である。") 解析済みのcabochaファイルを読み込みたい場合は、たぶん次の方法でできるはず。一文ずつ解析するので、最初のEOSまでしか読み込まない。
![cabocha-rubyの使い方メモ - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/9d216dd06dae7694e98aafb7f2a3782260d26cf8/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9Y2Fib2NoYS1ydWJ5JUUzJTgxJUFFJUU0JUJEJUJGJUUzJTgxJTg0JUU2JTk2JUI5JUUzJTgzJUExJUUzJTgzJUEyJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmcz1lNmY0OTg5ZDVjMjQxOThiYjU0ODZlMmQzYmZiYjM3ZQ%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBhYWRpaW1teiZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9YTdhZWZiODM4NGUzODVhZDMyOWI5ZDU0ODcwMGIzNzE%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3D591d11cf454bfd8588aa5470a730ad6a)
CaboCha/南瓜: Yet Another Japanese Dependency Structure Analyzer CaboCha/南瓜とは CaboCha は, Support Vector Machines に基づく日本語係り受け解析器です。 特徴 Support Vector Machines (SVMs) に基づく, 高性能な係り受け解析器 SVM の分類アルゴリズムの高速化手法である PKE (ACL 2003 にて発表)を適用. IREX の定義による固有表現解析が可能 柔軟な入力形式. 生文はもちろん, 形態素解析済みデータ, 文節区切り済み データ, 部分的に係り関係が付与されたデータからの解析が可能 係り受けの同定に使用する素性をユーザ側で再定義可能 データを用意すれば, ユーザ側で学習を行うことが可能 内部の辞書に, 高速な Trie 構造である Double
SONY製品が多いのでMedia Goで普段CDを取り込んでいたが、HDD増強したしホームシアター買いたいしで、flacにしてもいいんじゃないかと思い環境を探した。 foobar2000は開発も続いているし、UIも今はわかりやすいので、今回はこれを使用した。 foobar2000でのエンコードの場合、主に以下の設定が使用できるのが嬉しい。 ファイル保存の際のディレクトリ構造やファイル名を変数を用いて指定可能 エンコーダが詳細に設定可能 プレイリスト表示の高度なfilter、表示設定 導入手順 以下の手順でfoobar2000とflacとlame(mp3)をインストール foobar2000 https://www.foobar2000.org/から最新版をダウンロードしインストール 最初にUIを聞かれるのでお好きなものを選択 flac https://xiph.org/flac/downl
foobar2000は主に再生ソフトウェアなのであまり使う機会は少ないが、標準でfreedbを利用することが可能である。freedbを設定することによってインターネットを通じて曲情報を取得し、音楽ファイルにタグをつけることができる。foobar2000でリッピングする場合や、後からタグをつける場合は便利に利用することができるだろう。 ※foobar2000全体の使い方の流れを知りたい方は音楽再生プレーヤーfoobar2000の使い方まとめをあわせて読んでいただけるとわかりやすいだろう。 標準機能なので特にコンポーネントを入れる必要はない。しかし、標準のfreedbサーバーが日本語に対応していないので、日本語対応のfreedbサーバーを追加しておこう。その手順を紹介する。 まずはfoobar2000を起動する。 「file」-「Preferences」をクリック。 「Tools」-「Tagg
foobar2000にはライブラリ機能がついており、パソコンの特定のフォルダにある音楽ファイルを高速にリスト化してくれる。この機能を使うことによってfoobar2000内で音楽ファイルを快適に探したり開いたりすることが可能になる。foobar2000をインストールしたら最初に設定しておきたい。 ※foobar2000全体の使い方の流れを知りたい方は音楽再生プレーヤーfoobar2000の使い方まとめをあわせて読んでいただけるとわかりやすいだろう。 下記手順で設定を有効にする。 foobar2000を起動し、Libraryの「Configure」をクリック。 インストール直後はこのような設定になっているはずである。これを設定しなおす。 Music foldersのPathに設定されているものをまずは削除する。もし該当Pathに音楽ファイルを保存している場合は特に設定する必要はない。今回は自分
foobar2000にはCDからのリッピング機能が標準でついている。つまり、foobar2000単体でiTunesのようにCDをパソコンに取り込むことが出来る。その機能とコンバーター機能を使うことによって簡単にFLAC形式のファイルを作成することが可能だ。CDの取り込みから再生までfoobar2000だけで完結できることになる。パソコンで音楽を管理するのにお勧めの方法だ。 ※foobar2000全体の使い方の流れを知りたい方は音楽再生プレーヤーfoobar2000の使い方まとめをあわせて読んでいただけるとわかりやすいだろう。 FLAC形式の音楽ファイルはロスレス圧縮(可逆圧縮)と言われるもので、CDからの音質の劣化は一切ない。mp3形式などのロス圧縮(非可逆圧縮)のようにファイル容量を削るために音質を犠牲にしているということもない。 ハードディスクが大容量化している現代でわざわざ音質の悪い
スクリプト言語用のデバッガの使い方 - Ruby, Python, Perl スクリプト言語用の CUIのデバッガの使い方を簡単にまとめました。対象言語は Ruby, Python, Perl です。 私は C, C++ でプログラムを書いているときはデバッガ (主に GNU/Linux 上の gdb) を頻繁に利用します。しかし、スクリプト言語ではそれほどでもありません。これはおそらく次のような理由によります。 ビルドが不要なので printf デバッグが容易 (ある程度大きい C++ のプログラムではビルド時間が長いので printf の挿入はしんどい) 異常終了時にスタックトレースが表示される (Ruby, Python なら自動、Perl の場合は use Carp; $SIG{__DIE__} = \&Carp::confess; など) オブジェクトのインスペクトが簡単 (Ru
今や「インフラ」と表現しても過言ではないほど、多くの日本人が当たり前のように利用しているミニブログサービス、Twitter。この記事では、Twitterが提供するAPIの使い方を、初心者向けに説明しています。ぜひ、素敵なウェブサービスを作って下さいね。 Twitter DevelopersTwitter APIなどを利用する開発者のためのページ。公式リファレンスの確認や、アプリケーションの作成など。アプリケーションの登録APIを利用するために必要な「アプリケーションの登録方法」を紹介します。APIキーとAPIシークレットを取得できます。 アプリケーションとは?よくAPIを利用するのに「アプリケーションを登録して」という言葉が出てきます。このアプリケーションって何でしょう。これは、SNSでいう「ユーザーアカウント」と同じようなものだと考えると、イメージを掴みやすいと思います。 アプリケーショ
Twitter gemでツイート検索する場合の要点、及び:since_id指定を有効にするモンキーパッチRubyTwitter Twitter gem を使って検索する場合には注意しないと API 規制を受けてしまうことがあります。この記事では検索する場合の tips 、そして :since_id 指定していても API 規制を受けてしまうことを解決するモンキーパッチを公開します。 API上限 通常の認証:180回/15分(平均:5秒に1回まで) Application-only auth:450回/15分(平均:2秒に1回まで) アクセスクライアントインスタンスの作り方 通常の認証 require 'twitter' client = Twitter::REST::Client.new( consumer_key: 'YOUR_CONSUMER_KEY', consumer_secret
ari3_botの会話エンジンで使っている自然言語の処理の中から他の方にも有益そうなところだけ書いておこうと思います。 このエンジン自体はアドホックにヒーリスティクスな処理を追加しまくっていて、とても説明しにくいのですが、基本的な部分だけ抜き出して……まとめて……解説します。全部実装できるほど詳細な解説はできないので、取っ掛かりになる程度です。 ちなみにCaboChaのAPIはきちんとしたドキュメントがない?ようで、僕はソースコードを自分で読んで得た知識から解説を行っています。また日本語文法関する知識もari3_botを作るためだけに得たものであり、あやしいので、あまり信じすぎないようにしてください。 もくじです。 ari3_botの会話エンジンとは CaboChaの基本的な使い方 CaboChaで主語と述語っぽいところを抜き出す 述語を活用してみる その他のいろいろなヒント まとめ ar
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く