このドキュメントではVBAやVBScriptを使用して形態素解析を行う方法について説明します。 単語の分割だけでいい場合は下記を参考。 VBScriptで分かち書きを実行(MS標準機能のみで実装) http://qiita.com/nezuq/items/2e4e0cc63316474b630d #NMeCab NMeCabは形態素解析エンジンMeCabの解析処理部分を、.NETライブラリとして移植したものであり、下記からダウンロードできます。 今回は、NMecabをCOMでラッパーするNMecabComを作成し、そこを経由してVBA,VBScriptから形態素解析を行います。 具体的な作成方法については下記を参考の事。 VBAまたはVBSからCOM経由で使用できる.NETのライブラリの作成方法 作成したNMeCabComは下記からダウンロードできます。 http://needtec.sa
英語版記事を日本語へ機械翻訳したバージョン(Google翻訳)。 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。 翻訳後、{{翻訳告知|en|Natural language processing|…}}をノートに追加することもできます。 Wikipedia:翻訳のガイドラインに、より詳細な翻訳の
@habomaijiro氏をご存知でしょうか。ほぼ毎日どこかしらのラーメン二郎店舗に出没し、大盛りの二郎を完飲(スープまで飲み干すこと)している筋金入りのジロリアンです。また、その食事レポートは日々Twitterに投稿されています。 "麺、ザクザク喰えるもの" , "神域ブタ" 等、独特の表現を用いたツイートはジロリアンだけでなく一般人にも大人気です。間違いなくジロリアン界一番の有名人と言っても過言ではないでしょう。 自分も彼のツイートを楽しみにしている一人なのですが、ふと気になりました。一体彼がどれだけ完飲し、どんな二郎を味わっているのでしょうか? Twitter APIと形態素解析を使って、解析してみることにしました。 やったこと 以下の機能を持った小さなjavaプログラムを書いてみました。 過去1年(2015/1/1 - 2015/12/30)のツイートを取得する 形態素解析を行う
修正履歴 2016/2/19 コードの修正・必要なファイルの更新 2016/2/19 トラブルシューティングの追加 はじめに そもそもWindowsでなぜ?という話があると思いますが、理由は一つ。Windowsには強力なIDEであるVisual Studioがあるからです。 コード補完、スニペット、デバッグ・・・・多くのメリットがあるIDEですが、いかんせんWindowsでの環境構築には難所が多く、Python関係だとビルドの問題で詰まることが多いようです。 理由は様々ですが、Unixのコマンドが通用しなかったり、ファイルパスの書き方が違ったりといったことがあげられます。 今回は、そんなハードルを乗り越え、自然言語処理屋さん御用達、MeCabのPythonライブラリを入れてみようという話です。 MeCabって? MeCabは、形態素解析ツール。形態素は意味の通る単語の最小ブロックといった感
形態素解析(けいたいそかいせき、Morphological Analysis)とは、文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する作業である。 自然言語処理の分野における主要なテーマのひとつであり、機械翻訳やかな漢字変換など応用も多い(もちろん、かな漢字変換の場合は入力が通常の文と異なり全てひらがなであり、その先に続く文章もその時点では存在しないなどの理由で、内容は機械翻訳の場合とは異なったものになる)。 もっぱら言語学的な観点を主として言語学で研究されている文法にもとづく解析もあれば、コンピュータ上の自然言語処理としてコンピュータでの扱いやすさに主眼を置いた解析もある。以下は後者のためのツールを
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く