SAP エキスパートの十分な確保に向けて、SAP がパートナー向け学習環境に投資 企業は競争力を維持する必要に迫られています。競争力を維持するには、自らを改革し、自社の製品や基盤となる運用中の IT システムを刷新しなければなりません。そこで、何をするにも必要なのが人材です。
概要 辞書への単語追加には, 二つの方法があります. システム辞書への追加 ユーザ辞書への追加 システム辞書への追加 辞書更新が頻繁でないときや, 解析速度を落としたくない時は, 直接 システム辞書を変更するのがよいでしょう. mecab-ipadic があるディレクトリに移動 foo.csv というファイルを作成 (拡張子が .csv なら何でも可) foo.csv に単語を追加 辞書の再コンパイル + インストール % /usr/local/libexec/mecab/mecab-dict-index -f euc-jp -t euc-jp % su # make install -f charset: CSVの文字コード -t charset: バイナリ辞書の文字コード 例: utf-8の辞書を作成する例 % /usr/local/libexec/mecab/mecab-dict-
MeCabは形態素解析のためのソフトウェアです。日本語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日本語や、正しく書かれた日本語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術は形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解
〜準備編〜 まずRをインストールしておくこと(不慣れな人は丁寧に解説したRインストールのページを参照のこと)。 Rでテキストマイニングをするために石田基広氏のウェブサイトよりRMeCab_0.90.zipというファイルをダウンロードする。ファイル名は変更されるかもしれないし、0.90というバージョンも変わるかもしれないので最新のものをダウンロードすること。なおダウンロードされた.zipファイル(圧縮されたファイル)は解凍する必要がなく、.zipファイルをそのまま適当なディレクトリ(フォルダ)に置いておけばよい。 Rのワークディレクトリ(getwd()とコマンドすれば確認できる)に、例えばzip_packagesという名前のフォルダを作成しておき、その中に保存しておくと分かりやすいだろう。 〜R上での準備〜 R上でRMeCabを利用するためには [パッケージ] -> [ローカルにあるzipフ
文章を単語単位に分割し、その出現頻度や関係性などを解析、定量化された知見や予想外の発想を得る技術、“テキストマイニング”が、ソーシャルメディア・マーケティングにおいて重要視されている。テキストマイニングによって、フェイスブックやツイッター、ミクシィなどのソーシャルメディア上にあふれる書き込みを解析し、顧客や市場のニーズを抽出、自社製品への不満点を分析するなど、マーケティングに役立つ情報や知識を“マイニング(発掘)”することができるようになる。 1982年に設立し、データ分析の老舗企業として長い実績がある数理システムのテキストマイニング・ツール、「Text Mining Studio」は、メーカー、金融、学術といったさまざまな分野の企業や大学で導入されている。同社の製品の特徴としては、マウスでメニューをクリックするだけで基本的な分析できる「使いやすさ」、毎月開催される無料の演習セミナー、利用
分析専門知識を持たない方でも、簡単な操作で、素早い分析を可能とする、テキストマイニングシステムです。 今や企業戦略の立案等に不可欠となった「お客様の声」! Webやコールセンターからのお問い合わせに、ただ回答するだけでは"顧客満足"を得ることはできません。そこで大量に寄せられるお客様の声を、現場を知る担当者が探る。DIAMining EX(ダイアマイニング イーエックス)は、専門知識を持たない方でも素早い分析を可能とするテキストマイニングシステムです。 アニメーションで見るテキストマイニング活用例 概要 アンケートだけでなくお問い合わせやコールセンターなどのテキスト情報の分析傾向が、より分かり易く把握いただけるテキストマイニングシステムになりました。 概念抽出技術により、同じような意味を持つ言葉も関連語として登録されます。 テキスト情報をCSVファイルとして登録することで、関連語辞書を自動
Lisa Grossman Image: flickr/ ある1日に『Twitter』の世界(Twitterverse)がどのくらい平穏だったかを測定することで、3日後の『ダウ・ジョーンズ工業株価平均』の変化の方向性を86.7%の精度で予測できるという研究成果が発表された。 この発見は、(別の研究から派生した)ほとんど偶然によるもので、研究者たち自身が驚いている。インディアナ大学の(社会科学)らによるは、プレプリント・サーバー『arXiv.org』に掲載された。 これまでの研究によって、一般社会の気分を測るのにブログがや、映画に関するツイートから興行収入をが明らかになっている。感情を含んだ語彙を判断材料として、ツイートを肯定的なものと否定的なものにふるい分ける、オープンソースの気分追跡ツール『OpenFinder』もある。 しかしBollen准教授は、もっと微妙なニュアンスまで汲み取れる感
Web ブラウザからサーバ上の R を実行できる PHP スクリプト、R-php をインストールしてみました。 ちなみに、R-php 自体は 2005 年から存在し、特に新しい技術、という訳でもないです。 以上の図のような構成で動作しており、計算はサーバ側で行います。 今回使用したサーバは、CentOS 5.4。以下、インストールの方法。作業は全て root で実行します。 1. Apache, PHP, MySQL, ImageMagick のダウンロード 既にインストール済みの場合は省略。以下のように、すべて yum でインストール可能。 # yum install httpd httpd-devel php php-devel php-mbstring php-mysql mysql mysql-server ImageMagick ImageMagick-devel 2. R をイ
先日(MeCabをyumでインストール@CentOS - yokkunsの日記)CentOSにMeCabとか入れていたのだが、仮想マシンの容量がいっぱいになってしまい、Rが入れられなかったので、新規でFedora11の仮想マシンを作成した。 今回は、ディスク容量を15Gにしたので大丈夫 MeCabのインストール 前回は、CentOSにrpmが用意されていなかったので、何かごにょごにょしてインストールしたが、今回はあるので、普通にyumでインストール。 $ sudo yum install mecab mecab-devel mecab-ipadic Rのインストール こっちも、普通にインストール $ sudo yum install R R-devel RMeCabのインストール http://groups.google.co.jp/group/rmecab/filesから、現在の最新版(
RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですopenSUSE10.2 Linux 版インストール † YaST2を立ち上げインストールソースの変更を行う。 追加ボタンでhttpを選択。サーバー名に software.opensuse.org/download/science/openSUSE_10.2/を入力 改めてソフトウエア管理からインストールする。 たぶん他のバージョンやyumを用いて/etc/yum.repos.dの変更でもできると思います。 やってませんが。 CRANミラーでのSuSE用r-baseのアップが遅いのですが、こちらのリポジトリにしっかりアップされていました。 suse10.3の場合、リポジトリをsoftware.opensuse.org/download/science/openSUSE_10.3/とすればでき
2011年04月14日02:16 カテゴリR CentOS 5.5 に R をインストールしたときのメモ CentOS 5.5 に統計ソフト R をインストールした。 Ubuntu や Fedora では apt-get や yum でインストールできるらしいけど Cent では yum のリポジトリに R が入っていない。 RjpWiki( http://www.okada.jp.org/RWiki/ )を見てみるとプログラムの配布はCRAN (Comprehensive R Archive Network R本体や各種パッケージをダウンロードするためのWebサイト)で行われていて、国内では例えば http://cran.md.tsukuba.ac.jp/ がミラーサイトとのこと。 で、とりあえずリポジトリ追加 # vi /etc/yum.repos.d/CRAN.repo [CRAN]
来年も作りたい!ふきのとう料理を満喫した 2024年春の記録 春は自炊が楽しい季節 1年の中で最も自炊が楽しい季節は春だと思う。スーパーの棚にやわらかな色合いの野菜が並ぶと自然とこころが弾む。 中でもときめくのは山菜だ。早いと2月下旬ごろから並び始めるそれは、タラの芽、ふきのとうと続き、桜の頃にはうるい、ウド、こ…
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く