タグ

mecabに関するjar2のブックマーク (23)

  • フィーチャー アーカイブ

    SAP エキスパートの十分な確保に向けて、SAP がパートナー向け学習環境に投資 企業は競争力を維持する必要に迫られています。競争力を維持するには、自らを改革し、自社の製品や基盤となる運用中の IT システムを刷新しなければなりません。そこで、何をするにも必要なのが人材です。

    フィーチャー アーカイブ
  • テキストマイニング技術の活用に向けて読んでおきたい12のプレゼン資料 - コーパスいぢり 〜langstatの研究日誌〜

    「遊び」をクリエイトするAI デスピサロを相手に、効くはずのないザラキを唱えまくるクリフトを見ながら、AIというのはなんてアホなのだろうと思った。多分、それが、僕が初めてAIに出会った瞬間だったと思うのだけど、時は過ぎ、現代では生成AIを中心とした「かしこいAI」たちが世に溢れていて、…

    テキストマイニング技術の活用に向けて読んでおきたい12のプレゼン資料 - コーパスいぢり 〜langstatの研究日誌〜
    jar2
    jar2 2012/05/05
  • MeCab: 単語の追加方法

    概要 辞書への単語追加には, 二つの方法があります. システム辞書への追加 ユーザ辞書への追加 システム辞書への追加 辞書更新が頻繁でないときや, 解析速度を落としたくない時は, 直接 システム辞書を変更するのがよいでしょう. mecab-ipadic があるディレクトリに移動 foo.csv というファイルを作成 (拡張子が .csv なら何でも可) foo.csv に単語を追加 辞書の再コンパイル + インストール % /usr/local/libexec/mecab/mecab-dict-index -f euc-jp -t euc-jp % su # make install -f charset: CSVの文字コード -t charset: バイナリ辞書の文字コード 例: utf-8の辞書を作成する例 % /usr/local/libexec/mecab/mecab-dict-

    jar2
    jar2 2012/05/03
    mecab-dict-index
  • MeCabの辞書にはてなキーワードを追加しよう - 不可視点

    MeCabは形態素解析のためのソフトウェアです。日語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日語や、正しく書かれた日語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解

    MeCabの辞書にはてなキーワードを追加しよう - 不可視点
    jar2
    jar2 2012/04/02
  • テキストマイニングの基礎

    〜準備編〜 まずRをインストールしておくこと(不慣れな人は丁寧に解説したRインストールのページを参照のこと)。 Rでテキストマイニングをするために石田基広氏のウェブサイトよりRMeCab_0.90.zipというファイルをダウンロードする。ファイル名は変更されるかもしれないし、0.90というバージョンも変わるかもしれないので最新のものをダウンロードすること。なおダウンロードされた.zipファイル(圧縮されたファイル)は解凍する必要がなく、.zipファイルをそのまま適当なディレクトリ(フォルダ)に置いておけばよい。 Rのワークディレクトリ(getwd()とコマンドすれば確認できる)に、例えばzip_packagesという名前のフォルダを作成しておき、その中に保存しておくと分かりやすいだろう。 〜R上での準備〜 R上でRMeCabを利用するためには [パッケージ] -> [ローカルにあるzip

    jar2
    jar2 2012/03/26
  • テキストマイニングでソーシャルメディア情報のさらなる活用を

    文章を単語単位に分割し、その出現頻度や関係性などを解析、定量化された知見や予想外の発想を得る技術、“テキストマイニング”が、ソーシャルメディア・マーケティングにおいて重要視されている。テキストマイニングによって、フェイスブックやツイッター、ミクシィなどのソーシャルメディア上にあふれる書き込みを解析し、顧客や市場のニーズを抽出、自社製品への不満点を分析するなど、マーケティングに役立つ情報や知識を“マイニング(発掘)”することができるようになる。 1982年に設立し、データ分析の老舗企業として長い実績がある数理システムのテキストマイニング・ツール、「Text Mining Studio」は、メーカー、金融、学術といったさまざまな分野の企業や大学で導入されている。同社の製品の特徴としては、マウスでメニューをクリックするだけで基的な分析できる「使いやすさ」、毎月開催される無料の演習セミナー、利用

    テキストマイニングでソーシャルメディア情報のさらなる活用を
    jar2
    jar2 2012/03/21
  • テキストマイニングシステム DIAMining EX | MDIS

    分析専門知識を持たない方でも、簡単な操作で、素早い分析を可能とする、テキストマイニングシステムです。 今や企業戦略の立案等に不可欠となった「お客様の声」! Webやコールセンターからのお問い合わせに、ただ回答するだけでは"顧客満足"を得ることはできません。そこで大量に寄せられるお客様の声を、現場を知る担当者が探る。DIAMining EX(ダイアマイニング イーエックス)は、専門知識を持たない方でも素早い分析を可能とするテキストマイニングシステムです。 アニメーションで見るテキストマイニング活用例 概要 アンケートだけでなくお問い合わせやコールセンターなどのテキスト情報の分析傾向が、より分かり易く把握いただけるテキストマイニングシステムになりました。 概念抽出技術により、同じような意味を持つ言葉も関連語として登録されます。 テキスト情報をCSVファイルとして登録することで、関連語辞書を自動

    jar2
    jar2 2012/03/02
  • Twitterで株式市場を予測:「86.7%の精度」 - ライブドアニュース

    Lisa Grossman Image: flickr/ ある1日に『Twitter』の世界(Twitterverse)がどのくらい平穏だったかを測定することで、3日後の『ダウ・ジョーンズ工業株価平均』の変化の方向性を86.7%の精度で予測できるという研究成果が発表された。 この発見は、(別の研究から派生した)ほとんど偶然によるもので、研究者たち自身が驚いている。インディアナ大学の(社会科学)らによるは、プレプリント・サーバー『arXiv.org』に掲載された。 これまでの研究によって、一般社会の気分を測るのにブログがや、映画に関するツイートから興行収入をが明らかになっている。感情を含んだ語彙を判断材料として、ツイートを肯定的なものと否定的なものにふるい分ける、オープンソースの気分追跡ツール『OpenFinder』もある。 しかしBollen准教授は、もっと微妙なニュアンスまで汲み取れる感

    Twitterで株式市場を予測:「86.7%の精度」 - ライブドアニュース
    jar2
    jar2 2012/02/28
  • Linux - FreeStyleWiki

    jar2
    jar2 2012/02/22
  • Hunting Field: 11月 2011

    jar2
    jar2 2012/02/22
    RMeCabをPHPから使う
  • R-php をインストール & 使ってみた - CMOSにっき

    Web ブラウザからサーバ上の R を実行できる PHP スクリプト、R-php をインストールしてみました。 ちなみに、R-php 自体は 2005 年から存在し、特に新しい技術、という訳でもないです。 以上の図のような構成で動作しており、計算はサーバ側で行います。 今回使用したサーバは、CentOS 5.4。以下、インストールの方法。作業は全て root で実行します。 1. Apache, PHP, MySQL, ImageMagick のダウンロード 既にインストール済みの場合は省略。以下のように、すべて yum でインストール可能。 # yum install httpd httpd-devel php php-devel php-mbstring php-mysql mysql mysql-server ImageMagick ImageMagick-devel 2. R をイ

    R-php をインストール & 使ってみた - CMOSにっき
    jar2
    jar2 2012/02/22
  • RMeCabとRCaBoCha - yokkunsの日記

    先日(MeCabをyumでインストール@CentOS - yokkunsの日記)CentOSにMeCabとか入れていたのだが、仮想マシンの容量がいっぱいになってしまい、Rが入れられなかったので、新規でFedora11の仮想マシンを作成した。 今回は、ディスク容量を15Gにしたので大丈夫 MeCabのインストール 前回は、CentOSにrpmが用意されていなかったので、何かごにょごにょしてインストールしたが、今回はあるので、普通にyumでインストール。 $ sudo yum install mecab mecab-devel mecab-ipadic Rのインストール こっちも、普通にインストール $ sudo yum install R R-devel RMeCabのインストール http://groups.google.co.jp/group/rmecab/filesから、現在の最新版(

    RMeCabとRCaBoCha - yokkunsの日記
    jar2
    jar2 2012/02/22
  • SoftArchive - アールメカブ

    jar2
    jar2 2012/02/22
  • R のインストール - RjpWiki

    RjpWiki はオープンソースの統計解析システム R に関する情報交換を目的とした Wiki ですopenSUSE10.2 Linux 版インストール † YaST2を立ち上げインストールソースの変更を行う。 追加ボタンでhttpを選択。サーバー名に software.opensuse.org/download/science/openSUSE_10.2/を入力 改めてソフトウエア管理からインストールする。 たぶん他のバージョンやyumを用いて/etc/yum.repos.dの変更でもできると思います。 やってませんが。 CRANミラーでのSuSE用r-baseのアップが遅いのですが、こちらのリポジトリにしっかりアップされていました。 suse10.3の場合、リポジトリをsoftware.opensuse.org/download/science/openSUSE_10.3/とすればでき

    jar2
    jar2 2012/02/22
  • RでGPU使ってみた

    2. サイバー系 はじめに ※この発表は個人の 見解であり、所属する 組織の公式見解では ありません。 2011/11/19 1 3. サイバー系 アジェンダ 1. 自己紹介 2. GPUの話 3. R上で動くGPU演算をしてくれるパッケージ紹介 4. ベンチマーク結果 2011/11/19 2 4. サイバー系 自己紹介  和田 計也(@wdkz)  静岡県袋井市出身  サイバー系企業でデータマイニングエンジニア職  創立記念日が3月18日  社長の出身地が福井県鯖江市  前職はバイオベンチャー  バイオマーカ探索してた  学生時代は枯草菌の研究 2011/11/19 3

    RでGPU使ってみた
    jar2
    jar2 2012/02/22
  • Index of /R

    jar2
    jar2 2012/02/22
  • http://rmecab.jp/wiki/index.php?plugin=attach&refer=RMeCab&openfile=manual.pdf

    jar2
    jar2 2012/02/22
  • CentOS 5.5 に R をインストールしたときのメモ : 日々の記録

    2011年04月14日02:16 カテゴリR CentOS 5.5 に R をインストールしたときのメモ CentOS 5.5 に統計ソフト R をインストールした。 Ubuntu や Fedora では apt-get や yum でインストールできるらしいけど Cent では yum のリポジトリに R が入っていない。 RjpWiki( http://www.okada.jp.org/RWiki/ )を見てみるとプログラムの配布はCRAN (Comprehensive R Archive Network R体や各種パッケージをダウンロードするためのWebサイト)で行われていて、国内では例えば http://cran.md.tsukuba.ac.jp/ がミラーサイトとのこと。 で、とりあえずリポジトリ追加 # vi /etc/yum.repos.d/CRAN.repo [CRAN]

    CentOS 5.5 に R をインストールしたときのメモ : 日々の記録
    jar2
    jar2 2012/02/22
  • はてなブログ | 無料ブログを作成しよう

    来年も作りたい!ふきのとう料理を満喫した 2024年春の記録 春は自炊が楽しい季節 1年の中で最も自炊が楽しい季節は春だと思う。スーパーの棚にやわらかな色合いの野菜が並ぶと自然とこころが弾む。 中でもときめくのは山菜だ。早いと2月下旬ごろから並び始めるそれは、タラの芽、ふきのとうと続き、桜の頃にはうるい、ウド、こ…

    はてなブログ | 無料ブログを作成しよう
    jar2
    jar2 2012/02/17
  • Sign in - Google Accounts

    jar2
    jar2 2012/02/17