タグ

mecabに関するhiro_yのブックマーク (21)

  • IPA、NAIST、UniDic、JUMANの辞書実演比較(Mecab)

    以下のフォームに文章を入力して「解析」ボタンを押下すると、チェックした辞書を使用したMeCabの解析結果が表示されます。 実行回数は1つのIPアドレスに付き1日30回に制限させて頂いております。また解析する文字列の長さの上限は512文字です。すいません、レン鯖なので無茶はできんとです。あと、Firefox3.5,Chrome3,IE8で動作を確認しています。古典的ブラウザでは動作しないかもしれません。 MeCab0.98を使用しています。解析を実行した文字列については一切のログを取っていませんので安心してお使いください。 IPA (mecab-ipadic2.7.0-20070801) NAIST (mecab-naist-jdic-0.6.1-20090630) UniDic現代語版 (unidic-mecab-1.3.12) UniDic近代文語版 (UniDic-MLJ-mecab_

    hiro_y
    hiro_y 2009/11/19
    MeCabの各辞書による解析結果比較ができる。
  • mysqlftppc 紹介

    2. まず mysqlftppc = MYSQL F ull- T ext P arser P lugin C ollection サーバに組み込んで使います。 Cで書かれています。 http://mysqlftppc.wiki.sourceforge.net/ 3. MySQL full-text search SELECT * FROM hoge WHERE MATCH (t) AGAINST (“hogehoge”) SQL の 関数 として導入されています。 http://dev.mysql.com/doc/refman/5.1/en/fulltext-search.html

    mysqlftppc 紹介
    hiro_y
    hiro_y 2009/11/08
    mysqlftppcの発表資料。
  • mysql full-text parser plugin collection

    MySQL (5.1 and later) full-text parser plugins collection. This collection provides bigram, mecab , space, snowball and suffix parser. If you want to use Chinese or Japanese, bigram plugin might be useful.

    hiro_y
    hiro_y 2009/11/08
    MySQLにプラグインとしてfulltextインデックスのパーサを提供。MeCab、bigramなどに対応。正規化に対応するには要ICU。
  • MySQL5.1にMeCabのfull-text parser pluginを入れてみた - Lism.in * blog - nekoya (id:studio-m)

    MySQL5.0で全文検索というと、Tritonn入れたりしてSennaを使うのが常套手段。そういうところはプラグインで解決するのが5.1のやり方らしい。 http://www.slideshare.net/hiroaki.kawai/mysqlftppc http://sourceforge.net/apps/mediawiki/mysqlftppc/index.php?title=Main_Page というわけで、MySQL5.1でfull-text indexを作成出来るようになる、mysqlftppcことMySQL full-text parser plugin collectionを入れてみました。環境はCentOS5.4(x86_64)。 MySQL体は公式のRPMを使用。 http://dev.mysql.com/downloads/mysql/5.1.html#linux

    MySQL5.1にMeCabのfull-text parser pluginを入れてみた - Lism.in * blog - nekoya (id:studio-m)
    hiro_y
    hiro_y 2009/11/08
    MySQL 5.1で使えるfull-text parser plugin collection(mysqlftppc)を入れてみてる。
  • Tritonn(MySQL+Senna)+Mecab+Apahce+PHP5.2(with APC & imagick)をCentOS5にインストールする : akiyan.com

    Tritonn(MySQL+Senna)+Mecab+Apahce+PHP5.2(with APC & imagick)をCentOS5にインストールする 2008-09-12 バージョン等の最終更新:2009-10-24 PHPからTritonn(MySQL+Senna)を使うためのセットアップに若干ハマったので、メモ的にエントリー。 Tritonn(MySQL+Senna)だけでPHPからMySQLに接続するときは、Tritonnをソースからインストールしなくてはなりません。というのも、Tritonnプロジェクトではコンパイル済みのrpmをリリースしていますが、このrpmにはmysql-devel的なライブラリが同梱されていません。Tritonnだけをrpmからインストールした場合、PHPの./configure時にlibmysqlclient.soが見つからず、PHPのインストールを

    hiro_y
    hiro_y 2008/09/12
    MySQL/Senna/Tritonn/MeCab/Apache/PHPをソースからインストール。
  • textsearch-ja: Project Home Page

    形態素解析を使用した、組み込み型の日語全文検索です。 この textsearch-ja プロジェクトは PostgreSQL コミュニティによる pgFoundry の中のプロジェクトです。 ダウンロード : ソースコードのほか、Windows 用バイナリもダウンロードできます。 バグレポート メーリングリスト への参加 概要 日語テキストの全文検索を行います。 PostgreSQL 8.3 で追加された組み込みテキスト検索を拡張するため、 英語文書の検索と同様の方法で、日語文書を検索することができます。 検索は形態素解析を利用した単語単位で行われます。 形態素解析には MeCab を使用しています。 利点として、GIN または GiST インデックスをベースにしているため、全文検索用のインデックスがリカバリ可能であることが挙げられます。 また、既に tsea

    hiro_y
    hiro_y 2008/06/30
    PostgreSQL 8.3 + MeCabで日本語テキストの全文検索。
  • GT Nitro: カーレーシング・ドラッグレーシングゲーム - Google Play のアプリ

    GT Nitro: Car Game Drag Raceは、典型的なカーゲームではありません。これはスピード、パワー、スキル全開のカーレースゲームです。ブレーキは忘れて、これはドラッグレース、ベイビー!古典的なクラシックから未来的なビーストまで、最もクールで速い車とカーレースできます。スティックシフトをマスターし、ニトロを賢く使って競争を打ち破る必要があります。このカーレースゲームはそのリアルな物理学と素晴らしいグラフィックスであなたの心を爆発させます。これまでプレイしたことのないようなものです。 GT Nitroは、リフレックスとタイミングを試すカーレースゲームです。正しい瞬間にギアをシフトし、ガスを思い切り踏む必要があります。また、大物たちと競いつつ、車のチューニングとアップグレードも行わなければなりません。世界中で最高のドライバーと車とカーレースに挑むことになり、ドラッグレースの王冠

    GT Nitro: カーレーシング・ドラッグレーシングゲーム - Google Play のアプリ
    hiro_y
    hiro_y 2008/01/14
    PHP + MeCabでキーワードリンクを実現。
  • php_mecab-0.3.0: 某所より引っ越し - 讃容日記

    php_mecab-0.3.0.tgz PHP 5.3/6.0に対応。 PHP6のUnicode文字列とC文字列の相互変換をするエンコーディングを指定するためのphp.iniディレクティブmecab.internal_encodingを追加。 指定できる値はICUが対応しているエンコーディング名で、デフォルト値はUTF-8PHPスクリプト内ではini_set()のほか、mecab_set_encoding()関数やMeCab::setEncoding()メソッドで指定可能。 ini_get(), mecab_get_encoding(), MeCab::getEncoding()で現在の値を取得することもできる。

    php_mecab-0.3.0: 某所より引っ越し - 讃容日記
    hiro_y
    hiro_y 2008/01/10
    php_mecabの最新版。
  • Blog - Mikula Beutl - SEO Consulting

    This guide is the safest way to do a domain switch, you get all you need to change a blocked domain. What is a user flow and a user journey? There’s a macro view of a customer experience that we can analyze and partially control.

    Blog - Mikula Beutl - SEO Consulting
    hiro_y
    hiro_y 2008/01/06
    PHPのMecabモジュールの使い方。
  • http://www.jaro68.jp/trac/sett4/wiki/TermDrips

    hiro_y
    hiro_y 2007/07/27
    キーワード抽出API、「入力された文章から、キーワードっぽいであろう単語を抽出します。」
  • YOMI - 読みを抽出する

    MeCabを使って自動抽出しているので、時々妙な読みを返しますが、ご了承ください。 漢字が含まれる単語の読みを抽出します。 それ以外の文字列は全て処理前に削除されます。 ひらがな、カタカナだけの文字列も無視されます。 送られてくる文字列は全てUTF-8で指定する必要があります。 <form id="f"> <input type="text" name="q" size="16"> <input type="submit" value="読み!" onclick="getYomi('f'); return false"> </form> function getYomi(form) { new Ajax.Request( '/rest/yomi/get', { method: 'get', parameters: Form.serialize('f'), onComplete: funct

    hiro_y
    hiro_y 2007/07/21
    MeCabで形態素解析、読みを抽出して返してくれるAPI。
  • 新規

    盾集域名停放是全球优质行业导航备案网站领导者 为中小企业提供数字化、快速化、轻量化、精准化的网站链接服务 dns1.dopa.com,dns2.dopa.com 版权所有 站内容未经书面许可,禁止一切形式的转载 © CopyRight 2023 盾集域名停放click.com.cn    浙ICP备20018420号-2 杭州盾集网络有限公司

    hiro_y
    hiro_y 2007/06/12
    パッケージ版のMeCabの使い方。
  • MeCab extensionを使ってTwitterで流行っているキーワードをクラウド化 - Do You PHP はてブロ

    ほとんどMeCab extension使いたさにあれこれこじつけた感ありありですが。。。 MeCabはオープンソースとして公開されている形態素解析エンジンの1つで、GPLもしくはLGPL/BSDライセンスの下に公開されています。他の形態素解析エンジンとしては、KAKASIやChaSenなどが知られていますね。 http://mecab.sourceforge.net/ で、PHPの拡張モジュールとしてはPage2で公開されているものがあります。 http://page2.xrea.jp/#php_mecab GitHub - rsky/php-mecab: MeCab binding for PHP これを使って、Twitterで流行っているキーワードをクラウド化するコードを書いてみました。なお、CSSはタグクラウドのスタイルを考える - collisions.dotimpac.toを参考

    MeCab extensionを使ってTwitterで流行っているキーワードをクラウド化 - Do You PHP はてブロ
    hiro_y
    hiro_y 2007/06/07
    Services_Twitter + MeCabエクステンション。
  • Yet Another MECAPI - MeCab Web Service

    The name of the callback function to wrap around the JSON data. If format=json has not been requested, this parameter is ignored. Sample Request Url: /mecapi/?sentence=%E6%B8%8B%E8%B0%B7%E5%8C%BA%E3%81%AE&format=json Response fields FieldDescription

    hiro_y
    hiro_y 2007/05/02
    MeCabの形態素解析を利用できるAPI。
  • 新規

    盾集域名停放是全球优质行业导航备案网站领导者 为中小企业提供数字化、快速化、轻量化、精准化的网站链接服务 dns1.dopa.com,dns2.dopa.com 版权所有 站内容未经书面许可,禁止一切形式的转载 © CopyRight 2023 盾集域名停放click.com.cn    浙ICP备20018420号-2 杭州盾集网络有限公司

    hiro_y
    hiro_y 2007/04/09
    MySQLのモデリングとインデックスの問題について。
  • [infony] - キーワードを抽出して意味をしらべます

    infonyはWebページで使用されている言葉の意味をワンクリックで調べる無料のWebサービスです【レビュー】infony登場 (1) infonyとは | エンタープライズ | マイコミジャーナル 2007-07-14処理を高速化しました2007-07-14Yahoo!形態素解析APIを導入しました2007-06-04キーワード調査結果をリスト表示するようにしました2007-04-06マイコミジャーナルで紹介していただきました2007-04-05infony公開しました 最近のキーワード調査対象Webページ[As] - (MeCab)【文のみ】『Reviews from Epinions』に含まれるキーワードと意味[head][FRP][Structure] - (MeCab)【文のみ】『International Play Company - Softplay, Indoor Pl

    hiro_y
    hiro_y 2007/04/07
    MeCabで形態素解析 + はてなキーワード/Wikipediaの意味を表示、タグクラウド。
  • Page2

    LinkTree - HOME http://sadako.nobody.jp/ http://monodebank.nobody.jp/ http://okichi.xxxxxxxx.jp/ http://utaneko.gozaru.jp/ http://urananaon.atukan.com/ LinkTree -

    hiro_y
    hiro_y 2007/03/18
    PHPのextensionいろいろ。Epeg extension/MeCab extensionなど。
  • NTTデータが全文検索エンジン「Ludia」をオープンソースとして無償公開:ITpro

    NTTデータは10月11日,同社が開発した全文検索エンジン「Ludia」をオープンソース・ソフトウエアとして無償公開した。オープンソースのDBMS PostgreSQLに格納されたテキスト・データの全文検索を行う。同社では「商用のデータベース管理ソフトに匹敵する速度と精度を備える」としている。 NTTデータでは「データベース内のデータの全文検索ではこれまで,オープンソース・ソフトウエアでは日語に対応した高速・高精度なものが存在せず,データベースからデータを取り出し別のシステムを構築する必要があった。Ludiaは商用のデータベース管理ソフトに匹敵する速度と精度を備える」としている。 Ludiaは,N-gramと形態素解析の2種類の全文検索インデックス方式をサポートする。ブーリアン検索,近傍位置検索,類似文書検索といった検索が可能で,検索結果の合致度を示す「スコア」も提供する。 Ludiaは

    NTTデータが全文検索エンジン「Ludia」をオープンソースとして無償公開:ITpro
    hiro_y
    hiro_y 2006/10/12
    sennaのPostgreSQLバインディング。MeCabを用いた形態素解析とか。
  • [を] MECAPI (MeCab API) 暫定版を公開

    MECAPI (MeCab API) 暫定版を公開 2006-09-18-1 [WebTool][NLP][MECAPI] taku-ku 氏による日形態素解析器 MeCab の Web Service を 作ってみたので公開します。その名も MECAPI (メカピ)! - MECAPI - MeCab Web Service (MeCab API) http://mimitako.net/api/mecapi.cgi Perl の MeCab モジュールを使っています[2006-02-25-4]。 仕様は今後変わっていく可能性あり。 また、サーバ負荷によっては予告なく止めることもあり。 同一 IP からの回数制限とかするかも。 とりあえずしばらく様子を見て、落ち着いたらソースを公開します。 でもって、余裕のあるサーバに置いてもらいたいと思っています。 現段階で、

    hiro_y
    hiro_y 2006/09/19
    形態素解析、MeCabを使用したAPI。
  • MeCab PHP extension moduleを使ってみた

    3年ぐらい前に欲しいなーと思っていたMeCabのPHPモジュールが最近リリースされたようです。DBから取り出したレコードごとに形態素解析したいときなどはPHPから呼び出せると便利。 » Page2 MeCab extension 手元のマシンはmecabが0.90だったのですがconfigure時にmecab_new2のところでエラー。 configure: error: wrong MeCab library version or lib not found.[mecab-users 86] Re: C ライブラリで “Undefined symbol” となる関数がある 既知の問題だったので最新の0.91をコンパイルし直したらインストールできました。 サンプルのコードはソースの中にもありますがよりシンプルな例を以下に。 <?php dl('mecab.so'); $mecab = me

    hiro_y
    hiro_y 2006/07/05
    MeCabのextension、使用例。