タグ

2008年9月4日のブックマーク (4件)

  • ひゃまだのテキストで行こう - andlinux

    Generated by Hiki 0.8.6 (2006-07-03). Powered by Ruby 1.8.5 (2006-08-25). Founded by ひゃまだ.

  • MeCab の辞書構造と汎用テキスト変換ツールとしての利用

    $Id: dic-detail.html 161 2008-02-03 09:58:46Z taku-ku $; 概要 単語辞書の構造を理解することで, MeCab を汎用的なテキスト変換ツールとして利用することができます. 例えば, ひらがな to カタカナ変換, ローマ字 to ひらがな変換, Auto Link等を MeCab だけで実行できます ファイル 単語辞書を構築するには, 最低以下のファイルを作成する必要があります. *.csv ファイル (単語辞書) matrix.def (連接表) unk.def (未知語用品詞定義) char.def (未知語の文字定義) dicrc (設定ファイル) *.csv ファイル 単語辞書です エントリは, 以下のような CSV で追加します. test,1223,1223,6058,foo,bar,baz 最初の4つは必須エントリで,

    ICHIRO
    ICHIRO 2008/09/04
  • デコビッチ師匠、あまりに貧乳過ぎて水着を付け間違える

    1 : マーモット(東京都):2008/09/03(水) 21:28:06.02 ID:Ew5SlvpZ0 ?2BP(3001) 株主優待 641 名無し草 2008/09/03(水) 18:14:36 http://image.depart.livedoor.com/free/postarcarendar/2009cl012-2-ka.jpg あーやは水着着ないほうが可愛いおね… 660 名無し草 2008/09/03(水) 18:17:56 >>641 あたい水着ショップで働いてたけどこれ水着のブラの付け方間違ってるお あーやが首にかけてる部分はアンダーだお http://thumbnail.image.rakuten.co.jp/@0_mall/forever-world/cabinet/pad/img44890120.jpg 4 : 鵜(神奈川県):2008/09/03(水) 21

    デコビッチ師匠、あまりに貧乳過ぎて水着を付け間違える
    ICHIRO
    ICHIRO 2008/09/04
  • Main

    Introduction C++ による文字列処理を補助するためのツールを公開しています.現在は,文字列の整列・照合用のライブラリと,はてなダイアリーキーワード抽出用正規表現をキーワード一覧に展開するライブラリがあります. Downloads http://nanika.osonae.com/Developing/hatena_keyword_decoder.tgz ライセンス未定(nanika と統合して BSD ライセンスに変更予定) 正規表現をキーワードの一覧に提供する機能を提供します. キーワードの一覧を取り出します. http://nanika.osonae.com/Developing/nanika_alpha.tgz BSD ライセンス 文字列処理を単純化するための機能を提供します. http://nanika.osonae.com/Developing/wakati.tgz

    ICHIRO
    ICHIRO 2008/09/04
    キーワード抽出