[B! 日本語] Kimuraのブックマーク

Kimura id:Kimura

日本語に関するKimuraのブックマーク (3)

daily dayflower - 半角←→全角変換，Unicode::Japanese に未公開機能が…
2008-10-21 追記いまだに（ありがたいことですが）検索で飛んできたりブクマされたりというのがちょいちょいあるので，最新動向を書いておきます。 id:tokuhirom さんが Lingua::JA::Regular::Unicode という Pure Perl Module をリリースなさいました（→ http://d.hatena.ne.jp/tokuhirom/20081018/1224300947）。あなたが作っているアプリで文字列まわりを Unicode::Japanese インスタンスですべて持ちたいわけでなければ（そして，たいていのばあい，持つ必要はないのですが），この Lingua::JA::Regular::Unicode を使うのがベターです。依存性もなく，とても軽量ですので。 2008-10-21 追記おわりウェブアプリを作っていると，ユーザが入力した半角
Kimura 2011/08/04
[Unicode::Japanese]Unicode::Japaneseの詳しい使い方。podドキュメントで公開されていない機能まで書いてある。h2zKanaバンザイ

unicode

Perl

日本語

Jcode
リンク
KLab
ご指定のページが見つかりませんでした URLの変更、もしくはページが削除された可能性があります。お手数ですが、以下のリンクから目的のページをお探しください。
Kimura 2011/08/03
[DBD::mysql]MySQL4.0、4.1、5.0の文字コードサポートの違いや文字化けの原因、そして解決方法が書かれている。SET NAMESでは0x5C問題が起こるので、default-character-setを使おう

mysql

文字化け

日本語

文字コード

DBI
リンク
MeCab: Yet Another Part-of-Speech and Morphological Analyzer(形態素解析エンジン)
MeCab に至るまでの形態素解析器開発の歴史等はこちらをご覧くださいメーリングリスト一般ユーザ向けメーリングリスト開発者向けメーリングリスト新着情報 2008-02-03 MeCab 0.97 マルチスレッド環境で辞書を開くときの排他制御がうまくいっていなかったバグの修正 Windows版でインストール時に辞書の文字コードを指定できるようになった一部のコンパイラで正しくコンパイルできなかった問題の修正部分解析モードを変更するAPI の追加 (Tagger::set_partial()) ラティスの生成レベルを変更するAPI の追加 (Tagger::set_lattice_level()) 温度パラメータを変更するAPIの追加 (Tagger::set_theta()) 全候補出力モードを変更するAPIの追加 (Tagger::set_all_morphs()) 2007-
Kimura 2011/08/01
形態素解析エンジン。文章を単語と品詞その他に分割してくれる。「みーきゃぶ」かと思ったら「めかぶ」だった。開発者が「めかぶ」好きで命名したってホント？

形態素解析

日本語

検索

mecab

めかぶ

和布蕪
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx