タグ

ブックマーク / amatubu.hatenadiary.org (2)

  • POPFile 1.0.0 RC1 公開 - あまつぶ@はてなダイアリー

    家フォーラムにて、POPFile 1.0.0 RC1 が公開された。 POPFile はこれまで長い間 0.x.x というバージョンで公開されてきたが、十分安定しており、もうベータ版と呼ぶのはふさわしくないだろうということで、ついにバージョン 1 としてリリースされることとなった。そのリリース候補版である 1.0.0 RC1 が今回公開された。 今回のバージョンは内容的には POPFile 0.22.5 からのマイナーバージョンアップだが、いろいろと改善が加えられている。 詳しくはリリース後にリリースノートの翻訳+αという形で書く予定だが、主な変更点は以下の通り。 日語パーサの改善 日語の分かち書きに、MeCab、辞書や外部モジュールを使用しない内蔵パーサを選択できるようになった。Windows 版のインストーラでは、インストール時にこれらを選択することで自動的に必要な辞書・外部モジ

    POPFile 1.0.0 RC1 公開 - あまつぶ@はてなダイアリー
    Kazabana
    Kazabana 2007/11/26
    IMAP接続時にGmailのフォルダへ振り分け可能になった。
  • 2006-06-08

    リンゴ収穫! お店でクイーンのかんむりを発見。なんと 1000000 ベル。いち、じゅう、ひゃく……って、買えるかい! 分かち書きのプログラムを変更してもあまり速度が変わらない件について、もう少し調べてみた。手元にあった POPFile の履歴から 256 通のサンプルを使って、どこで時間がかかっているのかを Benchmark モジュールを用いて調べてみる。 まず、日語処理を無効にした場合と有効にした場合とでは、2 倍程度の差が見られた。このことから、日語処理部分を最適化していくことによる目標は、現在の速度の 2 倍ということになる。 日語処理のうち、時間がかかっている(通る回数が多い部分)というと、分かち書き処理と、文字コード変換処理あたりか。それぞれの部分でどのくらいの時間がかかっているかを調べると、分かち書き(Kakasi)処理で全体の約 5%、文字コード変換処理で約 40%

    2006-06-08
    Kazabana
    Kazabana 2006/06/09
    「分かち書き処理よりも、文字コード変換処理の方が重たい」→「(文字コード変換処理に)渡された文字列が半角英数字や半角記号のみの場合は何もせずにもどる」→約10分の1に。
  • 1