タグ

ブックマーク / chasen.org/~taku (5)

  • きまぐれ日記: Julius で遊んでみる

    オープンソース音声認識エンジンの Julius で遊んでみました。 Julius は、奈良先端科学技術大学院大学の鹿野研究室で開発されている音声認識エンジンです。 手前味噌になってしまいますが、奈良先端はいい大学ですね。ChaSen の例もそうですが、 大学としての成果を社会に還元しようという姿勢がすばらしいです。 さて 件の Juliusですが、 以前は敷居の高かったインストール作業がずいぶん楽になっています。 windows なら http://julius.sourceforge.jp/juliuskit.htm にあるディクテーション実行キットをダウンロードして、run_fast.bat を実行するだけでした。 はっきりとしゃべれば、面白いように認識してくれます。ぜひお試しあれ。 話が少し脱線しますが、先日 IBIS という会議に行った際、鹿野先生にお会いしました。音声認識はデータ

    nak2k
    nak2k 2006/01/16
    オープンソースの音声認識ソフトについて。
  • http://chasen.org/~taku/blog/archives/2005/09/_swig_perlrubyp.html

    nak2k
    nak2k 2006/01/16
    >C++ のクラスをそのまま perl/ruby/python のクラスに変換してくれます。
  • http://chasen.org/~taku/blog/archives/2005/10/treehh_1.html

    nak2k
    nak2k 2005/10/24
  • きまぐれ日記: タグとマルチラベル問題と機械学習

    ネット上のサービスを見ていると、メールなりWebページをある一意のカテゴリに分類するという整理法から、タグ(ラベル)をつけるという整理法に変わってきているようです。 代表的な例は Gmail。フォルダという概念はなくメールにラベルを付与していきます。私が良く使う方法は、「リマインダー」のラベル(メールの重要さという観点)と「内容」のラベルです。二つはそれぞれ独立した分類方法ですが、フォルダだと同居できません。他の例だと「はてなブックマーク」があります。ユーザが任意のタグを付与することができます。 機械学習の言葉を使えば、従来のフォルダは「シングルラベル」の分類問題、後者のタグは「マルチラベル」分類問題となります。文字どおり、前者はインスタンスに対し1つのラベルのみを付与する問題、後者は複数のラベルを付与する問題です。 さて、機械学習の分野でマルチラベル問題はどう進展してるのでしょうか?実際

    nak2k
    nak2k 2005/10/07
    分類方法について
  • Ajax IME: Web-based Japanese Input Method

    Webベースの日本語入力サービスです。海外からでもブラウザさえあれば日語を入力す ることができます。 特別なソフトは必要ありません。 使い方 お使いのコンピュータの日本語入力を切りかえて直接入力にします。 Alt-o (Ctrl-9) で Ajax IMEモードに変更します。(ボタンで切り替えるかえることもできます) 適当な文をローマ字で入力します。 spaceを押して漢字に変換します。続けて押すことで候補選択を行います。 returnを押す、もしくは次の入力を開始することで入力を確定します。 F9で強制的にカタカナに、F8で強制的にアルファベットに変換します。 再度 Alt-o (Ctrl-9)で直接入力に戻ります 海外旅行先や留学先, 海外のネットカフェなど日本語入力環境が 無いパソコンからご使用ください。 Firefox と Internet Explorer で動作確認をしていま

    nak2k
    nak2k 2005/08/10
  • 1