タグ

2010年5月14日のブックマーク (4件)

  • blog.yatsu.info: IME開発者会議@Google食堂

    今日はGoogle堂にIME開発者が集まり、情報交換しました。GoogleIME, Social IME, SKKIME, ChaIME, AquaSKK, uim, MacUIMの開発者など総勢14名(たぶん)が参加し、ライトニングトーク大会になりました。 私の発表資料(余分なもの省略版) 変換文字列をカラフルにする(InputHiliter) View more presentations from yatsu. InputHiliterについてはこちら。 http://inputhiliter.yatsu.info/ バージョン3.0から色を設定できるようになり、楽しいアプリになりました。 実用度はわかりませんが。

    blog.yatsu.info: IME開発者会議@Google食堂
    mamoruk
    mamoruk 2010/05/14
    行きたかったがタイミングが合わなかった。。。
  • Mozc(Google日本語入力)のコードを読んだメモ - 射撃しつつ前転 改

    Google日本語入力がOSS化されたということで、気になっていたところをいくつか確認してみた。 変換アルゴリズムはどんな感じか? twitterの工藤さんの発言にも「わりと古典的な最小コスト法」とあるけれど、まさにそんな感じ。人名の処理とかでちょっと特別なコードが入ったりもしているが、ほぼ基的な統計的かな漢字変換のモデル。係り受けの情報とかは使っていない。Viterbiでベストパスを求めて、品詞ベースで文節にまとめあげている。コストモデルは接続コストが品詞対品詞で、単語コストの方は単語毎に設定されているっぽい。 src/converter/immutable_converter.ccのImmutableConverterImpl::ViterbiがViterbiアルゴリズムの部分で、その後にMakeSegmentsで文節にまとめている。読むならImmutableConverterImp

    Mozc(Google日本語入力)のコードを読んだメモ - 射撃しつつ前転 改
  • yoshimasa niwa - About+Contact

    こんにちは。丹羽善将です。サンフランシスコをベースにソフトウェアエンジニアとして活動しています。 コンタクト 違うメールアドレスをご存知ですか?お伝えしたすべてのアドレスは有効ですので、そのままお送りください。 PGP/GPG公開鍵IDは75B58670、指紋は98D8 DE18 71D9 EBCD BA52 17BE 4819 8287 75B5 8670です。 その他のコンタクトポイントとリソース twitter の Tweets skypeはniwaniwaniw github の ソースコード flickr™ の 写真 DOPPLR の トラベル 専門とレジュメ facebook の 紹介ページ Linkedin の 紹介ページ 言語選択 日英語 English

    mamoruk
    mamoruk 2010/05/14
    niw さんの所属twitterになってますね
  • 「柴田尚樹氏と人類の全科学知識を整理する技術について語る」開催レポート - JTPA

    みなさん、こんにちは。 先日の柴田尚樹さんのサロンのレポートをお送りします。 レポーターは山顕範さんです。 人類の全科学知識を整理する技術「知の構造化」 柴田 尚樹さん (Naoki Shibata, Ph.D) 東京大学 助教, スタンフォード大学 客員研究員, (楽天株式会社 執行役員) 知の構造化とは 東大の前学長の小宮山先生による話で「科学が進化すればするほど、最先端の学術研究は細分化し、論文の量は膨大になる。したがって専門家であってもある学術分野の全体像が分からなくなってしまう状況は深刻な問題を引き起こす。その結果政府も企業も間違った投資が行われてしまったり、研究がニーズに対応した方向に進まないだけでなく、学問間の融合が起こりにくくなる。ついてはある学術領域の全体像を見えるようにする方法論を作りたい。」という話が発端との事。 これを「知の構造化(Structuring

    mamoruk
    mamoruk 2010/05/14