タグ

ブックマーク / kazama.hatenablog.com (4)

  • 大規模テキスト処理を支える形態素解析技術(工藤拓氏・Google) - Cafe Babe

    第80回知識ベースシステム研究会を開催したが,二日間で58名の方々に参加して頂き,積極的に議論に加わって頂いた.この場を借りて,参加してくれた方々に感謝したい.大変遅くなった(爆)が,Googleの工藤拓氏による招待講演「大規模テキスト処理を支える形態素解析技術」の概要を,このブログで報告しておきたい.工藤氏の専門分野は統計的自然言語処理と機械学習であるが,日形態素解析エンジンMeCabの開発者であり,他にも自然言語処理関連の有益なツールや,Webベースの日本語入力を可能にするAjax IMEのようなユニークなサービスを提供しているなど,時代をリードする研究開発者の一人である.彼の活動に興味があれば,彼のブログ「きまぐれ日記」は必見だろう. なお,当日は弊社側の不手際で,予定していた工藤氏の重要なデモをおこなうことができなかった.弊社はネットワーク会社であるにもかかわらず,ネットワーク

    大規模テキスト処理を支える形態素解析技術(工藤拓氏・Google) - Cafe Babe
  • NIO.2: 失われた惑星からの帰還 - Cafe Babe

    私達(JSR-203エキスパートグループ)は,ついにJSR-203の早期ドラフトレビュー(EDR: Early Draft Review)仕様を公開しました.別名NIO.2として知られているこのJSRは,"New I/O APIs for the Java SE platform"の第二段階です.特に,新しいファイルシステムインタフェース,非同期I/O API,そして最初のNIO JSR (JSR-51)から受け継いだソケットチャネルAPIを完成させることが課題です。JSR-203は,Java SE 7の構成要素候補JSRとして提出する予定です。 私達が提出したドラフト仕様は,すでにhttp://jcp.org/aboutJava/communityprocess/edr/jsr203/index.htmlからダウンロードできます.さらに,このJSRについて議論するためのメーリングリストも

    NIO.2: 失われた惑星からの帰還 - Cafe Babe
  • 「Vistaの新文字セットが引き起こすトラブル」特集 - Cafe Babe

    IT Proに特集ページができている. http://itpro.nikkeibp.co.jp/99/vista/index.html 私は,次の3つの段階で問題が発生すると予想している. 文字の表示(フォント変更に伴う字体変更) 内部でレガシーエンコーディングを用いたシステムの入・出力(新しく追加された文字) 内部でUnicodeを用いたシステムのテキスト処理のバグの顕在化(文字列操作,文字列長取得,未正規化文字列との比較,文字列合成など) この特集をざっと見て思うのは,最初の字体変更の問題に偏りすぎているようなこと.開発者にとっては,それ以降の問題の方が,まさに自分自身の責任になるので深刻かもしれない. 二番目に関しては将来的なシステムのUnicode化はもう避けられないと思っているので,その移行までをどううまく凌ぐかという問題に置き換えられるかもしれない. また,三番目は補助文字の登

    「Vistaの新文字セットが引き起こすトラブル」特集 - Cafe Babe
  • Javaのバグを見つけたんですが… - Cafe Babe

    最近,社内のとある人から,Javaのとあるバグで困っていると相談を受けた.そこで,代わりにバグデータベースを調べてバグレポートを見つけて,もしこのバグなら,このバグに投票してコメントしろと答えたが,それに対する返事はないし,現在もそのバグレポートの投票数が増える気配はまったくない(苦笑) まあ,自分の仕事で直面する問題を解決して,できる限りよい成果を出そうというほどの気合いがないのかもしれない.それどころか,そういうことをちゃんと実行する仕事に真摯な人は社内的に嫌われるのが日の企業文化(いや,実は弊社だけだったりして(苦笑))なのかもしれないなあ…と嘆いていたところに,kyukaさんのブログに非常にナイスな投稿があった. それを元に,Javaのバグを直す方法をざっと振り返ってみよう. バグデータベースを使って,投票・報告する まず最初にやるべきことは,バグデータベースを検索すること.そし

    Javaのバグを見つけたんですが… - Cafe Babe
    hiro360
    hiro360 2006/01/20
  • 1