タグ

2008年5月14日のブックマーク (3件)

  • 機械翻訳最新事情(下) - 松本研研究日誌

    今日は機械翻訳勉強会で 塚田元,永田昌明,隅田英一郎,黒橋禎夫.機械翻訳最新事情(下)評価型ワークショップの動向と日からの貢献.情報処理, Vol.49, No.2, pp.194-202, February 2008.について紹介。 上は先々週松先生がやったそうで、統計翻訳の入門編。今回は統計翻訳の研究を飛躍的に発展させた評価型ワークショップの話と、用例ベース翻訳や最近の日のシステムの話。 来週以降の進め方をどうするかという話になったが、NTCIR-7 の締切が今月末だと昨日知って(7月か8月だと思っていた)、どうしようということになっている。やれることをやるしかないわけだけど。

    morioka
    morioka 2008/05/14
  • 1日で作る全文検索エンジン - Building a full-text search engine in "ONE" day - - とあるはてな社員の日記

    最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めのです。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン

    morioka
    morioka 2008/05/14
  • Looking towards IPv6

    Hey—we've moved. Visit The Keyword for all the latest news and stories from Google

    Looking towards IPv6
    morioka
    morioka 2008/05/14