タグ

2011年6月11日のブックマーク (3件)

  • 日本語の単語分割 - 自然言語処理 on Mac

    語の単語分割処理は、一般に、単語辞書と単語間連接の規則や学習データに基づいて行われます。オープンソースとして有名なものがいくつもあります。 KAKASI - 漢字→かな(ローマ字)変換プログラム JUMAN - KUROHASHI-KAWAHARA LAB chasen legacy -- an old morphological analyzer http://mecab.sourceforge.net/ これらのツールは主に新聞記事のような一般的なテキストが対象です。単語辞書に登録されていない語は未知語として処理されますが、特定分野のテキストを対象として解析精度を保つためには、専門用語や新語などを適宜登録する必要があります。 他方、文字間に単語境界があるかどうかを機械学習の2値分類問題として解く手法があり、ツールも公開されています。 KyTea (京都テキスト解析ツールキット) 次

    日本語の単語分割 - 自然言語処理 on Mac
  • OpenStack Docs: 2023.2

    Welcome to OpenStack Documentation What is OpenStack? OpenStack is a cloud operating system that controls large pools of compute, storage, and networking resources throughout a datacenter, all managed through a dashboard that gives administrators control while empowering their users to provision resources through a web interface. What are the next steps? Documentation for 2023.2 (October 2023) Thi

    kshimo69
    kshimo69 2011/06/11
  • The Little Schemer

    The book is a new edition of The Little LISPer, Third Edition. We have substantially revised the existing material and added a chapter and a half. The book and its sequel, The Seasoned Schemer, appeared with MIT Press in December 1995. The chapter includes the discussion of the Y operator from "Why Y Works". Enjoy! Table of ContentsForeword by Gerald J. SussmanPrefaceSample ChapterErrataGoogle Gro

    kshimo69
    kshimo69 2011/06/11