タグ

形態素解析に関するsawyerのブックマーク (3)

  • NPO法人 連想出版

    10周年を迎えて、次の10年で目指すこと 2005年8月、自発的な問題意識を深める情報サービス「新書マップ」の開発チームを中心に、連想出版は設立されました。信頼できる情報を社会の公共財として育てることを目標に、研究者、編集者、ウェブデザイナーなどの専門家が集まり、従来の活字メディアがもつノウハウをネット空間の情報精度の向上に役立てようと挑戦してきました。これまで10年間の活動を振り返り、今後、私たちは何をなすべきか考えてみたいと思います。 ウェブの普及により膨大で多様な電子情報がいつでも利用可能になりました。しかし、信頼できる情報を得ることは相変わらず難しく、私たちが新しい発想を生み出すための情報を集めることは容易ではありません。連想出版はこの課題に引き続き挑戦していきます。情報技術については、国立情報学研究所連想情報学研究室の成果を活用します。人間が無意識に自分の記憶を探って関連情報を想

  • Sen - FrontPage

    Generated by Hiki 0.8.6 (2006-07-03). Powered by Ruby 1.8.5 (2006-08-25). Founded by ghfghgh564.

  • Rosette形態素解析システム

    トークン化や品詞のタグづけ、基形化、複合語分解、漢字の読みなどの機能で高度なテキスト解析を実現する基的な言語解析モジュール 製品評価版お問い合わせフォーム 高精度な言語解析を実現 Rosette Base Linguictics (基言語解析)はポータブルで高性能なテキスト分節(分かち書き)エンジンです。10年以上にわたり、多くのWeb検索エンジンやエンタープライズ・サーチのインデックス生成にトークナイザとして利用されています。 テキストを単語(トークン)に分割し、トークンに品詞を付与するとともに、活用語を正規化して基形(辞書に載っている標準形)を出力します。さらに、複合名詞をその構成要素に分解したり、読みを出力する機能もあります。独自のアルゴリズムと約50万語の辞書(* 随時更新)でテキストを的確に分節します。日語の外来語由来のカタカナ文字列の分かち書きも適切に行えるよう設計さ

    Rosette形態素解析システム
  • 1