2016年4月18日のブックマーク (2件)

  • 検索エンジンの常識をApache Solrで身につける

    検索エンジンの常識をApache Solrで身につける:ビッグデータ処理の常識をJavaで身につける(1)(2/4 ページ) 【2】言語同定器 検索エンジンで複数の言語からなる文書集合のインデックスを生成する際、入力文書の記述言語によって処理が異なることがあります。 例えば、日語文書では単語の区切りがないため、トークナイザが文中に含まれる単語を確率的に推定して単語を切り出してあげる必要があります。一方で、英語の文は単語の区切りが自明であるため、トークナイザが行う処理はほとんどありません。このように、入力文書の記述言語が複数存在する状況では、入力文書の記述言語によって利用するトークナイザなどのコンポーネントを変更する必要があります。 上記のように入力言語によって処理内容を変えるためには、そもそも入力クエリや文書が、どの言語で記述されているのかを同定する必要があります。「言語同定器」というコ

    検索エンジンの常識をApache Solrで身につける
    djshigy
    djshigy 2016/04/18
    “Apache Solr”
  • Material Kit 2 by Creative Tim

    Free Bootstrap 5 Material Design UI Kit Product description The most complex and innovative UI Kit Made by Creative Tim. Check our latest Freebie Bootstrap 5 UI Kit with a fresh, new design inspired by Google's Material Design 2. Designed for those who like bold elements and beautiful websites, Material Kit 2 is ready to help you create stunning websites and web apps. We created many examples for

    Material Kit 2 by Creative Tim
    djshigy
    djshigy 2016/04/18
    bootstrap