タグ

2011年10月7日のブックマーク (3件)

  • java.io.StreamTokenizerで字句解析

    JavaのCoreクラスをぼやっと眺めていると、なかなか面白いクラスがあることが判ります。ここで紹介するjava.io.StreamTokenizerクラスは入力ストリームの字句解析をする機能を提供します。この機能に構文解析機能を組み合わせれば、プログラミング言語の処理系を作ることができるわけで、なかなか興味深いクラスです。 Unix系のシステムを使っている人なら、lexというプログラムのことを聞いたことがある人は多いと思いますが、実際に使ったことがある人は結構少ないでしょう。ちなみにGNUプロジェクトではflexという名前でプログラムが提供されています。lexは字句解析を行うプログラムを生成するプログラムですが、StreamTokenizerは自身が字句解析を行います。多少の設定で挙動を変える事もできます。 字句解析というのは、要するに何かのソースファイルを読み出して、トークンと呼ばれる

  • Solr のフィールドにHTMLを入れる

    cles::blog 平常心是道 blogs: cles::blog NP_cles() « 今年初のかき氷 :: ELECOM ディスプレイポート-DVI変換アダプタ » 2011/07/03 Solr のフィールドにHTMLを入れる  solr 163 0へぇ Solr のフィールドにタグを実体参照にした HTML をそのまま投入してみたら、ぽつぽつ登録できないドキュメントが出てしまって困りました。 ログを見るとこんな感じなので、どうやら のような実体参照の部分で引っかかっている模様。 2011/07/03 21:51:14 org.apache.solr.core.SolrCore execute 情報: [] webapp=/solr path=/update params={} status=500 QTime=0 2011/07/03 21:51:14 org.apa

    Solr のフィールドにHTMLを入れる
  • AnalyzersTokenizersTokenFilters - Solr - Apache Software Foundation

    This page exists for the Solr Community to share Tips, Tricks, and Advice about Analyzers, Tokenizers and Filters. Reference material previously located on this page has been migrated to the Official Solr Reference Guide. If you need help, please consult the Reference Guide for the version of Solr you are using. The sections below will point to corresponding sections of the Reference Guide for eac

    sasashin
    sasashin 2011/10/07
    Solrのシノニムフィルタ。