2008年09月23日 Solrに日本語のデータをCSVからロード 今日は Solr に日本語のデータを入れてみることにする。これで業務でも実際に扱うようなデータが入ると、俄然やる気が出てくるというもの。 方法は Solr Wiki の Updating a Solr Index with CSV のとおり。Cygwinに curl が入っているので、これでPostを行うことでデータを入れる。 まずは Solr を昨日の日本語化を何もしない状態で起動し、その状態でデータを入れてみることにする。 CSVの区切り文字はマニュアルでは、デフォルトがコンマ区切り、上記Wikiの最後の例ではTab区切りになっているが、指定ができるみたいなのでセミコロン区切りのものを使ってみる。 CSVの1行目のヘッダーは、現在 schema.xml に入っているものの中から、実際のデータに合いそうなものをピックアッ