タグ

ブックマーク / shinodogg.com (2)

  • Amazon CloudSearchのMulti Languagesについて

    Amazon CloudSearchは2014年3月から日語がサポートされましたが、 Analysis SchemeでJapaneseを選択した場合、形態素解析のみとなり、 N-Gramがあるとイイのにな、と思う場合があります。 Analysis Schemeには”Multi Languages”というオプションがあるのですが、 先日、こちらを選択することで、N-Gramに該当する検索が実現できるようになりましたので さっそく試してみたいと思います。 ■ Japanese(日形態素解析) と Multi Languages(N-Gram) の 2つのフィールドを定義します。 ■ それぞれのフィールドに都道府県の名称を入れてみます ■ Japanese(日形態素解析) を “京都” で検索してヒットするのは “京都府” のみになります。 ■ Multi Languages(N-Gr

    Amazon CloudSearchのMulti Languagesについて
    bobbyjam99
    bobbyjam99 2015/10/22
    Analysis Schemeにで"Multi Languages"を指定すると、N-Gramに該当する検索が実現できるようになってたらしい
  • Amazon CloudSearchのクライアントプログラミング

    ■ Search Data Format (SDF) Amazon CloudSearchでデータをインデクシングするのにSDFというフォーマット(JSONもしくはXML)で データをアップロードする必要がありますが、2014年1月現在、以下の方法があります。 1. コマンドラインツールをインストールしてcs-import-documentsコマンドを使う 2. ManagementConsoleでブラウザからポチポチする 3. DocumentEndpointに直接curl等でPOSTする SDFフォーマット的には↓に詳しく記載されていますが、 http://aws.amazon.com/articles/8871401284621700#_Ref198105621 以下のような情報が必要な感じになります。 – 操作種別(add/delete) – 一意の識別子 – バージョン番号 –

    Amazon CloudSearchのクライアントプログラミング
  • 1