タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

elasticsearchに関するtakezoeのブックマーク (5)

  • Elasticsearch 2.4から5.0.1にアップグレードしていろいろはまった - wyukawa's diary

    手元でカジュアルに運用しているElasticsearch 2.4(2.4.1だったかも)をえいやと5.0.1に上書きアップグレードしていろいろはまったのでメモっておく。 その前にElasticsearch 5がどんな感じなのかはwyukawa's tumblr, johtaniさんとElasticsearchについて話しました Guest ...を聞くと良いと思います。まあ宣伝です。 まあこういうのは2つクラスタ用意してblue green deploymentするのが安全だと思います。 ただどっちにしろクライアントの対応状況にも気をつけたほうが良いです。REST API使ってるやつならだいたい大丈夫だと思いますが、Java系だと互換性が無いんじゃないかな。 僕の環境ではfluent-plugin-elasticsearchから書き込んでますが、アップグレード作業中はデータを止めたほうが良

    Elasticsearch 2.4から5.0.1にアップグレードしていろいろはまった - wyukawa's diary
  • Elasticsearch x Autoscaling(AWS)

    Elasticsearch x Autoscaling(AWS) 1. Amazon Web Searvice で実現する elasticsearchの大規模運用 × 株式会社インティメート・マージャー 松田和樹 2. 自己紹介 松田 和樹 株式会社インティメート・マージャー(社員数9名) 開発部 • パブリックDMP「AudienceSearch」の開発 • 主にインフラ周りを担当 3. アジェンダ • IMにおけるelasticsearchの使われ方 • elasticsearchの構成 • 構成の決め方 • AutoScalingのポイント • その他設定のポイント 4. elasticsearchの使われ方 約4億のユニークIDに対して様々な属性情報を付与 • 閲覧履歴に基づくキーワード • 各メディアより提供されるセグメント • User Agent • アクセス元IPに基づく

    Elasticsearch x Autoscaling(AWS)
  • Elasticsearch 日本語形態素解析のための文字列正規化の重要性

    語の文章を形態素解析するときは、トークナイズする前に文字列の正規化を済ませて検索精度を向上させよう! この記事は、Elasticsearch Advent Calendar 2014 の18日目のエントリーです。即席で申し訳ないですが、なんとかまとめましたので是非最後までお付き合いください。 今回は、日形態素解析における文字列正規化のお話です。 それでは早速題に。 非正規化された日語の文章を形態素解析を使って、なるべく意図したようにトークナイズするためには、全角英数字を半角英数字に正規化したり、半角カタカナを全角カタカナに正規化したり、不要な文字を除外したり、単語ではなく、文字単位での正規化が重要になってきます。 Japanese (kuromoji) Analysis Plugin のページでも紹介されているように、全角英数字や半角カタカナの正規化には、CJK Width F

    Elasticsearch 日本語形態素解析のための文字列正規化の重要性
    takezoe
    takezoe 2015/03/17
    ICU Analysis Plugin
  • http://blog.yoslab.com/entry/2014/09/03/222930

  • Elasticsearchプラグインを作ってみよう - 今日のひとこと

    はじめに これは Elasticsearch Advent Calendar 2014 – Qiita 、13日目の記事です。 Elasticsearchはプラグインを作成することで、様々な機能を拡張することができますが、今回はプラグインの作り方を紹介します。 前提条件 今回、Elasticsearchプラグインを作成するにあたり、以下のものが準備済みである前提で話を進めます。 Java 7 または 8 Maven 3 今回作るプラグイン 一応、サンプル的ではありますが、ハローワールドだけでも簡単すぎますし、いきなり難しいことでもモチベーションが下がるかと思うので、今回はElasticsearchのクラスター内に含まれるインデックス数を独自のREST APIで返却するプラグインを作成してみたいと思います。 仕様としては、 $ curl -XGET http://localhost:9200

  • 1