タグ

elasticsearchに関するhiroaki256のブックマーク (12)

  • 新規サービスの検索システム立ち上げ時に考慮すること - Qiita

    例外はたくさんあるのでこちらの表はあくまでも参考です。 バッチ更新の場合はcrontabやAirflow、Rundeckなどのワークフローエンジンが使えます。 一方、リアルタイム更新ではAWS KinesisやGCP pub/sub等を活用したり、Apache Beamなどを用いたりしてデータパイプラインを構築することがあります。 アイテムの特性と検索時のクエリ 検索対象となるアイテムの特性と検索する際にどのようなクエリが想定されるかを考えます。 全文検索エンジンを使っているので、基的にはテキストにより表現されているとは思いますが、どのようなフィールドが存在するか、テキスト以外の検索項目などを洗い出します。 クエリに関しても基は「キーワード」ですが、整理したアイテム情報に対してどのようなクエリで問い合わせが可能かを考えます。 システムとして「誰」が検索結果を取得するか、検索結果をどの程

    新規サービスの検索システム立ち上げ時に考慮すること - Qiita
  • 【Cloud Run】ElasticsearchをCloud Runで運用する

    はじめに こんにちは! テラーノベルでサーバーサイドを担当している@yuhasです。 テラーノベルには作品や作家さんの検索機能があり、ユーザーさんの読みたい作品や興味のある作家さんを提示できる検索機能は重要な機能の一つです。 直近でその検索まわりを一新することになり、Cloud RunでElasticsearchを運用することになりました。 Cloud Runで運用することでオートスケールなど多くの恩恵を受けられる一方で、状態をもつElasticsearchをコンテナで動かしていくのは単純なことではありません。 今回はどのようにしてCloud RunでElasticsearchを運用しているのかをお話しできればと思います。 モチベーション もともと外部の検索サービス(SaaS)を利用して検索機能を提供していましたが、インフラ面でのコストを下げたいという話があり、代替手段を模索していました。

    【Cloud Run】ElasticsearchをCloud Runで運用する
  • Kibana用途でElasticsearchを使う時の高負荷対策TIPS - Qiita

    これは Elasticsearch Advent Calendar 2015 8日目の記事です。 ログの可視化ツールとしてKibanaを使っている中で、Elasticsearch運用として色々と得られた知見を書きたいと思います。 Elasticsearchは、ライトな環境だったら特にチューニングなく安定してますがある程度ドキュメント数が積まれてくると、色々苦労があるなという印象です。 ここに書かれているのは、事情がありシングル構成で頑張った話なので、クラスタ組んでスケールするとこんな悩みはないのかもです。 でも、ログは運用系に入るのでそんなにコストかけれるとこはないのではという個人的な所感。 ラインナップとしては、下記のような感じです。 Kibana経由で重たいクエリが投げられると負荷高すぎて泣いた話 高負荷対策として、fielddata_cacheをディスクに逃がす方法 fluentdの

    Kibana用途でElasticsearchを使う時の高負荷対策TIPS - Qiita
  • 天網恢恢疎にして漏らさず全文検索 ~firestore + Elasticsearch + react native~ - Qiita

    前書き firestoreのクエリが使いにくかったので、Elasticsearchでデータを全文検索する方法を調べました。 realtime databaseを使うのであれば、参考になる記事がいくつか見つかっていたのですが、 firestoreを使う場合に良さそうな記事に出会えず、 結局、自分でrealtime database向けの実装を参考にしながらfirestore用に書き換える苦労があったので、 残しておきます。 firebaseを使うと、バックエンドを多少意識から外してもサービスが作れるようになってきている気がしていますが、 まだまだやり方が確立されていないので、どんどん試して公開していく人が増えていくと良いなと思っています。 リクエストがあれば、頑張ります。 対象 firebase使いたいなと思ってる人 firestoreのクエリに物足りなさを感じてる人 Elasticsear

    天網恢恢疎にして漏らさず全文検索 ~firestore + Elasticsearch + react native~ - Qiita
  • Elasticsearchの圧縮方式の比較 - Taste of Tech Topics

    こんにちは。 2年目エンジニアのノムラです。 普段はElasticStackを用いた分析基盤の開発等を行っています。 Elasticsearchを使っているとストレージの使用量を節約したいと思う方は多いのではないでしょうか。 Elasticsearchはデータを格納するときにデフォルトでLZ4という圧縮方式でデータ圧縮を行っていますが、 実はLZ4よりも圧縮率の高いbest_compressionという圧縮方式を利用することもできます。 このbest_compressionは圧縮率が高い分、検索時にはLZ4よりも遅くなると言われるのですが、 実際にどれくらいデータサイズに違いがあるのか、検索速度の違いはどれくらいになるのかが 実はよく分かりません。 ということで今回はこの2つの圧縮方式のデータサイズと検索速度への影響を比較してみました。 目次は以下になります 環境情報 バージョン情報 準備

    Elasticsearchの圧縮方式の比較 - Taste of Tech Topics
  • サイボウズのログ基盤 2018年版 - Cybozu Inside Out | サイボウズエンジニアのブログ

    こんにちは。アプリケーション基盤チームの @ueokande です。 今日は、サイボウズの新しくなったログ基盤についてお話しします。 サイボウズのログ基盤の進化 リプレイス前のログ基盤 サイボウズのログ基盤はサービスの成長に合わせて、常に進化し続けてます。 そんななか2017年の夏に大きなリプレイス作業がありました。 サイボウズのサービスを支えるログ基盤 from Shin'ya Ueoka 以前のログ基盤は、ログを収集するホストがあり、各ホストからログを収集してました。 しかしログの転送システムが単一障害点であったり、スケーラビリティに欠けるのでサービスの成長に追いつかず、性能的にも限界に達してました。 また以前のログ基盤では、ログの解析がしにくく、ログはあるけどビジネスに役立てにくい状況でした。 そのため今後のサービスの成長や、より安定したログ基盤を運用できるように、ゼロから刷新するこ

    サイボウズのログ基盤 2018年版 - Cybozu Inside Out | サイボウズエンジニアのブログ
  • ES DeskというElasticsearch検証用Webアプリを作った - so what

    このエントリはElastic stack (Elasticsearch) Advent Calendar 2017の12/8分です。 ES DeskというElasticsearch用のWebアプリを作成しました github.com まずはデモサイトをご覧ください。 http://es-desk.winebarrel.jp/ これは何? Elasticsearchのインデックスを編集しながら、トライアンドエラーで検証するためのWebアプリです。 以下のような機能があります。 ブラウザからのQuery DSLの送信と結果の保存 データセットの登録・インポート インデックスの作成・編集 Query DSLの登録・編集 Elasticsearchのインデックスのアナライザを変更する検証を行うときに、いままでは「元のインデックスを消して」「curlで修正したインデックスを投入して」「データをロード

    ES DeskというElasticsearch検証用Webアプリを作った - so what
  • システムメトリクス・ログのリアルタイム解析入門 - Elastic Stackを活用して -

    OSC広島2017で使用した資料になります。

    システムメトリクス・ログのリアルタイム解析入門 - Elastic Stackを活用して -
  • Fluentd / Embulk / Elasticsearch / Digdag を学ぶのに最高な「データ分析基盤構築入門」を読んだ - kakakakakku blog

    出版されてから少し時間がたってしまったけど,「データ分析基盤入門」を読み終えた.ページ数が多く,持ち運ぶようなサイズではないので,家でちょこちょこ読み進める感じになってしまって,想定以上に時間がかかってしまった. データ分析基盤構築入門[Fluentd、Elasticsearch、Kibanaによるログ収集と可視化] 作者: 鈴木健太,吉田健太郎,大谷純,道井俊介出版社/メーカー: 技術評論社発売日: 2017/09/21メディア: 単行(ソフトカバー)この商品を含むブログを見る はじめに 目次にも書いてある通り,「データ分析基盤」というテーマで Fluentd / Elasticsearch / Kibana の解説が詳細にまとまっている.さらに付録には Embulk と Digdag の解説もあり,このあたりの技術スタックに興味がある人にとって最高な一冊なのではないかなと思う.また,

    Fluentd / Embulk / Elasticsearch / Digdag を学ぶのに最高な「データ分析基盤構築入門」を読んだ - kakakakakku blog
  • ElasticsearchをMySQLと同期しつつ手軽に無停止アップデートする - UUUMエンジニアブログ

    nazoです。 Elasticsearchを運用する際に、マスタデータはMySQLで持ちたいという場合にどうやって同期をするかというのが問題になります。また、Elasticsearchはバージョンの互換性が厳しく、別バージョンをクラスタに混ぜることは基的にできず、さらに辞書の更新などを行う場合はインデックスを全て更新しなくてはいけないなどの運用上の課題があります。 今回は社内向けに使っているElasticsearchを、これらの問題を解決しつつどのように運用するかを考えてみましたので、紹介したいと思います。 簡単に MySQLとElasitcsearchの同期は go-mysql-elasticsearch を使います。 無停止のためのデータコピーは elasticsearch-dump を使います。 MySQLとElasitcsearchの同期 go-mysql-elasticsear

    ElasticsearchをMySQLと同期しつつ手軽に無停止アップデートする - UUUMエンジニアブログ
  • Elasticsearch で部内 Wiki 検索高速化

    KMC 例会講座 資料

    Elasticsearch で部内 Wiki 検索高速化
  • 知識ゼロからElasticsearchを実践で使えるようになろう! - $shibayu36->blog;

    以前少しだけElasticsearchを触った時に、自分流Elasticsearch入門 - $shibayu36->blog; というElasticsearchに入門した時のメモをまとめていた。しかし、その頃はElasticsearchを使って完全に一人で一つの機能を作るというところまではいけなかった。 最近になってまたElasticsearchを一から導入する仕事をすることになった。この時以前自分がまとめた記事を読みながらやっていたのだが、実践で一から導入するためにはこの記事だけでは知識が足りなかった。 そこで、前の記事の知識をベースに、一から導入するために少しずつ学んでいき、自分のブログにまとめるなどのことをしてきたので、今回はその締めくくりとして、知識ゼロからElasticsearchを使えるようになるために学習したことについて書いておきたいと思う。 今回書くこと・書かないこと 今

    知識ゼロからElasticsearchを実践で使えるようになろう! - $shibayu36->blog;
  • 1