[B! elasticsearch] tkykutdのブックマーク

JMeterの実行結果CSVデータをローカルMacにたてたElasticsearchとKibanaで可視化する | DevelopersIO

「JMeterの結果CSV、216万行か〜。これくらいだったらJMeterの「グラフ表示」で読み込んで見られるかな〜」 CPU「ブオオオオオオオオン！」はじめにシステムの負荷試験において、Apache JMeterのようなツールを使って試験を実施・結果を出力するケースもあると思います。結果ファイルのサイズがそれほど大きくない場合は、全データを計算する（JMeterでいう「統計レポート」）で問題ありませんが、例えば、長時間負荷をかけたので時系列でデータをグラフ化したい、といったことになると事情が変わってきます。JMeterの結果CSVは手元にあるので、なんとかこれを活用したいところではありますが、数百万行レベルのデータになると、とたんにExcelなどでは辛くなります（というか最大行数的に無理な気がします）。そこで、ちょうど、弊社木戸がElasticsearchシリーズを連載しているとこ

tkykutd 2017/07/29

リンク

Elasticsearchで複数フィールドにまたがるGROUP BY的なAggregationsを指定する - Qiita

Elasticsearch でちょっと複雑な集計をしようと思った場合、 SQL とは若干感覚が違うので書いておきます。正直 Elasticsearch はボチボチ触り始めた程度なので、もっとスマートなやり方があるとかそのままだと問題あるよとかあったら教えて欲しいです。先に言っておくとサンプルコードの類は直接は実行していないためシンタックスの不備とか細かいミスあるかもしれませんが備忘録ってことで...... 以下は参考にしたサイトなど: Elasticsearchの"Aggregations"を使って SQLの"Group by"を置き換える Executing Aggregations マッピングの準備今回はブログの記事ごとにデバイス別 PV / UU 数を取得する例を用います。ここでは article_access_logs というタイプがあって article_id に記事 ID

tkykutd 2017/02/11

リンク

Elasticsearch導入前に気を付けておきたいこと！ - Qiita

はじめに Elasticsearchを仕事で使うことになったので導入前に考えるであろうことを調査・検証し、まとめてみました。記載されている内容はほぼ公式ドキュメントから引っ張ってきています。それぞれの章にリンクを付けてありますので、記載されていること以外に気になる部分があればそちらを参照されるとよいと思います。インストールについてここで設定している内容はすべてansibleのスクリプトに落としてあります。 5分あればcurl,javaのインストール、Elasticsearchのインストール・初期設定、プラグインのインストールが終わるはずです。 https://github.com/uzresk/ansible-elasticsearch2 環境 CentOS6.7 Java1.8.0_45 Elasticsearch 2.1.1 HeapSizeの設定 Elasticsearchが使

tkykutd 2016/04/18

elasticsearch

リンク

Elasticsearchへのクエリが突然Failし始めた時の対処(fielddata cacheがデフォルト無限で泣いた話) - Qiita

Elasticsearchへのクエリが突然Failし始めた時の対処(fielddata cacheがデフォルト無限で泣いた話)Elasticsearch Elasticsearchにクエリ投げても突然応答しなくなるという事象が発生し、調査してみたので内容をシェア。出たエラー突然Elasticsearchのクエリがfailし始めて、Kibanaのグラフが応答しなくなったという話が上がる。。ログ見てると、下記の用語が怪しいので調査うちの環境だと、HEAP_SIZEを18gにしていたので、まさにこのエラーは、[indices.breaker.fielddata.limit]でひっかかっている。(18g*60%=10.8g...) OOM(OutOfMemory)を制御する為の機構デフォルト値は下記 [indices.breaker.fielddata.limit] The fieldd

tkykutd 2016/04/18

リンク

ElasticSearchのfield data cacheについて - サナギわさわさ.json

ElasticSearchをしばらく運用してみて、いくつかノウハウがたまってきたので残しておきます。 Solrを使う事が多かったので最初は慣れなかったんですが、公式のドキュメントがSolrより充実しているしクエリがJsonベースで組みやすいので結構使いやすい気がしてきました。今回はfield data cacheについてです。余裕ある人は公式サイト見た方が色々詳しいと思います。 https://www.elastic.co/guide/en/elasticsearch/reference/current/index-modules-fielddata.html field data cacheとは ElasticSearchでは、各fieldのデータをメモリに載せることで検索を高速化しています。これをfield data cacheと呼びます。SortやAggregation(集計)を高

tkykutd 2016/04/18

elasticsearch

リンク

Elasticsearchのインデキシングに関するパフォーマンス検討

Elasticsearchのインデキシングに関するパフォーマンス検討原文：performance considerations for elasticsearch indexing Elasticsearchユーザは様々な楽しいユースケースを持っています。小さなログを追加することから、Webスケールの大きなドキュメントの集合をインデキシングするようなことまでです。また、インデキシングのスループットを最大化することが重要で一般的な目標となります。「典型的な」アプリケーションに対して良いデフォルト値を設定するようにしていますが、次のちょっとした簡単なベストプラクティスによってインデキシングのパフォーマンスをすぐに改善することができます。それらについて記述します。第一に、制御できないならば、巨大なJavaヒープを使用しない：必要なサイズ（マシンの持つRAMの半分以下）のheapだけを設定し

tkykutd 2016/04/18

elasticsearch

リンク

nginx kibana elasticsearch fluentd 連携 - Qiita

概要 nginx のログを fluend で収集し、 elasticsearch にデータを格納。 kibana で可視化を行います。目的アクセス、ユーザーの属性等のログを可視化し、サービス改善の新たな企画、施策に繋げる。各種ツール説明 nginx -> websever apache的な kibana -> データ可視化ツール。グラフ化 elasticsearch -> 全文検索エンジン。Apache Luceneを元に作成されている。同じく Lucene が元になっているものとして solr がある。 fluentd -> ログ収集ツール。様々な input 元、 output 先を設定できる plugin が豊富。Rubyで記述されており、plugin の作成も容易全体の流れ nginx -> fluentd -> elasticsearch -> kibana 今回は、す

tkykutd 2015/12/24

リンク

fluentd + elasticsearch + kibana + siege でお手軽に web サイトのレスポンスタイムを可視化する試み - ようへいの日々精進XP

はじめに前回の続きログを elasticsearch に投げる部分を fluentd でやってみることにする（厳密には td-agent）参考 FluentdからMongo DBにデータを文字列(string)から数値(integer)に変換して入れる IT 東京楽しいと思うことすぐに使える！正規表現サンプル集準備 fluentd のプラグインインストール fluent-plugin-elasticsearch elasticsearch にログを投げる為に... /usr/lib/fluent/ruby/bin/fluent-gem install fluent-plugin-elasticsearch --no-ri --no-rdoc -V fluent-plugin-typecast elasticsearch に送るデータの型を変換する為に...理由は後述。 /usr/

tkykutd 2015/12/23

リンク

Elasticsearchでintegerになっていて欲しいところがstringになっていた時の対処法 - Qiita

問題 Elasticsearch, Fluentd, Kibanaの構成を作り、apacheやapplicationのログを送るシステムまでは完成させたのだけれど、kibana上でdashboardを作っていた時に、apacheのresponse timeや、データサイズのfieldが上手くソートできない問題に遭遇。 stringで見てるっぽいなーってとこまではわかっている状態。調査とりあえず、mappingのrequestを投げるためにindexの名前とかを知りたい。 $ curl -XGET http://localhost:9200/_cat/indices?v health status index pri rep docs.count docs.deleted store.size pri.store.size yellow open tarr-1970.01.01 5 1

tkykutd 2015/12/23

リンク

FluentdからElastic Searchへ投入するデータの型を変換する - Qiita

元々やりたかった事 apacheのアクセスログをfluentdで取り込んでElastic Searchに投入してKibanaで分析したいアクセスログはちょっと形式をいじってレスポンスタイムが記録されるようになっている ElasticSearchで10秒以上とか遅いアクセスを抽出したい困った事標準のapacheのログ形式は使えないので自前で下記の感じで正規表現を定義 <source> type tail format /^(?<host>[^ ]*) - - \[(?<time>[^\]]*)\] "(?<method>\S+)(?: +(?<path>[^ ]*) +\S*)?" ( ?<code>[^ ]*) (?<size>[^ ]*) (?<restime>[^ ]*) (?<resstate>[^ ]*)(?: "(?<referer>[^\"]*)" "(?< agent>

tkykutd 2015/12/23

リンク

Elasticsearchで既にあるインデックスのスキーマを変更する方法 - shnagaiの日記

プロダクション環境でElasticsearch+kibana(fluentd)でログ可視化運用をしてみてわかった事でElasticsearchのマッピングについて記事を書いたところ、下記のようなツッコミをいただいたので実際に試してみた。 @johtani ありがとうございます。試してみましたが、APIでindexに対してマッピング追加出来ました。テンプレート+APIで当日分のマッピング追加すれば無駄データは出来ないですね！後で追記しときます。— shnagai (@shnagai) December 22, 2014 内容は、新しいフィールドが追加される時に、事前にスキーマ定義しないと型がStiringのanalyze(分かち書きあり)にされるので、事前にテンプレート作りましょという内容を書いたのですが、既存のインデックスについてもフィールドのスキーマ変更出来るという事でした。今回の例で

tkykutd 2015/12/23

リンク

プロダクション環境でElasticsearch+kibana(fluentd)でログ可視化運用をしてみてわかった事 - shnagaiの日記

これは Elasticsearch Advent Calendar 2014 22日目の記事です。今回は、プロダクション環境で、流行りのFluentd+Elasticsearch+Kibanaでログ可視化というのを数ヶ月やった中で苦労した点とかはまった点を書いてみます。というか、書き終えて思うとこれからやる人はここに気をつけた方がいいというような内容になってしまったので、既に運用されている方にはあまり役に立たないかもです。。内容は、大きく下記3つです。 ①集計(検索)の条件を考えてtemplateでnot_analyzeを指定しておく ②スキーマ変更があるindexは、日単位でindex作るべし ③数値型フィールドの罠(Fluentd寄りの話) 前提として、この流れで収集しているのは下記4パターンのログ達。・Apache accesslog ・Apache errorlog ・Ap

tkykutd 2015/12/23

リンク

インデックステンプレートとLogstash

前回の「Logstashを利用したApacheアクセスログのインポート」の続きです。前回の記事では、Logstashの設定ファイルについて説明しました。今回は「Elasticsearchに設定するインデックステンプレート」について説明します。テンプレートの設定 Elasticsearchでは、登録するデータの特性に合わせてMappingを定義する方がデータを効率良く扱うことができる場合があります。この場合、通常ですと、インデックス作成時にMappingを指定します。ただ、今回は、インデックス名に「年」を含める形で指定してあります。「年」はLogstashで処理したデータによって決まります。このため、あらかじめMappingを指定してインデックスを作成するのは難しいです。このような場合に便利な機能として、「インデックステンプレート」があります。インデックステンプレートとは実

tkykutd 2015/12/23

リンク

今日から始めるfluentd × Elasticsearch × kibana - カジュアルな解析・高速化 - Eureka, Inc.

目次 1. まえがき 2. pairsとシステム 3. kibana サンプルシステム構築 3.1 サンプルのサーバー構成例 3.2 fluentd 3.3 Elasticsearch 3.4 kibana 4. kibanaを使う 5. エウレカでの実際の活用事例 6. 〜終章〜 1. まえがき 1.1 対象者気軽にデータ収集をしたいと思っている開発者基本的なLinuxコマンドの理解がある方 1.2 この記事を読んで分かること fluentd x Elasticsearch x kibana を用いたアクセスログの収集・計測方法 pairsのシステム概要私の好きなアニメ pairs高速化チーム 1.3 この記事を読んでも分からないこと本格的な統計解析恋人の作り方 1.4 自己紹介はじめまして。サービス事業部の森川と申します。エウレカには今年のはじめ頃にJoinしました。エ

tkykutd 2015/12/22

リンク

はてなブックマーク

タグ

関連タグで絞り込む (7)

elasticsearchに関するtkykutdのブックマーク (14)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス