[B! elasticsearch] [2ページ] nakaearthのブックマーク

nakaearth id:nakaearth

elasticsearchに関するnakaearthのブックマーク (83)

AWS サービスエラー処理 - Amazon Elasticsearch Service
nakaearth 2020/04/24
elasticsearch

amazon
リンク
Amazon Elasticsearch Service がカスタム辞書ファイルをサポート開始
Amazon Elasticsearch Service が、カスタム辞書ファイルをドメインに追加するためのサポートを提供するようになりました。シノニム、ストップワード、セグメンテーションファイルを指定して、インデックス作成、マッチング、検索の関連性を向上させることができます。以前は、これらのタイプのカスタマイズをマッピングに直接含めることしかできなかったため、扱いにくくて管理するのが困難でした。シノニムは、類似の概念に沿って一致結果を拡張する手段を提供します。たとえば、シノニムを「one-> 1」に指定して、これらの関連概念を含むすべてのクエリに一致させることができます。ストップワードは、「a、an、the」のようにあまりに一般的で価値が低い用語であるため、一致や関連性に積極的に貢献することはありません。これらのワードはインデックスとクエリから削除されます。アジア言語とドイツ語でフリー
nakaearth 2020/04/22
elasticsearch

amazon
リンク
@johtani さんと弊社サービスの Elasticsearch について話しました - インゲージ開発者ブログ
@kizashi1122 こと、永田です。 blog.johtani.info @johtani さんがツイートするもんだから、あいよっと返事してしまいました。以下、@johtani さんに話したことも話してないこともツラツラと書いていこうと思いますはじめに弊社のサービスである「Re:lation」はメールやチャットや電話メモなどを一元的に管理できるサービスです。「そういえば○○なメール来てたはずだけど・・・」などという時のために当然検索は必要になります。RDBMS の LIKE 検索でもいいわけですが、インデックスが効かないしデータが増えるとパフォーマンスがでないのは見えていたので、検索エンジンは専用のソフトウェアを使うべきとは思っていました。当時は世の中では Solr も現役だったのですが、同じ Lucene をエンジンとするミドルウェアでも Elasticsearch が伸び
nakaearth 2020/03/27
elasticsearch

サービス

開発

rails
リンク
Amazon Elasticsearch Service でインデックス管理を自動化する
Amazon Elasticsearch Service で、定期的なインデックス管理アクティビティを自動化できるようになりました。以前は、Elasticsearch 内のデータライフサイクルを管理するために追加ツールを使用する必要がありました。たとえば、顧客は多くの場合、運用ログのインデックスを毎日設定し、夜の間にロールオーバーして、30 日後に最も古いインデックスを削除します。Index State Management を使用して、インデックスの経過時間、サイズ、その他の条件に基づいて、Amazon Elasticsearch Service ドメイン内からすべての操作を自動化するポリシーを作成できるようになりました。 Index State Management を使ってルーチンタスクのカスタム管理ポリシーを定義し、それらをインデックスおよびインデックスパターンに適用できます。各ポ
nakaearth 2020/03/27
elasticsearch

amazon
リンク
Elasticsearchのクエリ変更による影響度をオフライン評価する - Taste of Tech Topics
概要こんにちは、shin0higuchiです😊 この記事はElastic Stack (Elasticsearch) Advent Calendar 2019 - Qiitaの20日目です。皆さんはElasticsearchの検索クエリのランキングをチューニングする際、どのようなプロセスで実施していますか？変更したクエリを最初からABテストにかけるのではなく、オフライン評価をおこなうことが多いのではないでしょうか？今回はElasticsearchクエリを変更した時の、検索結果（ランキング）への影響度をオフライン評価する方法についてです。バージョン情報など Elasticsearch : 7.5.0 Python：3.8.0 下準備クエリ変更云々の前に、まずベースとなるデータを用意します。利用するのはwikipediaの日本語データです。 indexのmappingはシンプル
nakaearth 2019/12/21
elasticsearch

プログラミング

設計
リンク
Amazon Elasticsearch Service の認証・認可に関する面倒くさい仕様をなるべくわかりやすく説明する - 無印吉澤
はじめに最近、仕事で Amazon Elasticsearch Service（以下、Amazon ES）を本格的に使う機会があって、認証周りの仕様で苦労させられました。 Elasticsearch を本格的に使う人は、自分で Elasticsearch クラスタを立てたり、Elastic Cloud を使ったりしてしまうからか、Amazon ES 周りの情報は意外と見つかりませんでした。せっかくなので、今回の記事では、自分が Amazon ES を使うにあたって調べた情報をまとめてみます。はじめにいろいろな Elasticsearch Amazon ES の基本 Amazon ES が提供する認証・認可パブリックアクセスの場合 VPC アクセスの場合 IP アドレス以外の認証・認可方法は AWS 署名しかない Elasticsearch API へのリクエストを AWS 署名する
nakaearth 2019/12/09
elasticsearch

amazon

セキュリティ

api

aws
リンク
GiNZA+Elasticsearchで係り受け検索の第一歩 - Taste of Tech Topics
急に冷え込んできてお布団が恋しい季節になってきました。こんにちは。@Ssk1029Takashiです。この記事は自然言語処理 Advent Calendarの6日目の記事になります。 qiita.com 全文検索システムは単語検索であることが多いですが、単語検索だけだと困ることもあります症例検索を例にとって見てみましょう。検索エンジンに以下の2つの文章が登録されているとします。「ずっと胃がキリキリと痛い。ただ、熱は無く平熱のままだ。」「昨日からとても頭が痛い。おまけに胃がむかむかする。」この時、「胃が痛い」と検索したとき、通常の単語検索の場合だと両方ともヒットしてしまいますが、下の文章は意味としては異なる文章のためゴミになります。この記事では、GiNZAとElasticsearchを使って意味的に正しい上の文章だけを拾ってくる仕組みを簡単に実現してみようと思います。どうや
nakaearth 2019/12/09
elasticsearch

検索

解析

nlp
リンク
サービス特性にあった検索システムの設計戦略 - クックパッド開発者ブログ
こんにちは！研究開発部ソフトウェアエンジニアの林田千瑛(@chie8842)です。あまりたくさん飲めないけど日本酒が好きです。クックパッドが提供するサービスの検索や推薦機能の構築・改善を行っています。本稿では、クックパッド本体の検索改善や推薦システム構築の傍らで、新規サービスであるクックパッドマート向けの検索システムをつくったので、その際の設計や精度改善の工夫について書きます。新規サービスクックパッドマートと検索クックパッドマートは、生鮮食品に特化したECサービスで、ステーションと呼ばれる場所に購入した食品を届けてくれるという特徴をもっています。2018年夏にサービス開始して以来順調にユーザ数を伸ばしています。中でも商品検索機能は、クックパッドマートの追加機能として9月にリリースしました。検索システムの要件プロダクトチームの当初の要件は以下のとおりでした。まずは 1ヶ月でリ
nakaearth 2019/11/18
elasticsearch

チューニング

設計
リンク
Elasticsearch + Sudachi + Docker でユーザー辞書を作ってみるハンズオン - Qiita
今回は Elasticsearch + Sudachi でユーザー辞書を使う Dockerfile を作ったので作り方を共有します。 Elasticsearchのバージョンは現行の最新(v7.4.0)ですがv6.8あたりでも動くことを確認済みです。 Sudachi とは Sudachi は日本語形態素解析器です。株式会社ワークスアプリケーションズ下の機関であるワークス徳島人工知能 NLP研究所が開発しています。複数の分割単位をサポートしているなどの特徴があります。ドキュメントはこちら https://github.com/WorksApplications/Sudachi/#sudachi-%E6%97%A5%E6%9C%AC%E8%AA%9Ereadme 今回のハンズオンの最終構成最終的に下記のような構成を目指します。 . ├── docker-compose.yml └── elas
nakaearth 2019/10/19
elasticsearch

docker

Dockerfile
リンク
Lucene #Kuromoji のコードを読む会（辞書ビルダー編） - Speaker Deck
Transcript Lucene Kuromoji のコードを読む会（辞書ビルダー編） 2019/10/3 @moco_beta 自己紹介  打田智子  twitter : @moco_beta  所属 : 株式会社 LegalForce R&D チーム / ソフトウェアエンジニア  検索システムに興味があります  趣味でOSS開発をしています  Janome https://github.com/mocobeta/janome  Apache Lucene committer () 趣旨など主催者 (@moco_beta) が Lucene / Kuromoji のソースコード（辞書周り）を読むうえで，調べたことをまとめておきたい素のままで触る機会は少ないかもしれないけれど， Lucene のコードを読んでみるのも楽しいよ！というのを伝えたい仕事ではブラック
nakaearth 2019/10/17
コード

Lucene

elasticsearch

あとで読む

nlp
リンク
Elasticsearchを用いて類似度ベクトル検索をやってみてわかったこと
2019年7月31日、検索技術研究会が主催するイベント「Search Engineering Tech Talk 2019 Summer」が開催されました。「検索」や「検索システム」にまつわる技術や手法を共有する本イベント。第3回となる今回は、3人のエンジニアが、現場の経験を通して学んだノウハウや、検索にまつわる知見を語ります。プレゼンテーション「Elasticsearch における類似度ベクトル検索のベストプラクティスを求めて」に登壇したのは、伊藤敬彦氏。講演資料はこちら Elasticserchにおける類似度ベクトル検索のベストプラクティスを求めて伊藤敬彦（@takahi_i）氏（以下、伊藤）：「Elasticserchにおける類似度ベクトル検索のベストプラクティスを求めて」ということで、いろいろ調査をしてみましてとりあえずまとめてみましたというお話です。シュッとやると最初は書
nakaearth 2019/10/14
elasticsearch

ベクトル

検索
リンク
技術書典7でElasticsearch本を販売します！ - Taste of Tech Topics
皆さんこんにちは @tereka114です。 9/22（日）に、待ちに待った技術書典7が開催されます。この技術書典7に当社の有志で出展します。出展場所は「い50C」です。 techbookfest.org 昨年（2018年）の技術書典5で販売した「Elasticsearch NEXT STEP」に引き続き、「Elasticsearch NEXT STEP2」を販売します。 Elasticsearchを使ってみた方が入門レベルから次のステップ（Next Step）へ進むための本として、執筆しました。 Elasticsearch は検索機能もさることながら、Elastic APM のように運用で必要となる機能も強化されています。また、Kibana は従来までのシンプルな可視化に加え、Canvas を用いて柔軟な可視化ができるようになりました。本書には、進化した Elastic
nakaearth 2019/10/10
elasticsearch
リンク
ElasticsearchとBERTを組み合わせて類似文書検索 - Ahogrammer
本記事ではElasticsearchとBERTを組み合わせて類似文書検索を行う方法について紹介します。Elasticsearchでは最近、ベクトルに対する類似文書検索の機能が実装されました。一方、BERTを使うことでテキストを固定長のベクトルに変換することができます。つまり、BERTを使ってテキストをベクトルに変換すれば、Elasticsearchを使って類似文書検索ができるということになります。本記事では以下のアーキテクチャでElasticsearchとBERTを組み合わせた検索システムを実現します。Dockerを使ってアプリケーション、BERT、Elasticsearchのコンテナを分けることでそれぞれをスケールしやすくする狙いがあります。記事中では重要な部分のみ提示しますが、システム全体はdocker-composeのファイルとして記述しこちらのリポジトリに置いてるので、参照してく
nakaearth 2019/09/30
elasticsearch

検索

ベクトル
リンク
Kuromoji FST
Search at Twitter: Presented by Michael Busch, TwitterLucidworks
nakaearth 2019/09/22
C

elasticsearch

FST
リンク
日本語形態素解析エンジンKuromojiについて調べた - motacaplaのめう
はじめにとある事情(仕事)により、日本語の形態素解析エンジンKuromojiについて調べる必要があったので、ドキュメントとコードを読み込んだ。形態素解析とは、ものすごく簡単に言うと、文章をその構造や品詞に細かく分解することです。分解された単位をトークンと呼ぶ。(イメージとしては、単語や助詞がトークンとなりえる。) 形態素解析 - Wikipedia 特に、自然言語処理(NLP)なんかでは馴染みがあるのでは？(私は素人なので...) 形態素解析は、主に利用する辞書の精度(網羅率)に大きく依存する形になります。例えば「ほげふが」という文章を解析するとして、辞書に「ほげ」と「ふが」が存在している場合、["ほげ", "ふが"]と2つのトークンに分解することができる。(これをトークナイズと呼ぶ。) 同じく文章をトークンに分解する方法として、N-gramがあります。Nに数字が入るわけですが、例えば
nakaearth 2019/09/22
解析

elasticsearch
リンク
ElasticSearch + Kibana (7.2) を docker-copmose で秒殺起動する - らくがきちょう
ElascticSearch + Kibana の構成は鉄板ですが、毎回、ゼロからインストールのはやや手間です。そこで、今回は docker-compose を使って秒殺で ElasticSearch + Kibana 環境を構築する手順をメモしておきます。今回は CentOS 7.2 上に 7.2.0 の ElasticSearch / Kinaba を構築しました。尚、docker や docker-compose がインストールされていない場合は CentOS7 に Docker ＆ Docker Compose をインストールするの手順を参考にインストールしておきます。但し、docker-compose のバージョンは最新にしておくことをお勧めします。ディレクトリ構成最終的には以下のディレクトリ・ファイル構成を作ります。 # tree elasticsearch-ki
nakaearth 2019/07/22
elasticsearch

Kibana

docker

Dockerfile
リンク
KarateでElasticsearchの状態をチェックする - Taste of Tech Topics
こんにちは、Elastic Certified Engineerのshin0higuchiです😊 みなさん、Elasticsearchの正常性確認はどうしていますか？実際にサービスを運用するとなると、一口に「正常性確認」と言っても色々な観点でのチェックが必要です。システムの死活、リソースの状態、パフォーマンス、検索queryの妥当性などなど...... Monitoring＋Alertingで監視したり、その他の監視ツールやelasticのsupport-diagnosticsを使ったり、人によってはcurlコマンドで確認するシーンもあるのではないでしょうか？ただ、個人的には、観点が多いと色々なツールを組み合わせたチェックが必要になり、多少手間を感じていました。そこで、今回は上司に教えてもらったKarateというテスト自動化ツールが、Elasticsearchと相性が良さそうだっ
nakaearth 2019/07/08
elasticsearch

テスト

karate
リンク
「Elasticsearch NEXT STEP」を出版しました！ - Taste of Tech Topics
こんにちは、Elastic Certified Engineerの樋口(@shin0higuchi)です😊 本日、Acroquestの有志で執筆した「Elasticsearch NEXT STEP」が発売されました！ nextpublishing.jp この本は昨年10月に開催された技術書典5で頒布したものをベースに執筆しました。そのときに書いたブログはこちら。懐かしいですね。 acro-engineer.hatena blog.com Elasticsearchのインストールは簡単で手軽に使い始められますが、環境に考慮した設定や、データ分析などへの活用につまづく方を実務で見てきました。また、入門書レベルを越えた方に向けた情報が少ないと感じていました。そこで、入門書の次のSTEPに踏み出すための実用的な事例を集めた書籍を執筆しました。各章の内容を簡単にご紹介します。第1章　Ela
nakaearth 2019/07/06
elasticsearch

Tech
リンク
検索結果の品質向上 Elasticsearch入門
2019年度リクルート新人ブートキャンプエンジニアコースの講義資料です
nakaearth 2019/07/05
elasticsearch

検索

情報検索
リンク
join datatypeとnested datatypeの比較 - オウチーノ開発者ブログ
こんにちは、オウチーノの山本です。この記事はくふうカンパニー Advent Calendar 2018の17日目として書いています。はじめに以前の記事（漸進的なシステムリプレイス（STTMeetup システムリプレイスNight））内の資料でも触れているのですが、オウチーノでは物件の検索にElasticsearchを、Elasticsearchへの登録には、Embulkを使用しています。このElasticsearchに登録している物件の情報ですが、階層構造を持つ必要があるので、現在は Nested datatype を使用しています。 # Embulkのconfigから一部抜粋 estate: _all: enabled: false dynamic: false properties: estate_id: type: keyword traffics: type: neste
nakaearth 2019/05/29
[nested datatype]

elasticsearch
リンク
前のページ 1 2 3 4 5 次のページ