[B! Elasticsearch] dmizuno55のブックマーク

Smooth mocking with the Elasticsearch Node.js client

dmizuno55 2022/07/23

Elasticsearch

リンク

Keeping Elasticsearch in sync with MongoDB using Change Streams - Kowshik Sundararajan

dmizuno55 2022/07/03

リンク

Manage licenses in ECK | Elastic Cloud on Kubernetes [2.12] | Elastic

dmizuno55 2022/07/02

リンク

Create automated snapshots | Elastic Cloud on Kubernetes [2.12] | Elastic

dmizuno55 2022/07/02

リンク

Elastic Cloud on Kubernetes (ECK)の仕組みと各構成変更における挙動について - Qiita

本記事はZOZOテクノロジーズアドベントカレンダー#2の17日目の記事です。 TL;DR; ECK動作確認環境構築手順 ECKの仕組み各構成・設定変更における挙動解説動作確認環境の構築本記事の解説で使う環境構築方法を簡単に解説します。なお、Kubernetes環境としてはAmazon Elastic Kubernetes Service（以下、EKS）を利用してますが、EKSセットアップとk8sクラスタ操作必要なkubectl等の設定手順については省略します。また、既にk8sクラスタに接続できる状態になっていることを前提とします。環境クライアントOS: macOS Kubernetes versions: client: v1.19.4 server: v1.18.9 ECK: 1.3 セットアップ既に下記のようにkubectlコマンドでk8sクラスタにアクセスできる状態にな

dmizuno55 2022/07/02

リンク

MongoDB × Elasticsearch × Monstache での部分一致検索

こんにちは。tech blog 編集長の N です。今回はポケコロツインの1月中旬頃のアップデートで、「ココロノート」に新たに導入された部分一致検索についてご紹介いたします。ポケコロツインとはポケコロツインは「世界一かわいいをつくれるデザイナー」がプロデュースしたふたご着せ替えアプリです。『ポケコロツイン』は二人のアバター「ココロン」を着せかえたり、二人の動きに癒やされたり・・・。CCPサービスの一つとして、これまで以上にアバターの可愛らしい動きや、表情、世界の表現にこだわりました。ココロノートとその問題点ココロノートとは、自分が思ったことを自由に投稿できる、ポケコロツイン内での交流の場（いわゆる掲示板）です。投稿の公開範囲を自分のみ・フレンドまで・全体から選ぶことができます。従来のココロノートの検索機能では、前方一致検索しか実装されていませんでした。例えば、ペットを

dmizuno55 2022/06/22

mongodb

リンク

How to implement Japanese full-text search in Elasticsearch

全文検索は一般的に知られていますが、検索エクスペリエンスで非常に重要な役割を果たしています。ただし、日本語など、一部の言語では、全文検索を実装するのが難しい場合があります。このブログでは、日本語で全文検索を実装する際の課題を探り、Elasticsearchでこれらの課題を解決する方法をいくつか示します。全文検索とは？ Wikipediaより、下記が定義となります。全文検索とは、コンピュータにおいて、複数の文書（ファイル）から特定の文字列を検索すること。「ファイル名検索」や「単一ファイル内の文字列検索」と異なり、「複数文書にまたがって、文書に含まれる全文を対象とした検索」という意味で使用される。全文検索は、現在多くのデジタル体験を強化するものです。全文検索は、データセット内に隠れている可能性のある単語やフレーズを見つけようとしてくれます。例えば、ネットショッピングして「phone」を検

dmizuno55 2021/02/28

リンク

第２回 Elasticsearch 入門データスキーマ設計のいろは | DevelopersIO

第2回目の Elasticsearch 入門は「データスキーマ設計のいろは」です。設計と言うほどでもないのですが、例えば RDB で検索にフォーカスした設計や、他の検索エンジンも経験していると、これまでの制限や習慣で Elasticsearch の特徴を生かせない設計をしてしまう事があるので、このテーマにしてみました。それではインデックスするためのデータ構造を Elasticsearch でどのように設計するのか解説したいと思います。設計フローまで変えてしまう画期的なドキュメント指向型検索エンジン Elastic 社のホームページを見てみると Elasticsearch の特徴の１つとして「Document-Oriented」と言う記載があります。直訳すると「ドキュメント指向」です。簡単に説明すると現実世界の複雑なデータをJSONドキュメントにしてインデックスするだけで、デフォル

dmizuno55 2021/02/03

Elasticsearch

リンク

Elasticsearch on Kubernetes の本番運用方法 | Wantedly Engineer Blog

Elasticsearch はオープンソースの分散型検索分析エンジンです。いろんな形式のデータを保持することができ、複数のフィールドを指定した検索クエリが簡単に書けたり、文字数の多いデータでも高速に検索ができるといった特徴があります。これらの利点を活かして Wantedly でも検索機能や推薦機能の裏側で利用しています。この記事では Wantedly の本番環境で運用している Elasticsearch について構成と運用についてのノウハウを紹介します。背景Wantedly では Elasticsearch を Kubernetes 上で運用しています。以前は EC2 上で AutoScaling Group を利用して直接クラスタを構成し、内製ツール (https://github.com/dtan4/esnctl) によって管理していました。しかし、マイクロサービス化の推進によって

dmizuno55 2021/01/26

リンク

mongo-connectorでMongoDBからElasticsearchへリアルタイム同期 #mongodb - クリエーションライン株式会社

dmizuno55 2021/01/26

リンク

Elasticsearchを利用したレコメンドシステム | 株式会社CyberOwl

ドキュメントの登録、インデックスの作成、マッピングの定義、データの検索などは全てREST API形式のエンドポイントにjsonデータを渡すことで実行できます。インデックスを作成する際、日付形式などデータから推測できるものは自動でマッピングを定義してくれます。マッピングは自分で定義することもできます。フィールドの型以外に、言語解析の方法などが定義できます。機械学習に頼ることは正解なのか？レコメンドシステムを作る時、基本的に2つのアプローチが候補に上がります。コンテンツベースフィルタリング(内容ベースフィルタリング)と協調フィルタリングです。コンテンツベースフィルタリング特徴を持つ商品でA・B・Cがあり、ユーザがそれらに対し「好き/お気に入り」といった特徴が見られるとき、ユーザの好みや趣向の特徴と商品の特徴の類似度を元に、ユーザが好むであろう商品のリストを見つける事ができます。

dmizuno55 2021/01/26

Elasticsearch

リンク

Elasticsearch – Hello! Elasticsearch. – Medium

第４回 Elasticsearch 入門検索の基本中の基本今回は「検索の基本中の基本」について解説したいと思います。この Elasticsearch 入門シリーズは今回で４回目になりますが、検索エンジンなのにやっと検索の話です。 Elasticsearch の検索のパワーをフルに活用するには、以下の内容を理解する必要があります（検索や集計の精度を向上させるなど）。 Mapping: フィールドの型や分析方法の設定

dmizuno55 2020/12/19

Elasticsearch

リンク

データベースとしてのElasticsearch - Qiita

はじめに Elasticsearchはスケーラビリティに優れた全文検索エンジンですが、Relational Database(以下RDB)が持つ汎用性や機能の豊富さも追求しているように思います。この記事ではRDBの基本機能がどこまでElasticsearchで実現できるかをまとめました。データベースの知識だけで、全文検索を知らなかった私がElasticsearchを勉強し始めた頃に意外に感じた事を中心に両者の違いを比較しています。APIについては言語ごとの違いは言及せず、REST APIについてのみ述べています。特にバージョンの記述がない場合はElasticsearch 5.1を前提にしています。RDBは近年ポピュラーなOracle, SQLServer, DB2, Sybase, PostgreSQL, MySQLなどが準拠しているSQL92標準を前提としています。基本的な違い RDB

dmizuno55 2017/12/14

Elasticsearch

リンク

物理サーバを選定する際のポイント – Eureka Engineering – Medium

Eureka EngineeringLearn about Eureka’s engineering efforts, product developments and more.

dmizuno55 2017/06/26

Elasticsearch

リンク

Elasticsearch のノードで "too many open files" が出てしまったので対処したメモ - ようへいの日々精進XP

このロゴの色が好きです。経緯きっかけ試験運用開始後ヒープサイズ以外のトラブルに見舞われたことがなかった Elasticsearch ノードについにその日が来たのでメモ「すんません、kibana 落ちてます？」というお問い合わせ「こちらこそすんません、すぐに調べます」って調べたら... kibana のダッシュボードにはアクセス出来るけど Elasticsearch に繋がっていない模様エラーログ以下のようなログが出て Elasticsearch が止まっていた。 [2014-03-07 09:40:09,761][WARN ][netty.channel.socket.nio.AbstractNioSelector] Failed to accept a connection. java.io.IOException: Too many open files at sun.n

dmizuno55 2017/02/21

Elasticsearch

リンク

Elasticsearch導入前に気を付けておきたいこと！ - Qiita

はじめに Elasticsearchを仕事で使うことになったので導入前に考えるであろうことを調査・検証し、まとめてみました。記載されている内容はほぼ公式ドキュメントから引っ張ってきています。それぞれの章にリンクを付けてありますので、記載されていること以外に気になる部分があればそちらを参照されるとよいと思います。インストールについてここで設定している内容はすべてansibleのスクリプトに落としてあります。 5分あればcurl,javaのインストール、Elasticsearchのインストール・初期設定、プラグインのインストールが終わるはずです。 https://github.com/uzresk/ansible-elasticsearch2 環境 CentOS6.7 Java1.8.0_45 Elasticsearch 2.1.1 HeapSizeの設定 Elasticsearchが使

dmizuno55 2016/09/16

Elasticsearch

リンク

Elasticsearchインデクシングパフォーマンスのための考慮事項 - Qiita

マッピングタイプを使いすぎないようにする Elasticsearchでは１つのインデックスの中に複数の異なるスキーマ定義を持つことができる。このスキーマ定義をマッピングタイプという。単に「タイプ」と呼ばれる事もある。フィールドのデータタイプとは別の概念。インデックスはデータベースに、マッピングタイプはその中のテーブルに例えられる事が多いが、同じ名前のフィールドはマッピングタイプが異なっていても定義が共有されたりして、データベースのテーブルほど互いに独立していない中途半端なものになっている。（2.0より前のバージョンではタイプごとにフィールド定義が異なっていても多少使えたりしたが、2.0以降は厳密に禁止されるようになった. 参照：Conflicting field mappings）タイプが異なっていてもデータは同じLuceneインデックスの中に混ざって入ってしまうため、タイプ間で互いに影

dmizuno55 2016/09/16

Elasticsearch

リンク

知識ゼロからElasticsearchを実践で使えるようになろう！ - $shibayu36->blog;

以前少しだけElasticsearchを触った時に、自分流Elasticsearch入門 - $shibayu36->blog; というElasticsearchに入門した時のメモをまとめていた。しかし、その頃はElasticsearchを使って完全に一人で一つの機能を作るというところまではいけなかった。最近になってまたElasticsearchを一から導入する仕事をすることになった。この時以前自分がまとめた記事を読みながらやっていたのだが、実践で一から導入するためにはこの記事だけでは知識が足りなかった。そこで、前の記事の知識をベースに、一から導入するために少しずつ学んでいき、自分のブログにまとめるなどのことをしてきたので、今回はその締めくくりとして、知識ゼロからElasticsearchを使えるようになるために学習したことについて書いておきたいと思う。今回書くこと・書かないこと今

dmizuno55 2016/09/06

Elasticsearch

リンク

elasticsearchを全文検索サーバとして活用するなら読んでおきたい、6つのブログ記事をピックアップ（追記あり） - Y-Ken Studio

LuceneベースのNoSQL全文検索サーバ、elasticsearchはログ解析の収集先として取り上げられることが多いですが、優れたNoSQL全文検索サーバでもあります。日本でも2013年末頃から続々とブログ記事や利用事例が増えている注目の技術でもあります。今回は、その中で全文検索サーバとしての切り口で分かりやすく解説された6つの記事を紹介します。（追記）Hello! Elasticsearch. — Medium ナレッジワークス株式会社のKunihiko Kidoさんによるとても分かりやすい記事です。 https://medium.com/hello-elasticsearch 2014年4月に入ってから怒濤の勢いでこれらのステキな記事が追加されています。 Elasticsearch Features — 主にシステムを中心とした特徴まとめ Elasticsearch Quic

dmizuno55 2014/12/31

“https://medium.com/hello-elasticsearch”

Elasticsearch

リンク

Kuromojiで日本語全文検索 – AWSで始めるElasticSearch(1) | DevelopersIO

はじめに初めまして、ブロガーとして出張してきました@smokeymonkeyです。今回、AWS上にElasticSearchを導入し、試行錯誤した結果をまとめてみました。シリーズものとして何度か続けていきたいと思いますので、どうぞ宜しくお願い致します。 ElasticSearchとは Apache v2ライセンスで公開されているオープンソースソフトウェアであり、全文検索エンジンであるLuceneを使用した、全文検索システムです。特徴として RESTfulなAPIが使える InputもOutputもJSON スキーマフリーなので面倒な定義無しにデータを登録可能等があります。 Kuromojiとは Kuromojiはatilika社製のJavaで書かれた日本語形態素解析ソフトウェアで、Apache v2ライセンスで公開されているオープンソースソフトウェアです。形態素解析としてはChaSe

dmizuno55 2014/10/13

リンク

はてなブックマーク

タグ

関連タグで絞り込む (6)

Elasticsearchに関するdmizuno55のブックマーク (21)

お知らせ

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス