[B! algorithm] kiririmodeのブックマーク

カルマンフィルタの考え方 | Logics of Blue

カルマンフィルタは、状態空間モデルにおいて、内部の見えない「状態」を効率的に推定するための計算手法です。カルマンフィルタを理解するためには、まず状態空間モデルが何なのかを理解することが必要です。そのうえでカルマンフィルタの考え方と計算方法を学びます。この記事では、状態空間モデルもカルマンフィルタもあまり詳しくないという方を対象として、カルマンフィルタの考え方とライブラリを使わない実装方法について説明します。最後に、R言語における有名なカルマンフィルタの計算パッケージである「dlmパッケージ」の簡単な使い方も解説します。ソースコードはまとめてこちらに載せてあります。ブログの内容が本になりました。書籍サポートページはこちらですスポンサードリンク目次状態空間モデルの概要状態空間モデルとカルマンフィルタの関係カルマンフィルタの考え方ライブラリを使わないカルマンフィルタの実装

kiririmode 2025/05/05

状態空間モデルのカルマンフィルタに関するわかりやすい説明

リンク

OpenSearch における 10 億規模のユースケースに適した k-NN アルゴリズムの選定 | Amazon Web Services

Amazon Web Services ブログ OpenSearch における 10 億規模のユースケースに適した k-NN アルゴリズムの選定この記事は、Choose the k-NN algorithm for your billion-scale use case with OpenSearch を翻訳したものです。自然言語処理 (NLP) システムや、レコメンドエンジン、または検索システムなどの機械学習 (ML) アプリケーションを構築しようとすると、ワークフローのどこかで k 最近傍 (k-NN) 検索アルゴリズムを使用することがよくあります。データポイントの数が数億や数十億に達すると、k-NN 検索システムのスケーリングが大きな課題となります。近似最近傍 (ANN) 検索アルゴリズムは、この課題を解決するための優れた方法の 1 つです。 k-NN は、他の ML の技術と比

kiririmode 2024/09/07

近似最近傍検索に関するHNSW、IVF+PQの説明と比較。IVFはベクトルをクラスタリングしてクラスタ内のサブセットを検索。PQはベクトルを量子化することで情報量を削減

リンク

Hierarchical Navigable Small Worlds (HNSW) | Pinecone

Hierarchical Navigable Small World (HNSW) graphs are among the top-performing indexes for vector similarity search[1]. HNSW is a hugely popular techno logy that time and time again produces state-of-the-art performance with super fast search speeds and fantastic recall. Yet despite being a popular and robust algorithm for approximate nearest neighbors (ANN) searches, understanding how it works is f

kiririmode 2024/09/07

ベクトルの近傍検索で用いられるHNSWの構築/検索アルゴリズム。Mやefsearch、efconstructionを大きくすればrecallは大きくなるが構築/検索時間やメモリ使用量がトレードオフ

リンク

https://arxiv.org/pdf/2212.10496

kiririmode 2023/11/12

HyDEの論文。HyDEでは、質問に対してLLMで仮想ドキュメントを生成した上で、その文書とナレッジベースとの関連を計算する形でretrievalを行う

リンク

RAGにおけるドキュメント検索精度向上について(概要編)

はじめまして。損害保険ジャパン株式会社 DX推進部の眞方です。普段はリードエンジニアとして、新しいサービスのアーキテクチャ検討からローンチまでの作業や、新規技術を用いたアプリのプロトタイプ実装などを行なっています。弊社では、LLM（Large Language Models）を活用したアプリケーションの開発を積極的に検討し、既に社内でいくつかのプロトタイプをローンチしています。本記事では、その最も一般的？なユースケースの一つとも言えるRAG（Retrieval Augmented Generative）の構築において、ドキュメント検索精度の向上にどのように取り組んだ内容の概要を紹介させていただきます。実際の詳細な手法および結果については、別記事（実践編）で解説予定です。はじめに RAGとは？この記事を読まれている方の中にはご存知の方も多いでしょうが、RAGとはRetrieval A

kiririmode 2023/11/12

RAGでのドキュメント検索精度を向上するためのさまざまな手法の紹介。対象ドキュメントをサマリしておいたり、質問の方を拡張したり(HyDE含む）、関連文書をre-rankingしたり。

リンク

BM25を数式から説明する - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに BM25は特に検索アルゴリズムに使われる自然言語処理の一つで、tf-idfの進化系である。具体的には単語の出現頻度に基づいて、文章の順位付けを行う。tf-idfとの違いはドキュメントが短いほど順位が高くつき、長いほど順位が低くつく傾向があるというところである。この記事では数式を紐どいて、BM25の性質を説明する。数式 BM25の数式についてまず説明する。$D$を文章全体の集合(以下全文章と呼ぶ)、$d$は文章であり$D$の要素、$q$を検索クエリ($q_i\in q$)とした時のBM25の数式は以下のようなものである。 $$

kiririmode 2023/11/12

単語の出現頻度に基づいて文章間の関連の強さをランクづけする

ai
algorithm

リンク

GitHub - erikbern/ann-benchmarks: Benchmarks of approximate nearest neighbor libraries in Python

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

kiririmode 2023/11/08

ベクトル検索のアルゴリズムANNのパフォーマンス比較

リンク

GeoTools で地球地図起源の海岸線データを単純化する　その３ - Relevant, Timely, and Accurate

d:id:hfu:20071211, d:id:hfu:20071212 の続きとして、ポリゴンの単純化を実際にやってみました。 geotools.rb の改変 geotools.rb を改変し、ポリゴンの単純化に必要なクラスを取り込むようにしました。このエントリのスクリプトを実行するには、http://svg mapdata.sakura.ne.jp/geotools/ にある geotools.rb (Time-stamp: <2007-12-13 05 : 47 : 35 hfu> 以降)を使ってください。ポリゴンの単純化に必要なクラスとはポリゴンの単純化をしてくれるクラスには以下の２つがあります： com.vividsolutions.jts.simplify.DouglasPeuckerSimplifier 地図学的なベクトルデータの単純化アルゴリズムとしては古典的であるらしい

kiririmode 2023/06/03

Douglas-Peuckerアルゴリズムで頂点数を減らした例。良質な結果

リンク

Simplify — GeoTools 33-SNAPSHOT User Guide

kiririmode 2023/06/03

Douglas-PeuckerアルゴリズムはGeoToolsライブラリで実装されている

リンク

ラインの単純化

kiririmode 2023/06/03

車両軌跡データの点データが多い場合、重要でない点データを省略するアルゴリズムとしてDouglas-Peukerアルゴリズムがある。実装も難しくはなさそう

リンク

https://www.ibm.com/downloads/cas/DLPX0P1V

kiririmode 2023/04/24

3次元空間においてコンテナの積み方の最適化問題を現実時間で解くアルゴリズムの論文

or
algorithm

リンク

ビンパッキング問題の解き方 - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

kiririmode 2023/04/24

箱のサイズが交換可能な場合はアルゴリズムの効率が落ちる。

or
algorithm

リンク

パッキング問題 | opt100

kiririmode 2023/04/24

瓶のサイズを可変とする問題は、変動サイズベクトルパッキング問題(variable size vector packing problem)と言われる

or
algorithm

リンク

ビンパッキング問題 - Wikipedia

ビンパッキング問題（ビンパッキングもんだい）とは、離散数学の組合せ論の中のNP困難問題で、与えられた「荷物（重さや個数がついている）」をつめる「箱（ビンやコンテナなど）」の最小数を見つけるものである。問題を解くためにビン型（筒状型）の模型を使うのでこのように呼ばれる。様々な解決方法（アルゴリズム）が考案されているが、あらゆる場合の箱の最小数を効率的に見つけることができるような万能なアルゴリズムはない（NP困難問題）。ゲイリー、ジョンソンによる著書『Computers and Intractability（英語版）』で記述されているビンパッキング問題の定義を以下で説明する[1]:226。入力：有限個のアイテム集合、およびアイテムごとのサイズ、および容量をもつビンおよび正の値をとるが与えられる。問い：集合を素集合に分割して、それぞれの部分集合に含まれるアイテムのサイズの

kiririmode 2023/04/24

ビンパッキング問題はNP困難

or
algorithm

リンク

A* - Wikipedia

A*探索アルゴリズム A*（A-star、エースター）探索アルゴリズム（エースターたんさくアルゴリズム）は、グラフ探索アルゴリズムの一つ。最良優先探索を拡張したZ*に、さらにf値として「現時点までの距離」g と「ゴールまでの推定値」h の和を採用したもの[1]。h はヒューリスティック関数と呼ばれる。 A* アルゴリズムは、「グラフ上でスタートからゴールまでの道を見つける」というグラフ探索問題において、ヒューリスティック関数 h(n) という探索の道標となる関数を用いて探索を行うアルゴリズムである。h は各頂点 n からゴールまでの距離のある妥当な推定値を返す関数で、解くグラフ探索問題の種類に応じてさまざまな h を設計することが出来る。例えば、カーナビなどで用いられる単純な二次元の地図での探索では、h としてユークリッド距離を使うことができ、この値は道に沿った実際の距離のおおまかな予

kiririmode 2023/04/16

A*

algorithm

リンク

「量子」と組合せ最適化に関する怪しい言説 ―とある研究者の小言― - むしゃくしゃしてやった，今は反省している日記

最近，量子コンピュータの話題をニュースや新聞で見かけることが増えてきました．その中で気になってきたのが，組合せ最適化と量子コンピュータ（特に量子アニーリング）に関する怪しい言説．私自身は（古典コンピュータでの）組合せ最適化の研究をやってきて，量子コンピュータを研究しているわけではないのですが，さすがにこれはちょっと・・・と思う言説を何回か見かけてきました．最近の「量子」に対する過熱ぶりは凄まじいので，こういう怪しい言説が広まるのは困りものです．すでにTwitter上には，“組合せ最適化は今のコンピュータでは解けない”とか“でも量子なら一瞬で解ける”という勘違いをしてしまっている人が多数見られます*1．さすがに危機感を覚えてきたので，この場できちんと指摘しておくことにしました．今北産業(TL;DR) “古典コンピュータは組合せ最適化を解けない” → 古典コンピュータで組合せ最適化を解

kiririmode 2021/08/14

量子アニーリングは厳密解を求めるわけではなくヒューリスティック、有用だが現時点では適用範囲は限られる。TSPでは従来アルゴリズムの方が適用範囲が広そう

リンク

H.264の秘密 | POSTD

(編注：2020/08/18、いただいたフィードバックをもとに記事を修正いたしました。) (2016/12/11、いただきましたフィードバックをもとに翻訳を修正いたしました。) H.264は、動画圧縮コーデックの標準規格です。ネット上の動画、Blu-ray、スマホ、セキュリティカメラ、ドローンなどなど、今やあらゆるところでH.264が使われています。 H.264は注目すべき技術のひとつです。たったひとつの目標、つまりフルモーションビデオの送信に要するネットワーク帯域を削減することを目指した30年以上の努力の結晶なのです。技術的な面でも、H.264はとても興味深い規格です。この記事では、その一部について概要レベルでの知識を得られることでしょう。あまり複雑だと感じさせないようにするつもりです。今回おはなしする概念の多くは動画圧縮全般にあてはまるものであり、H.264に限ったものではありません

kiririmode 2017/10/08

リンク

ブロックアルゴリズムとB-Treeアルゴリズム

後で説明するが、ext2ではブロックグループ0の「スーパーブロック」に、パーティション内のブロックグループ全体の管理情報が格納される。スーパーブロックには、 iノードの総数ブロックサイズファイルシステムのサイズ空きブロック数、空きiノード数使用されているブロックグループ最終fsck時刻など、ファイルシステムに関するさまざまな情報が含まれている。「グループディスクリプタ」は、「データブロックビットマップ」や「iノードビットマップ」情報などを参照して空きブロックや空きiノードを探し、データを割り当てる際に最適なブロックを決定するのに使われる。「データブロックビットマップ」と「iノードビットマップ」は、ビットマップ情報である。ビットマップ情報は、あるデータが使用中か未使用かを0か1のbitで保持している。1byte＝8bitsなので、80個のブロックの状態を10bytesで管理で

kiririmode 2010/04/18

リンク

横着プログラミング第6回: chatty: 小うるさい端末

最終更新日: 2002-09-18 (公開日: 2002-09-18) Unix Magazine 誌に 2002年1月号から 2003年2月号にかけて連載していた記事の元の原稿です。才気に富んだことは個人が行うのが通例であり、信じがたきバカさ加減は大抵組織に帰されるものである。 -- Jon Bentley *1 役に立たないソフトウェアを作るのが好きだ。面倒な作業を楽にする横着ソフトウェアもいいが、たまには人を呆れさせるくだらないソフトウェアを作るのも楽しい。以前に私が開発した cdbiff*2というソフトウェアは、メールが届くと PC の CD-ROMドライブが開いてメールの到着を通知するという役に立たないものであったが、そのくだらなさが受けて予想外の好評を得た。今回は、そうした役に立たないソフトウェアの 1つである、小うるさい端末 chatty*3 を紹介する。

kiririmode 2008/10/05

TRIE

リンク

Spaghetti Source - 各種アルゴリズムの C++ による実装

ACM/ICPC（プログラミングコンテスト）系列の問題を解くことを目標にして，各種アルゴリズムを C++ で実装してみた．極めて意地が悪い類の問題には対応していないし，特定の入力に対して高速に動くということもない．計算量も最良とは限らない．これらを参考にする方への注意とお願い：これらの記述は正確とは限りません．参考文献を参照することを強く推奨します．間違っている場合は是非教えてください．これらのプログラムは間違っているかもしれません．各人で検証することを強く推奨します．バグがあれば是非教えてください．分類が怪しいので，これはこっちだろう，ということがあればコメントを下さると助かります．注意！現在書き換え中 TODO 分類を正しく行う．全体的に説明と使い方を詳しく． Verify していないものを Verify．ボロノイ図（いつになることやら……）基本テンプレートグラフ

kiririmode 2008/08/15

リンク

はてなブックマーク

タグ

関連タグで絞り込む (24)

algorithmに関するkiririmodeのブックマーク (28)

お知らせ

はてなブックマーク一部機能のメンテナンスに関するお知らせ

今週のはてなブックマーク数ランキング（2025年11月第3週）

今週のはてなブックマーク数ランキング（2025年11月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス