[B! algorithm] ymym3412のブックマーク

因果推論で検索システムを問い直す(2) - Counterfactualを知りたい

はじめにランキング学習のシリーズ記事の第二弾です*1. 前回の記事ではUnbiased Learning-to-Rankと呼ばれる, clickというimplicit feedbackを用いて relevanceに対して最適なスコアリング関数を学習するための損失関数を設計する方法について議論しました. その中で紹介したのがexamination parameter の逆数によって損失を重み付けするInverse Propensity Weighting (IPW)と呼ばれる方法でした. IPWはclickデータのみから真の損失関数を不偏推定することができるという嬉しさがあった反面, 肝心のexamination parameterの推定方法に関しては Result Randomizationの紹介のみに留まっていました. 本記事では, ユーザー体験を著しく害したり, KPIに大きな打撃を

ymym3412 2019/06/17

リンク

典型的な DP (動的計画法) のパターンを整理 Part 1 ～ナップサック DP 編～ - Qiita

はじめに --- DP は役に立つはじめまして。NTTデータ数理システムでアルゴリズムを探求している大槻 (通称、けんちょん) です。好きなアルゴリズムは最小カットやマッチングですが、会社ではなぜか「DP が好きな人」と呼ばれています。巷ではよく「DP なんて実務では使わない」といった言説が定期的に流れますが、そんなことはないです。僕自身この 2 年間で DP が使える実務案件に 3 件くらい関わりました！それはともかくとして、DP を学び立ての方がよく抱く悩みとして「バリエーションが多すぎて混乱するし、統一的なフレームワークがほしい」というのがあります。確かに DP のバリエーションは非常に多岐にわたるのですが、そのほとんどが以下の 3 つのフレームワークで説明できると思います: ナップサック DP 区間 DP bit DP 今回はこのうちのナップサック DP について、とにかく

ymym3412 2019/02/20

リンク

MARISA-TrieをコマンドラインとPythonから使う

概要 Matching Algorithm with Recursively Implemented StorAge (MARISA) という Trie に対する高い空間効率とそれなりの時間効率を実現するデータ構造があります。動的な更新には対応していませんが辞書引き（Lookup） : 入力文字列が登録されているかどうかを確認逆引き（Reverse Lookup） : 入力された ID から登録文字列を復元 Common Prefix Search : 入力文字列の前半部分に一致する登録文字列を検索 Predictive Search : 入力文字列で始まる登録文字列を検索といった操作が可能です。今回は marisa-trie 0.2.4 をベースにコマンドラインプログラム Python バインディングから MARISA を触ってみます。 Install MARISA 環境は

ymym3412 2018/12/24

pythonからtrie木を触る

リンク

Diverse Beam Search: Decoding Diverse Solutions from Neural Sequence Models

Neural sequence models are widely used to model time-series data. Equally ubiquitous is the usage of beam search (BS) as an approximate inference algorithm to decode output sequences from these models. BS explores the search space in a greedy left-right fashion retaining only the top-B candidates - resulting in sequences that differ only slightly from each other. Producing lists of nearly identica

ymym3412 2018/10/02

リンク

How to visualize decision trees

1 How to visualize decision trees Terence Parr and Prince Grover (Terence is a tech lead at Google and ex-Professor of computer/data science in University of San Francisco's MS in Data Science program and Prince is an alumnus. You might know Terence as the creator of the ANTLR parser generator.) Please send comments, suggestions, or fixes to Terence. Update July 2020 Tudor Lapusan has become a maj

ymym3412 2018/09/28

リンク

New benchmarks for approximate nearest neighbors

New benchmarks for approximate nearest neighbors 2018-02-15 UPDATE(2018-06-17): There are is a later blog post with newer benchmarks! One of my super nerdy interests include approximate algorithms for nearest neighbors in high-dimensional spaces. The probl em is simple. You have say 1M points in some high-dimensional space. Now given a query point, can you find the nearest points out of the 1M set?

ymym3412 2018/06/03

リンク

バージョンの充足可能性問題 | POSTD

(注：2017/02/06、いただいたフィードバックを元に翻訳を修正いたしました。修正内容については、こちらを参照ください。) Dependency HellはNP完全ですが、この状況から脱却できるかもしれません。パッケージにおけるバージョン選択の問題とは、完全である（全ての依存関係を満たしている）かつ互換性のある（互換性のない2つのパッケージが選択されていない）トップレベルパッケージPをビルドするために使われる依存関係の集合を見つけることです。ただし、菱形依存問題があるので、このようなセットは存在しない可能性があります。菱形依存問題とは、AはBとCが必要、BはDのバージョン2ではなくバージョン1が必要、CはDのバージョン1ではなくバージョン2が必要といったような問題のことです。この場合、Dの両方のバージョンを選択することはできないため、Aをビルドすることができないわけです。パッケ

ymym3412 2017/02/02

algorithm

リンク

「一様乱数の平均値を正規乱数として代用する」という話をゆるふわ統計的に検証する

「一様乱数を足し合わせて平均値をとった値は正規分布っぽくなるよ」というツイートを見かけて、「それって統計的にどうなんだろう？」という疑問が湧いたので検証してみました。はじめにPermalink 昨日・一昨日ぐらいに Twitter 上でちょっとした話題になっていたアニメーションの監修で、「 Random();の代わりに、(Random()+Random()+Rrandom()+Random()+Random())/5.0f; を使うと、動きにコクが出る」と言ったら、ピュアオーディオ扱いされるのですが・・・これは根拠のあるアルゴです。 — 深津貴之 (@fladdict) 2016年11月3日というツイートに関連して、「一様乱数の平均値を正規乱数として代用する」的なツイートをちらほら見かけて気になっていたので、統計的に検証してみましたよ、というブログエントリです (このツイート自体に

ymym3412 2016/11/06

リンク

はてなブックマーク

タグ

関連タグで絞り込む (10)

algorithmに関するymym3412のブックマーク (8)

お知らせ

今週のはてなブックマーク数ランキング（2025年12月第1週）

月間はてなブックマーク数ランキング（2025年11月）

今週のはてなブックマーク数ランキング（2025年11月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス