[B! Algorithm] nminoruのブックマーク

数理最適化と機械学習を比較してみる - めもめも

数理最適化 Advent Calendar 2022 の記事です。何の話かと言うと Pythonではじめる数理最適化 ―ケーススタディでモデリングのスキルを身につけよう― 作者:岩永二郎,石原響太,西村直樹,田中一樹オーム社Amazon 上記の書籍の第7章では、次のような問題を取り扱っています。細かい点は書籍に譲りますが、まず、生データとして次のようなデータが与えられます。これは、あるショッピングサイトの利用履歴を集計して得られたもので、あるユーザーが同じ商品を閲覧した回数（freq）と、その商品を最後に閲覧したのが何日前か（rcen）の2つの値から、そのユーザーが次にサイトにやってきた時に、再度、その商品を閲覧する確率（prob）を実績ベースで計算したものです。実績ベースのデータなので、ガタガタしたグラフになっていますが、理論的には、・freq が大きいほど prob は大きくな

nminoru 2022/12/19

AI
Algorithm

リンク

「量子」と組合せ最適化に関する怪しい言説 ―とある研究者の小言― - むしゃくしゃしてやった，今は反省している日記

最近，量子コンピュータの話題をニュースや新聞で見かけることが増えてきました．その中で気になってきたのが，組合せ最適化と量子コンピュータ（特に量子アニーリング）に関する怪しい言説．私自身は（古典コンピュータでの）組合せ最適化の研究をやってきて，量子コンピュータを研究しているわけではないのですが，さすがにこれはちょっと・・・と思う言説を何回か見かけてきました．最近の「量子」に対する過熱ぶりは凄まじいので，こういう怪しい言説が広まるのは困りものです．すでにTwitter上には，“組合せ最適化は今のコンピュータでは解けない”とか“でも量子なら一瞬で解ける”という勘違いをしてしまっている人が多数見られます*1．さすがに危機感を覚えてきたので，この場できちんと指摘しておくことにしました．今北産業(TL;DR) “古典コンピュータは組合せ最適化を解けない” → 古典コンピュータで組合せ最適化を解

nminoru 2021/07/04

リンク

サービス終了のお知らせ

サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

nminoru 2019/03/22

再帰SQLを使ったPostgreSQLでのグラフ探索のやり方。非常にためになるが、こんな世界は知りたくはなかった orz という感想が沸き上がる。

リンク

ニュースパスを支える関連記事推薦と近似近傍探索 - Gunosyデータ分析ブログ

こんにちは。メディアロジック分析部の米田 (@mathetake) です。今日はGunosy社とKDDI社が共同で運営するニュースパスというニュースアプリケーションで使われている関連記事推薦のアルゴリズムについて書きたいと思います。特に、約半年前に私が導入しKPIの改善に成功した新しいアルゴリズムと、そこでコアとなる近似近傍探索(Approximate Nearest Neighbor search)の技術について述べます。関連記事推薦とはこの記事で紹介する関連記事推薦とは、「特定のニュースに関連したニュースを推薦すること」です。より具体的には、特定の記事をクリックした後に記事閲覧画面を下にスクロールすると登場する「おすすめ記事」の枠に対して、関連したニュースを検索して表示することを指します: このような枠が設置されている事は一般的なアプリケーションにおいてごく自然ですが、推薦シ

nminoru 2018/10/01

Algorithm

リンク

確率的データ構造を使って巨大な集合を定数メモリで近似しよう

巨大な集合に対して、定数メモリ&定数時間で近似値を計算できる、確率的データ構造の紹介スライドです。本スライドは、株式会社エフ・コードの社内勉強会(2018/08/30)にて使用されたものです。

nminoru 2018/09/01

リンク

イライラ解消する　エレベーターのアルゴリズム - 日本経済新聞

アルゴリズムは「何らかの問題を解決する手順」を指し、アルゴリズムの良しあしでソフトウエアの性能が決まると言っても過言ではない。私たちの生活は、高度なアルゴリズムで実装されたソフトウエアに支えられている。エレベーターや信号機の制御ソフトを例に、身近なアルゴリズムの一端を見ていく。朝はいつもエレベーター前が大渋滞、ボタンを押してもなかなか来ない――。こんな経験は誰しもあるだろう。どうすればエレベー

nminoru 2018/07/30

「エレベーターのアルゴリズム」と「エレベーターアルゴリズム」の違いとは？

Algorithm

リンク

2016年のOSS圧縮ツール選択カタログ - Qiita

まだgzipで消耗し（略） 2016年、人類が待ち望んでいた、gzipを圧倒するOSS圧縮ツールzstd(Zstandard)がリリースされたにも関わらず、なんかあんまり話題になっていなくて寂しいので、ちょろいかんじの賑やかし比較記事を書きました。圧縮ツールのカタログ的に眺めていただけるかと思います。はじめに（この記事で言う）圧縮ツールとは何か圧縮ツールという呼び名は正確ではない（はず）です。平たく言えば、gzipやbzip2、xz、lz4などですが、人によっては、tarの裏側としてしか使ってなくて、聞いたこともないかもしれませんね。そういうときはまずgzipのmanpageとか読んでください。しかし、そういうツールを何と呼べばいいのかわからないので、ここでは圧縮ツールと呼んでいます。ややこしいですが、アーカイバではありません。アーカイブとは実態が一つのファイルになっているフォル

nminoru 2018/03/01

Algorithm

リンク

整数列圧縮アルゴリズムの最前線 - ny23の日記

ちょうど二年ぐらい前，機械学習で疎ベクトルの圧縮に情報検索でよく使われる整数列の圧縮技術を使うことを検討したことがあった（オンライン学習でキャッシュを実装してみた - ny23の日記）．そのときは，オンラインで圧縮し Disk に保存，圧縮したベクトルは陽にメモリに置かず読む（OS に任せる）という実装で，（Disk IO のオーバーヘッドが大きく）圧縮さえすれば何を使っても大差なしという身も蓋もない結論になった（結局2行で書ける最も単純な Variable byte code を採用）．それ以降は整数列圧縮アルゴリズムに関する知識も NewPFD ぐらいで止まっていたのだけど，つい先日，現時点で最速の圧縮アルゴリズムの提案＋ここ数年の主な整数列圧縮アルゴリズム（Simple-8b (J. Software Pract. Exper. 2010), VSEncoding (CIKM 20

nminoru 2017/10/06

Algorithm

リンク

Amazon Redshift データ型と列圧縮タイプのまとめ(データ型＆列圧縮タイプ対応表付) | DevelopersIO

Amazon Redshiftではテーブルを作成する際の要素として幾つかポイントがあります。1.と5.については一般的なRDBMSでも用いられるような概念ですね。残りの2〜4についてはRedshift特有の設定となります。当エントリではこの中の『データの型』と『列圧縮タイプ』について、その概要と、実践で使いやすい/調べやすい様に諸々個人で整理した情報などを併せて投下したいと思います。 1.データの型(data types) 2.列圧縮タイプ(column compression types) 3.分散キー(distkey) 4.ソートキー(sortkey) 5.制約(constraint) 目次データ型数値型文字型日付型ブール型列圧縮タイプ raw bytedict delta delta32k lzo mostly8 mostly16 mostly32 runlength t

nminoru 2017/10/06

Algorithm

リンク

整数列圧縮

感覚運動随伴性、予測符号化、そして自由エネルギー原理 (Sensory-Motor Contingency, Predictive Coding and ...

nminoru 2017/10/06

Algorithm

リンク

時系列データベースに関する基礎知識と時系列データの符号化方式について - クックパッド開発者ブログ

こんにちは。インフラストラクチャー部 SRE グループの吉川 ( @rrreeeyyy ) です。今期オススメのアニメはツインエンジェル BREAK です。普段の業務並びに趣味の一環として、サーバのモニタリング環境の調査や改善に取り組んでいます。そこで本稿では、モニタリングのコンポーネントの一つとして外すことが出来ない、時系列データベースの基礎知識に関して紹介します。そもそも時系列データ・時系列データベースとは？時系列データというのは、特定の時間ごとに何らかの値を取得した際の、取得した一連の値を指します。例えば、以下のようなフォーマットをしたデータなどは時系列データにあたるでしょう。 timestamp1,key,value1 timestamp2,key,value2 timestamp3,key,value3 : 時系列データベースとは、上記のような時系列データの保存・処理に

nminoru 2017/10/04

リンク

A Brief History of Chain Replication

QCon 2015

nminoru 2017/08/18

Chain replicationの系譜

Algorithm

リンク

The Papers: Christopher Meiklejohn's A Brief History of Chain Replication | Papers We Love

nminoru 2017/08/18

Algorithm

リンク

文法圧縮入門：超高速テキスト処理のためのデータ圧縮（NLP2014チュートリアル）

言語処理学会第２０回年次大会（2014/3）のチュートリアル講義資料です。 - 要旨 - 文法圧縮とは，入力テキストをよりコンパクトな文脈自由文法（CFG）に変換する圧縮法の総称である．文法圧縮の強みは圧縮テキストを展開すること無く，検索等のテキスト処理を効率よく行える点にある．驚くべきことにその処理速度は，元テキスト上での同じ処理を理論的に，時には実際にも凌駕する．また近年，ウェブアーカイブやログ，ゲノム配列等の大規模実データを高効率に圧縮できることで注目を集めている．しかしながら，文法圧縮についての初学者向けの解説資料はまだまだ少ない．そこで本チュートリアルでは，文法圧縮の歴史的背景から最新動向までを幅広く紹介する．具体的には文法変換アルゴリズム，圧縮テキスト上での文字列パターン検索，文法圧縮に基づく省メモリデータ構造等の解説を行う．

nminoru 2017/07/22

Algorithm

リンク

Maglev: A Fast and Reliable Software Network Load Balancer – Google AI

Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more

nminoru 2017/07/05

リンク

Maglev Hashing with Python - yunazuno.log

今更ながら，GoogleのMaglev論文で提案されているMaglev Hashingを手元で実装してみた． Maglev: A Fast and Reliable Software Network Load Balancer Maglev Hashingとは所謂Consitent Hashの一種．Maglevロードバランサにおけるリアルサーバ選択に使用されている．上記論文のSection 3.4で詳細が説明されている．NSDI'16での発表スライドも併せて眺めると分かりやすい． Maglev: A Fast and Reliable Software Network Load Balancer | USENIX Slide: https://www.usenix.org/sites/default/files/conference/protected-files/nsdi16_sli

nminoru 2017/07/05

Algorithm

リンク

Interesting data structures: the BK-tree

A BK-tree is a tree data structure specialized to index data in a metric space. A metric space is essentially a set of objects which we equip with a distance function $d(a, b)$ for every pair of elements $(a, b)$. This distance function must satisfy a set of axioms in order to ensure it’s well-behaved. The exact reason why this is required will be explained in the “Search” paragraph below. The BK-

nminoru 2017/06/24

Algorithm

リンク

はてなブックマーク

タグ

関連タグで絞り込む (34)

Algorithmに関するnminoruのブックマーク (113)

お知らせ

今週のはてなブックマーク数ランキング（2025年11月第5週）

今週のはてなブックマーク数ランキング（2025年11月第4週）

はてなブックマーク一部機能のメンテナンスに関するお知らせ

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス