[B! algorithm][python] uokadaのブックマーク

uokada id:uokada

algorithmとpythonに関するuokadaのブックマーク (8)

Word2vec implementation in gensim
Explain word2vec implementation in gensim in Python and Cython.
uokada 2019/06/18
word2vec

python

algorithm
リンク
Python で Variable Byte Code を実装 - Bits of Log
よる年の瀬の最中、Web開発者のための大規模サービス技術入門という本を読んでる。ソーシャルゲームが流行っている昨今、大規模サービスの運用論や方法論について、少しは学んでおくか的なノリで読んでる。こいつは、株式会社はてなで行われたインターン実習が元になってて、負荷対策の基本等が分かりやすく実習形式で解説されてるオシャレな本だ。 OSのページキャッシュの仕組みとかデータの分散とか検索アルゴリズム等、もろもろ興味深いのだ。今回は、整数データをコンパクトに持つ為の圧縮技術VBCodeをPythonで実装してみたメモり。（本の中ではPerl）はてなのインターン生に混じった気分で、疑似コードを参考に実装してたら、なんだかんだ1時間ぐらいかかった。もっとさくっと組めたらいいのに。つっかかった点は以下2点。・Pythonにおけるバイトコードの取り扱い（pack, unpack）・128とい
uokada 2012/12/27
python

algorithm
リンク
Pythonの内包表記はなぜ速い？ : DSAS開発者の部屋
「エキスパートPythonプログラミング」の発売が、Amazonや一部の書店で始まりました。エキスパートPythonプログラミング著者：Tarek Ziade 販売元：アスキー・メディアワークス発売日：2010-05-28 クチコミを見る今回は、「エキスパートPythonプログラミング」の2章から、リスト内包表記について補足します。本書で、リスト内方表記が速い理由について、次のような訳注を書きました。訳注：リストに要素を append() する場合、インタプリタは「リストから append 属性を取り出してそれを関数として呼び出す」という処理をしなければなりません。それに対して、リスト内包表記を使うと、インタプリタに直接「リストに要素を追加する」という処理をさせることができます。インタプリタが解釈する命令数が減る、属性の取り出しが不要になる、関数呼び出しが不要になる、という3
uokada 2012/06/19
python

programming

algorithm

Performance

hacks
リンク
スペル修正プログラムはどう書くか
Peter Norvig / 青木靖訳先週、2人の友人(ディーンとビル)がそれぞれ別個にGoogleが極めて早く正確にスペル修正できるのには驚くばかりだと私に言った。たとえば speling のような語でGoogleを検索すると、0.1秒くらいで答えが返ってきて、もしかして: spelling じゃないかと言ってくる(YahooやMicrosoftのものにも同様の機能がある)。ディーンとビルが高い実績を持ったエンジニアであり数学者であることを思えば、スペル修正のような統計的言語処理についてもっと知っていて良さそうなものなのにと私は驚いた。しかし彼らは知らなかった。よく考えてみれば、別に彼らが知っているべき理由はないのだった。間違っていたのは彼らの知識ではなく、私の仮定の方だ。このことについてちゃんとした説明を書いておけば、彼らばかりでなく多くの人に有益かもしれない。Googleの
uokada 2012/06/11
programming

algorithm

python

nlp
リンク
shibu.jp: Pythonを使って2MBのメモリで100万の数値をソートする
原著者：Guido van Rossum 原文：http://neopythonic.blogspot.com/2008/10/sorting-million-32-bit-integers-in-2mb.html 原文公開日：OCTOBER 22, 2008 Pythonの著者のGuidoのブログが引っ越しをしたようです。そこに載っていた記事を一本翻訳してみました。今マイブームはオペラ座の怪人で、楽譜を買ったり、小説を買ったりして読んでいるんですが、小説の日本語がやたら直訳で堅いんです。柔らかい翻訳に触れたくて、衝動的に翻訳してみた次第です。動機とPythonは何の関係もないですが。誰かからジョーク交じりに、100万個の32ビットの数値を2メガバイトのメモリでソートできるか？と聞かれたことがある。私はこれに挑戦してみたが、この中でI/Oのバッファリングについていくつか学ぶことができた。
uokada 2012/04/11
python

algorithm

sort
リンク
Sign in - Google Accounts
Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode
uokada 2011/09/30
python

data mining

algorithm

集合知
リンク
あらゆる数独パズルを解く
Peter Norvig / 青木靖訳このエッセイでは、あらゆる数独パズルを解くという問題に取り組む。制約伝播と探索という2つのアイデアを使うと、ごく簡単に解けるということがわかる(主要なアイデアはコードにして1ページたらずで、補足的なコードが2ページある)。数独の記法と予備概念最初に記法をいくつか決めておこう。数独パズルは81個のマス(square)からなる盤面を使う。数独ファンの多くはカラムを1-9で、行をA-Iでラベル付けしており、カラム、行、ボックスのような9個のマスの集まりをユニット(unit)と呼び、ユニットを共有するマスをピア(peer)と呼んでいる。パズルではマスのいくつかが空いており、他は数字が入っている。パズルの目的はこうだ。それぞれのユニットのマスが1から9の数字の順列によって埋められるようにする。つまり、1つのユニットに同じ数字が2度現れてはならず、そ
uokada 2011/09/14
programming

python

game

puzzle

algorithm
リンク
((Pythonで) 書く (Lisp) インタプリタ)
Peter Norvig / 青木靖訳このページには2つの目的がある。コンピュータ言語の実装について一般的な記述をすることと、Lispの方言であるSchemeのサブセットをPythonで実装する具体的な方法を示すことである。私はこのインタプリタをLispy (lis.py)と呼ぶ。何年か前に私はJavaとCommon LispでSchemeインタプリタを書く方法を示した。今回の目標は、アラン・ケイが「ソフトウェアのマクスウェル方程式」と呼んだところの簡潔さと取っつきやすさを可能な限り実現するということだ。 SchemeのサブセットLispy の構文と意味論コンピュータ言語の多くは様々な構文的な決まり(キーワード、中置演算子、カッコ、演算子優先順、ドット記法、セミコロンなど)を持っているが、Lisp族言語の1つとして、Schemeの構文はすべてカッコ付きの前置記法であるリストを基本とし
uokada 2010/11/13
Lisp

プログラミング

python

algorithm

あとで読む
リンク
1