[B! Python][algorithm] raimon49のブックマーク

raimon49 id:raimon49

Pythonとalgorithmに関するraimon49のブックマーク (37)

Pythonのパッケージ管理の中級者の壁を超える stapy#98
以下のstapy#98にて発表したスライドです https://startpython.connpass.com/event/296755/ PythonのPackage Managerを深く知るためのリンク集 https://gist.github.com/vaaaaanquish/1ad9…
raimon49 2023/10/13
PackageManagement

Python

PyPI

Security

algorithm

binary
リンク
最近またLinux用の日本語IMEを作っている - tokuhirom's blog
最近またLinux用の日本語IMEを作っている本件は mozc の ut がどうこうとかは関係なくて、ふと linux desktop を使おうと昨年末に思いまして、昨年末からちまちまやってます https://github.com/tokuhirom/akaza かな漢字変換って作るの難しいのかなぁ、と思ったので作ってみている。これはまさに Just for Fun でやっている。わりと普通に自分で常用してる分には困らないかな、というところまできている。以下は、思ってることの垂れ流しという感じで、まとまってないですが。「日本語入力を支える技術」という本が 2018年に出ていて、この本の内容を読めば、だいたいエンジン部分は実装できる。Amazon のレビューではこの本よんでも実装できないって書いてあるけど、変換エンジン自体は実装できます。 UI が辛い。けど。エンジンは、ビタビア
raimon49 2023/01/16
Desktop

IME

Linux

NLP

Python

Rust

algorithm

book

cpp
リンク
macOSの暗号化zipの話の続き - NFLabs. エンジニアブログ
はじめにこんにちは。事業推進部でOffensive Teamを担当する永井です。今回はアドベントカレンダーの11日目として、前回投稿した「macOSの暗号化zipファイルはパスワードなしで解凍できる」という記事に寄せられたコメントのうち、特筆すべきものをピックアップして回答していきます。前回の記事を読んでいない方や、もう覚えてないという方は是非前回の記事を見てから続きを読んでいただければと思います。 Q. 正解するまでbkcrackを回さなくてもzip内のCRC32値と比較すれば良いのでは？はい、その通りです。筆者が前回の記事を書いている時には完全に失念していましたが、zip内にはファイル破損を検出するためにCRC32形式のハッシュ値が含まれています。そのため、bkcrackを正解パターンを引くまで都度回さなくても簡単に正解の.DS_Storeを見つけ出すことができます。実際に
raimon49 2021/12/22
Mac

Python

Security

algorithm

encryption

password

study
リンク
Python 3.11 からデフォルトの文字列ハッシュアルゴリズムが SipHash13 になります - methaneのブログ
Pythonの文字列やバイト列に対するハッシュアルゴリズムは、HashDoS対策としてPython 3.4から SipHash24が使われていました。その後、ラウンド数を減らしたSipHash13でも十分に安全だとして2015年にRustが、2016年にRubyが、SipHash24からSipHash13への切り替えを行いました。 https://github.com/rust-lang/rust/issues/29754 https://bugs.ruby-lang.org/issues/13017 Python でもSipHash13に切り替えようという提案を2017年に行っていたのですが、実装した人がなかなかプルリクエストを作ってくれず、またPythonは文字列がimmutableでハッシュ値をキャッシュしているためにそこまで大きなインパクトがなかったこともあり、ずっと放置されてい
raimon49 2021/10/12
Python

Ruby

Rust

algorithm

performance
リンク
pipとpipenvとpoetryの技術的・歴史的背景とその展望 - Stimulator
- はじめに - Pythonのパッケージ管理ツールは、長らく乱世にあると言える。特にpip、pipenv、poetryというツールの登場シーン前後では、多くの変革がもたらされた。本記事は、Pythonパッケージ管理ツールであるpip、pipenv、poetryの3つに着目し、それぞれのツールに対してフラットな背景、技術的な説明を示しながら、所属企業内にてpoetry移行大臣として1年活動した上での経験、移行の意図について綴り、今後のPythonパッケージ管理の展望について妄想するものである。注意：本記事はPythonパッケージ管理のベストプラクティスを主張する記事ではありません。背景を理解し自らの開発環境や状態に応じて適切に技術選定できるソフトウェアエンジニアこそ良いソフトウェアエンジニアであると筆者は考えています。重要なポイントのみ把握したい場合は、各章の最後のまとめを読んで頂
raimon49 2021/03/30
まだDraftである__pypackages__の議論や、PyPA周辺で見られるvendoring文化もフォローされた力作。個人的にはvenv + pip-tools + twineを個別に使うことで何も困ってないけど、Cargoみたいなものが欲しい気持ちは理解できる。

API

JSON

PackageManagement

PyPI

Python

Rust

TOML

algorithm

歴史
リンク
PHPとPythonとRubyの連想配列のデータ構造が同時期に同じ方針で性能改善されてた話 - hnwの日記
PHPとPythonとRubyの連想配列のデータ構造がそれぞれ4〜5年ほど前に見直され、ベンチマークテストによっては倍以上速くなったということがありました。具体的には以下のバージョンで実装の大変更がありました。 PHP 7.0.0 HashTable高速化 (2015/11) Python 3.6.0 dictobject高速化 (2016/12) Ruby 2.4.0 st_table高速化 (2016/12) これらのデータ構造はユーザーの利用する連想配列だけでなく言語のコアでも利用されているので、言語全体の性能改善に貢献しています1。スクリプト言語3つが同時期に同じデータ構造の改善に取り組んだだけでも面白い現象ですが、さらに面白いことに各実装の方針は非常に似ています。独立に改善に取り組んだのに同じ結論に至ったとすれば興味深い偶然と言えるでしょう2。本稿では3言語の連想配列の従来実
raimon49 2021/01/10
C

CodeReading

CPU

PHP

Python

Ruby

algorithm

memory

performance

programming
リンク
【転職エントリ】Googleに入社します｜Lillian
はじめに　この記事には、Googleのオンサイト面接に向けて勉強した内容が記載されていますが、それらはすべて面接を受ける直前に書いておいたものです。このエントリを読むことで面接で聞かれた内容が予測されてしまわないようにそのようにさせていただきました。ご了承お願いします。この記事について　令和元年に医師を退職し、ソフトウェアエンジニアに転職します。自分にとって大きな転機であったのと、とても大変な道のりであったので、私という人間が辿った道筋を最初から最後までちゃんとまとめておきたいと思いこの記事を書くことにしました。私のような他業種から未経験での転職を目指されている方にとっても、何らかの参考になる内容であれば幸いです。私の生い立ち　私は小さい頃からテレビゲームが大好きで、学校から帰るとずっと家でゲームをしている子でした。あまりにもゲームが好きだったので、遊ぶだけではなく自分で作ってみた
raimon49 2019/08/02
好きこそ物の上手なれの最上級事例だ。転職サイトとか頼らずに直で声をかけたGoogleのリクルーターもすごいな。

Google

LinkedIn

IT業界

Python

algorithm

career

programming

science

医療

数学
リンク
ブロックチェ－ンを構築しながら学ぶ | POSTD
ブロックチェ－ンの仕組みを知るには構築するのが最短の方法この記事を読んでいるということは、仮想通貨の拡大に興奮しているということですね。ブロックチェ－ンの仕組み、背後にある基本的なテクノロジーについて知りたいのでしょう。しかしブロックチェ－ンを理解するのは簡単ではありません。少なくとも私にはそうでした。大量の動画の中をさまよい、抜けだらけのチュートリアルに従い、結局、実例が少なすぎてフラストレーションが大きくなりました。私は手を動かして学ぶのが好きです。コードのレベルで内容を扱わざるを得なくなり、そうすることで身に付くからです。同じようにやってもらえば、この解説が終わる頃には、機能するブロックチェーンが出来上がり、どのように動くかがしっかりと把握できるようになるでしょう。準備ブロックチェ－ンとはブロックという名の不変でシーケンシャルな一連のレコードだということを覚えてください
raimon49 2017/12/08
休暇中に書いてみよう。

Python

algorithm

programming

study

金融

あとで読む
リンク
Rebuild: 181: UNK Reply Bot (higepon)
Taro Minowa さんをゲストに迎えて、ボット、機械学習、AI などについて話しました。 Show Notes seq2seq の chatbot を日本語で動かしてみた - Higepon’s blog ひげみbot (@higepon_bot) Convolutional neural network Sequence-to-Sequence Models ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装 TensorFlow Keras Theano Chainer 意味分からない。最初からKeras使った方が良くない？流石日本人。Chainer好きすぎでしょ。 MeCab: Yet Another Part-of-Speech and Morphological Analyzer りんな Twitter taught Microsof
raimon49 2017/05/02
AI

Facebook

Google

MachineLearning

NLP

Python

Twitter

algorithm

差別
リンク
Rebuild: 176: Garbage Collection Police (naoya)
Naoya Ito さんをゲストに迎えて、ディープワーク、データサイエンス、Python, GC, マネジメント、Google Apps などについて話しました。 Show Notes Deep Work: 大事なことに集中するけものフレンズプロジェクト WEB+DB PRESS Vol.97 私たちはいかにして環状線で”悪さをする列車”を捕まえたか Rebuild: 171: Psychologically Safe Podcast (naoya) scikit-learn: machine learning in Python pandas Matplotlib 優良AIスタートアップの見分け方 Apple Rebuilds Siri Backend Services Using Apache Mesos 集合知プログラミングデータサイエンスにおけるRubyの現在の位置づけと可能性
raimon49 2017/02/28
GC

MachineLearning

Python

Ruby

SNS

algorithm
リンク
画像処理入門講座 : OpenCVとPythonで始める画像処理 | POSTD
この記事を書くに至ったきっかけ Recruse Centerでは、私は、画像処理の勉強に時間を費やしていました。独学をし始めた頃は、何をするものなのか全く理解しておらず、ただ、文字や輪郭、模様などを識別するのに役立ち、これらで面白いことができる、ということくらいの知識しかありませんでした。私の情報源は、主にWikipediaや書籍、公開されている大学の講義ノートです。これらの資料に慣れ親しんでくるにつれ、画像処理の世界における基礎を伝えられる「入門向け画像処理」を望むようになりました。これが、この記事を書こうと思ったきっかけです。前提条件この記事は、Pythonが扱えるということを前提に書いています。その他の事前知識は必要ありませんが、NumPyや行列計算に慣れていると理解しやすいでしょう。初めに使用するのは、Python版OpenCV、Python 2.7 ^(1) 、iPy
raimon49 2016/04/07
OpenCV

Python

algorithm

color

programming

study

画像処理
リンク
Pythonによる機械学習の最前線
2016/2/4 「ソフトウェアジャパン　ビッグデータ活用実務フォーラム」でのプレゼン資料です。主にPythonで書いたコードの高速化の話です。タイトルと中身がマッチしない感じがするのは自覚しています。
raimon49 2016/02/05
C

MachineLearning

Python

algorithm

performance
リンク
GitHub - dropbox/zxcvbn: Low-Budget Password Strength Estimation
zxcvbn is a password strength estimator inspired by password crackers. Through pattern matching and conservative estimation, it recognizes and weighs 30k common passwords, common names and surnames according to US census data, popular English words from Wikipedia and US television and movies, and other common patterns like dates, repeats (aaa), sequences (abcd), keyboard patterns (qwertyuiop), and
raimon49 2016/01/15
入力されたパスワードの強度判定　PythonやObjective-Cへの移植版もある

Dropbox

JavaScript

Objective-C

Python

algorithm

password
リンク
Goで再帰使うと遅くなりますがそれが何だ - YAMAGUCHI::weblog
はじめにこんにちは、Go界のうまい棒です。昼間にTwitter眺めてたら次のような記事を見かけました。この頃流行りの言語たち（他）でベンチマーク（Dart, Go, Julia, Nim, Python, Rust 他） - Blank File 結果はあくまでフィボナッチ数列をナイーブに実装した場合なんで、まあ明らかに遅くなるよなあと予想通りの実行結果でした。件のプログラムナイーブにフィボナッチ数列を実装してますね。 package main import "fmt" func fib(n int) int { if n < 2 { return n } return fib(n-2) + fib(n-1) } func main() { fmt.Println(fib(42)) } これを実際にビルドして実行するとどれくらいかかるかというと、だいたい手元で2.5秒以上かか
raimon49 2015/10/19
Goの解決したい領域と、得意でない領域もmemoizeすれば十分速い話。

Go

Python

algorithm

performance

programming
リンク
RubyとPythonにおけるガベージコレクションの視覚化 | POSTD
本稿は、ブダペストで開かれたイベント「 RuPy 」で、Pat Shaughnessyが披露したプレゼンの内容をまとめたものです。プレゼンの映像はここから視聴できます。本稿は当初、同氏の個人ブログに投稿されましたが、同氏の了承を得て、Codeshipに再掲載します。このイベントは「RubyとPython」に関するカンファレンスなので、RubyとPythonでは、ガベージコレクション（以下「GC」）の動作がどう違うのかを比較すると面白いだろうと私は思いました。ただしその本題に入る前に、そもそもなぜ、GCを取り上げるのかについてお話しします。正直言って、すごく魅力的な、わくわくするテーマではないですよね？　皆さんの中でGCと聞いて、心がときめいた方はいらっしゃいますか？　［実はこのカンファレンス出席者の中で、ここで手を挙げた人は数名いました！］ Rubyコミュニティで最近、Rub
raimon49 2015/08/06
Ruby 2.0までとPythonの比較。

GC

Python

Ruby

algorithm
リンク
Iconfinder: 画像データの重複チェックのアルゴリズム - ワザノバ | wazanova
http://blog.iconfinder.com/detecting-duplicate-images-using-python/ 1 comment | 0 points | by WazanovaNews ■ comment by Jshiike | 約5時間前 Iconfinderは以前、500 Startup Fundのデモdayでプレゼンするのを見た記憶があります。それから資金調達もできたようで、無事生き残ってますね。アイコン等の画像ファイルの検索 & 販売をするサイトですが、悪いユーザがIconfinderから画像をダウンロードした後に、そのまま、もしくは多少改変して、Iconfinderにアップして販売しようとする不正行為があるようです。その対策のための検知アルゴリズムについてブログで紹介しています。一般的な画像データをハッシュ化するアルゴリズムでは、画像のごく一部
raimon49 2014/04/09
隣接pixel, hex_string

Python

algorithm

diff

programming

画像処理
リンク
すごく簡単なアルゴリズムがphpで書けなくてつらい - Qiita
ある条件でソートされているIDのリストを与えられて、なんとなく近い範囲でマッチングさせたいという要件があった。配列からの任意の要素の取り出しは O(n) だけど、末尾や末尾から固定した範囲の要素に限って言えば O(1) なので、後ろの方からマッチングさせながら要素を取り出していけば O(n) でマッチングできるはず。なんにも難しいことは無い話で、 Python で書けばこうなる。 list.pop() が末尾からのインデックス (-1 が最後の要素を表す) を許すのが地味に便利だ。 # coding: utf-8 def match(seq, r=100): from random import randint # 奇数個の時に先頭周辺の要素がボッチになるのが嫌なら、先に後ろの方の # 要素を取り除いて偶数にしておくこと. while len(seq) >= 2: # 引数を省略すると末
raimon49 2013/12/23
PHP

Python

algorithm

performance

programming
リンク
RubyとPythonの違いからガベージコレクタを理解する - ワザノバ | wazanova.jp
http://patshaughnessy.net/2013/10/24/visualizing-garbage-collection-in-ruby-and-python Pat Shaughnessyが、ブタペストで開催されたRUPY2013でのプレゼンの前半を自らのブログで紹介しています。ガベージコレクタは、「ゴミを集める」という行為だけでなく、「新しいオブジェクトのためにメモリをあてがう。」「不要なオブジェクトを見つける」「不要なオブジェクトからメモリを取り戻す。」という、人間の心臓が血液を浄化するような働きをしている。この簡単なコードサンプルを見ると、RubyとPythonの記述はよく似ているが、それぞれの言語の内部でのインプリの仕組みは違う。 1) Rubyのメモリ Rubyは、コードが実行される前に、数千のオブジェクトを先につくり、それをリンクされたfree listに置
raimon49 2013/11/16
CPythonは参照カウント方式。その2には世代別GCの話題も。

GC

Python

Ruby

algorithm

programming

study
リンク
: ねじ曲げ画像を使った新方式のCAPTCHA MintEyeを23行のPythonコードで破った話
先月ご紹介してなかなか好評だった、画像をグニャリと円状に曲げて加工し、それを正しい状態に戻すことで人間かスパムプログラムかを判定するという新方式のCAPTCHA MintEyeですが、一ヶ月しか経っていないのに機械的に解いてしまう話が出てきてしまいました。それもPythonでたった23行のコードで。このスクリプトがやっているのは、グレースケールに変換した上で、Sobel()で画像上のエッジを取得し、エッジの合計をグラフにプロットしている、というだけですね。画像ファイルを開くところやグラフを描くところを除けば、数行の短さです。スライダーにあわせて表示されるすべての画像について計算を行いグラフにプロットすると、たとえば以下のような結果となり、エッジの合計がもっとも小さくなる赤い点に対応する画像こそが、ねじまげられていない元の画像だというのがわかるということ。このスクリプトで、Mintey
raimon49 2013/01/25
Python

algorithm

captcha
リンク
言語のGC機能と参照カウント (前編) - moriyoshiの日記
たまにはちゃんと書いたほうがいいかなと思って書いてみる。あらまし原始的な参照カウントベースのガーベジコレクションは、循環参照が発生すると、その参照に含まれるオブジェクトを回収できないという厄介な問題を抱えている。循環参照とは、1つ以上のオブジェクトが環状の参照関係を形成している状態のことで、このような参照を持つオブジェクトは、やがてルート (ある時点で言語ランタイムが管理しているすべてのスコープと考えてもいい) から辿りつけなくなって、解放されずにリークしてしまう。この問題はいろんな LL 言語に見られる。 Perl の場合 use Devel::Peek qw(Dump); sub make_circular { my $foo = {}; my $bar = {}; my $baz = {}; $foo->{'bar'} = $bar; $bar->{'baz'} = $baz;
raimon49 2012/04/05
循環参照　参照カウント or mark and sweep

GC

Perl

PHP

Ruby

Python

algorithm

study
リンク
1 2 次のページ