[B! python][programming] manabouのブックマーク

manabou id:manabou

pythonとprogrammingに関するmanabouのブックマーク (24)

はじめに — Python早見帳
Python早見帳は、プログラムと実行例をカタログ的に提示しながら、Pythonの言語仕様やライブラリを紹介しています。Pythonの基礎を素早く習得したり、ライブラリやオブジェクトの使い方を確認することができます。
manabou 2022/10/13
online

github

programming

python

education

jupyter
リンク
Python ユーザでも『データ可視化入門』で練習できるようにパッケージを作った + Plotnine との互換性ガイド - ill-identified diary
概要 pysocviz が提供する機能 ggplot2 と同じようにできないところとその対策 aes() にクオートされてない変数を指定できない R のように改行できない ggplot2 で使えた色名が使えない ggplot2 で使えた linetype が使えない文字化けの回避 ggrepel パッケージの利用 scales::percent などの単位・スケール指定テーマや色パレットのプリセットを変更したい場合 subtitle/caption が表示されない複数のグラフを連結できない hjust/vjust が使えないグラフ内の図形やテキストの大きさのバランスがおかしい geom_smooth/stat_smooth で一般化加法モデル (GAM) による平滑化ができない geom_quantile の method 指定ができない geom_smooth/stat_smoo
manabou 2021/08/07
python

programming

visualization

graph

r
リンク
うわっ…私のpandas、遅すぎ…?って時にやるべきこと（先人の知恵より） - Lean Baseball
※あくまでもイメージです（適当）仕事じゃなくて、趣味の方の野球統計モデルで詰まった時にやったメモ的なやつです.*1 一言で言うと、約19万レコード（110MBちょい）のCSVの統計処理を70秒から4秒に縮めました. # 最初のコード $ time python run_expectancy.py events-2018.csv RUNS_ROI outs 0 1 2 runner 0_000 0.49 0.26 0.10 1_001 1.43 1.00 0.35 2_010 1.13 0.68 0.32 3_011 1.94 1.36 0.57 4_100 0.87 0.53 0.22 5_101 1.79 1.21 0.50 6_110 1.42 0.93 0.44 7_111 2.35 1.47 0.77 python run_expectancy.py events-2018.c
manabou 2021/06/09
pandas

machinelearning

programming

csv

performance

python
リンク
CS50 for Japanese: コンピュータサイエンスの入門 – 当ウェブサイトは、Creative Commons ライセンスに基づいて管理されています。
お知らせ: 2022/9/1 CS50 を活用した非営利／協賛企業による「コロナ学生支援」プロジェクトを実施中 ▼ 学生の方へ：CS50 の学習（履修証明書の取得）を一緒に取り組むプロジェクト CS50日本語版の翻訳コントリビューターである CODEGYM が主催する、非営利／無償のプロジェクト「CODEGYM Academy (外部リンク)」は、昨年に続き2022年度（春/秋）も、キャリア選択を控えた学生に対し、以下の企業の協賛により無償で17週間のプログラミング教育カリキュラムを提供します。 CODEGYM Academy 協賛企業（2022年） https://codegym.jp/academy/ 今年度のエントリーは締め切りました — ようこそ！このページは、ハーバード大学 CS50 の日本語版翻訳プロジェクトのページです。当サイトのドメインに掲載されているコンテンツは、Cre
manabou 2021/05/30
computerscience

science

programming

python

javascript
リンク
Pythonで省メモリに大量の文字列を扱う工夫 - MNTSQ Techブログ
たくさんの文字列（や離散的な符号列）をメモリに載せないといけないんだけど、いろんな制約があって通常のList[str]では載らない…ということありませんか？（まぁあんまりなさそうですね）たまたまそういうことがあったので、その際に検討した内容をまとめておきます TL;DR メモリをもっと増やしましょう富豪的に解決できるならいつでもそれが最高ですしかし、世の中それでなんとかならんこともたくさんあります用途があうのであれば専用のデータ構造を採用する例えばもし共通のprefixやsuffixが存在し、順序に興味がなければtrie treeなどが使えます例えば、弊社であれば、法人名をメモリに持ちたいなんてときもあります。そういうときに法人名の辞書をtrieで持ったりすることがあります「株式会社」「一般財団法人」や「銀行」といった共通語がたくさんでてくるのでtrie treeでごりごり削
manabou 2021/05/22
python

string

memory

programming

performance

tuning
リンク
【Python】良い書き方と悪い書き方を知って中級者を目指す🐍 - Qiita
Pythonでコードを書くときのGood/Badプラクティスこちらの記事は、DuomlyによりDev.to上で公開された『 Good and Bad Practices of Coding in Python 』の邦訳版です（原著者から許可を得た上での公開です）元記事：Good and Bad Practices of Coding in Python ※ 記事の内容に注意すべき点と誤りがあるので、詳しくは注釈まで目を通すことをおすすめします。（以下、翻訳した本文）この記事は元々 https://www.blog.duomly.com/good-and-bad-practices-of-coding-in-python/ に公開されたものです。 Pythonは可読性を重視した高水準のマルチパラダイムプログラミング言語です。Pythonは、「Pythonの禅」、別名ではPEP 20と
manabou 2020/09/07
python

programming

coding
リンク
「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新) - todo-mentor’s diary
データサイエンティストを生業にする手段と実態について述べる。途中、具体例・境界値の例として私個人の話もするが、なるべく一般性のある話をする。この記事で言いたいことは具体的には4つだ。プログラミングスクールをディスるなら代わりの入門方法を提供しようよ。もう「未経験文系から3ヶ月でデータサイエンティストで一発逆転物語」を止めろ。*1 おじさんは人生逆転したいなら真面目にやれ。若者はワンチャンじゃなくて、ちゃんと化け物になれよ。この記事についてはパブリック・ドメインとして転載・改変・リンク記載を自由にしてよいです。 (続き書いた) a. 入門は辛いが… b. 思考停止でプログラミングスクールに通うな。なろう系・始めてみよう系資料一覧（最速・最短ルート用）まずは動かしてみよう。強くてニューゲームが体験出来るぞ！入門以前の本一般向け業界本 (AI業界と展望がわかる本) 技術者入
manabou 2020/07/13
datascience

python

learn

youtube

book

programming
リンク
Pythonのコード改善のためのツール5つを試してみた - minus9d's diary
Pythonのコードを改善するためのツールについて一通り試してみました。各ツールのインストール方法や使い方については Pythonのスタイルガイドとそれを守るための各種Lint・解析ツール5種まとめ！ - Sider Blog に詳細にまとまっているのでおすすめです。サンプルコード以下のサンプルコードを対象に、各ツールの出力を確かめてみます。 import time import sys import fractions def func1(varA,varB): '''return sum of a and b''' varC = 42 return (varA + varB) print(func1(fractions.Fraction(1, 2), fractions.Fraction(1, 3))) 3 + 5 sys.exit(0) このスクリプトをsample.pyという名
manabou 2019/10/11
python

tool

programming

lint
リンク
ソースコードを分析し、コードの構造や階層・依存関係を可視化する便利な無料ツール -Code Crumbs
フローチャート ※依存関係・フローチャートはJavaScriptのみです。対応言語は、下記の通り。 JavaScript TypeScript Python PHP Java C++ 望む言語が他にあればIssueにどうぞ、とのことです。 Code Crumbsのデモデモでは、JavaScriptのコードでその動作を確認できます。デモページ依存関係はDependenciesをオンに、フローチャートはFlowChartタブをクリックします。 Code Crumbsの使い方セットアップ codecrumbをインストールします（yarn global add codecrumbs）。 codecrumbs -d project-src-dir -e project-src-dir/index.jsを実行し、プロジェクトに合わせてパラメータを変更します。-dはソースコードを含むディレクト
manabou 2019/02/25
static

analysis

python

typescript

programming

development
リンク
全ての開発者が学ぶべき5つの言語 - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 「どの言語を学ぶべきか」という議論はエンジニア向け記事の定番ネタですが、HackerNoonに投稿された5 Programming Languages Every Master Developer Should Learnという記事がなかなか興味深かったので翻訳してみました。 (2018/11/04追記) こちらの記事に関する「別視点からの意見」として下記のような記事を追加いたしました。宜しければこちらも併せてご参照ください。 Ruby->Go->Scalaという習得順序がエンジニアの爆速の成長に最適である理由はじめに「プログラマー
manabou 2018/11/04
programming

scala

haskell

python
リンク
100万倍速いプログラムを書く - Qiita
この記事はなんなのプログラミングを始めたばかりで高速化の大枠が全くわからず意味不明なことをしていた在学時、こんな資料があったら良かったのになあ、と思って書いたもの。書いて、在学時研究室に押し付けた後紛失したと思われていたものが発掘されたもの。要約ライブラリがあるならそれを使う。ライブラリが無ければ、ボトルネック部分を探してそこだけ高速な言語で書きなおすか、可能なら事前コンパイルする。最初から全てを Low-Level な言語で書くと大変、でも結果のプログラムは速い。以下の時間の計測ではインポートにかかる時間は除いています。使用するもの Python（3系） Numba Scipy Line Profiler Fortran（gfortran） QUADPACK QUADPACK以外の導入方法の説明は色んな所にあるので各自でお願いします。上3つに関しては、個人的にはAnaco
manabou 2017/07/18
performance

programming

fortran

python
リンク
文章をベクトル化して類似文章の検索 - Qiita
Doc2Vecで類似文章を検索してみたので、実装を紹介します。 Doc2Vecとはコンピュータが自然言語を処理するためには、まず人間の言葉をコンピュータで扱える値にする必要があります。単語の意味をベクトル化する手法としてWord2Vecが存在します。詳しくはリンク先がとてもわかりやすいのですが、ざっくり言うと前後n単語のリストでその単語を表現します。こうすることで、例えば「犬」と「猫」は同じような文脈で使われるため、似た「意味」であると考えることができます。 Doc2VecはWord2Vecを応用し、文章をベクトル化するものです。実装サンプル今回Doc2Vecを用いて実現するのは、以下の2つの機能です。単語で文章を検索類似文章の検索サンプルとして、青空文庫の文章を使用しました。なお、この記事で使用するコードはGitHubで公開しています。 (学習に使用した文章もzipに
manabou 2017/03/01
doc2vec

word2vec

python

programming
リンク
私たちはいかにして環状線で”悪さをする列車”を捕まえたか | プログラミング | POSTD
文：Daniel Sim　分析：Lee Shangqian、Daniel Sim、Clarence Ng ここ数ヶ月、シンガポールのMRT環状線では列車が何度も止まるものの、その原因が分からないため、通勤客の大きな混乱や心配の種となっていました。私も多くの同僚と同じように環状線を使ってワンノースのオフィスに通っています。そのため、11月5日に列車が止まる原因を調査する依頼がチームに来た時は、ためらうことなく業務に携わることを志願しました。鉄道運営会社SMRTと陸上交通庁（LTA）による事前調査から、いくつかの電車の信号を消失させる信号の干渉があり、それがインシデントを引き起こすことが既に分かっていました。信号が消失すると列車の安全機能である緊急ブレーキが作動するため、不規則に電車が止まる原因となります。しかし8月に初めて発生した今回のインシデントは、不規則に起こっているように見えるた
manabou 2017/02/25
train

algorithm

python

programming

analytics
リンク
プログラミング初心者だけどPythonでデータ解析することになった人に - Qiita
ロードマップ Pythonの文法の基本を抑えるちょっとしたアルゴリズム書けるようになるデータ分析・科学計算ライブラリの基本を理解する業務・研究用のコードを書けるようになる Pythonの文法の基本を抑える方法はいくらでもあるから、自分にあった方法を選ぶ。 Web上のわかりやすそうな入門サイトを通読するのでもいいし全然わからないのであれば、本一冊買っても損はない最近は動画もある。英語の動画を視聴できるのなら、尚の事幅が広がるいずれにせよ、むやみに時間をかける必要はなく、__全体像を掴む__だけでよい。細かいことは実際にコードを書くときに__都度調べていく__ほうが身につきやすい。目的があるなら尚の事。あとは__躓いた時にすぐ聞ける人__がいるとなおよい。そういう__先達がいるならば、その人のおすすめを聞く__と良い。慣れてるならこういうまとめを観るだけでもいい http:
manabou 2016/10/17
python

programming

algorithm
リンク
機械学習に挑んだ一年間 – 機械学習について一から学び、仕事に活用するまでの道のり | POSTD
この記事は、去年私が書いた「Machine Learning in a Week（機械学習に挑んだ一週間）」という記事の続編です。その記事では、私が5日間集中的に機械学習を学び、のめり込んでいった経緯について説明しています。機械学習に挑んだ一週間一般の人にとって機械学習の分野に足を踏み入れるのは、無謀なことに思えるでしょう。medium.com 私は順調なスタートを切った後も、時間を見つけて勉強を続け、およそ一年後には、仕事で機械学習を活用した初プロジェクトを立ち上げることができました。そのプロジェクトでは、さまざまなタイプの機械学習や自然言語処理（NLP）の技術を駆使して、 Xeneta の潜在顧客の特定を行っています。趣味でやっていたことが仕事になって、とても嬉しかったです。同時に、仕事として機械学習を利用するのは博士号を持つ限られた人だけだ、という思い込みも払拭されました
manabou 2016/10/09
machinelearning

python

programming
リンク
高速化のためのPython Tips - のんびりしているエンジニアの日記
皆さんこんにちはお元気ですか？私は元気です。 Pythonにおける高速化手法を掲載してみます。簡単なコード並びに索引のような感じで引けるようなイメージで作成しました。本日の目次です。 Pythonにおける高速化の必要性 Pythonの高速化高速化の手順 Profiling 基本的な条件計測コード Pythonの基本的な書き方部分 rangeよりxrangeを（Python2.7）リストの生成文字列結合 Import文のコスト関数呼び出しのコストドットを避ける yieldを使う Numpyに関するTips Numpyを使用して基本演算を高速化する Numpyの要素にアクセスする演算をしない Numbaで手早く高速化その他高速化ツール Cython Dask PyPy 感想並びに展望参考文献 Pythonにおける高速化の必要性 PythonはC++やJavaと比較すると非
manabou 2016/09/03
python

tips

performance

programming

cython
リンク
仮想継承とsingledispatch - atsuoishimoto's diary
以前、em itjson というパッケージを公開した。使い方は簡単にこちらに書いたが、要はfunctools.singledispatch() をちょっと使いやすくしたものにすぎない。 singledispatch() は、Python3の抽象基底クラスと組み合わせると、非常に面白い使い方ができる。em itjson を例にして、使い方を紹介してみたい。 em itjson 簡単に em itjson の使い方を說明しておこう em itjson は、em itjson という名前だが、JSON を出力するためのモジュールではなく、いろいろなオブジェクトを json として出力可能なオブジェクトに変換するためのリポジトリを作成するモジュールだ。特にJSON専用ということもなく、たとえばCSVファイルを作成する場合などでも利用できる。例として、datatime.date 型の日付と、PIL.Ima
manabou 2016/08/05
python

json

emitjson

programming

spec
リンク
位置情報によるタイムゾーン取得Gem timezone_finderで学ぶPythonからRubyへの移植法
timezone_finderというGemを登録しました。 https://rubygems.org/gems/timezone_finder https://github.com/gunyarakun/timezone_finder 緯度・経度を与えると、その緯度・経度でのタイムゾーン文字列を取得することができるライブラリです。海上であっても、最寄りのタイムゾーン文字列を取得することができます。 GeoIPと組み合わせることによって、IPアドレスからタイムゾーンを推定できます。こんな感じ。 require 'maxminddb' require 'timezone_finder' db = MaxMindDB.new('./GeoLite2-City.mmdb') ret = db.lookup(request.remote_ip) tf = TimezoneFinder.create
manabou 2016/06/01
python

ruby

translation

programming
リンク
たった1人から始める社内テストコード文化
>>> $ py.test ../tests/test_webapi.py =============================================================================== test session starts =============================================================================== platform darwin -- Python 2.7.5 -- py-1.4.31 -- pytest-2.7.0 rootdir: /Users/*****, inifile: pytest.ini plugins: cache, django, pep8, pythonpath collected 2 it ems ../tests/test_webap
manabou 2016/03/15
test

development

management

programming

python

django
リンク
Pythonで書ける便利な書き方を紹介します。 - のんびりしているエンジニアの日記
皆さんこんにちはお元気ですか。私は元気です。今日はPythonにおける便利記法を書いてみます。他の言語しか使ったこと無い人もぜひ ※1/25間違いかと思われる箇所の加筆修正を実施リストに関するイテレーション enumerate（インデックスとオブジェクトのループ） zip（同時に２つのオブジェクトでループ） yield（途中で一旦返す） for-else（forで途中で停止しない場合の条件）リスト内包表記 Collections Counter default dict（辞書のデフォルト値設定） Sort（ソート） sorted if文の書き方 Fileに関する処理（with） in（オブジェクトに存在しているかどうか）関数について返り値を複数返す。関数のオブジェクト化参考文献リストに関するイテレーション enumerate（インデックスとオブジェクトのループ） enu
manabou 2016/01/25
python

programming
リンク
1 2 次のページ