[B! Python][python] [3ページ] petite

Hard to discover what SIMD architectures numpy was compiled with · Issue #18490 · numpy/numpy

petite_blue 2021/09/13

python

リンク

開発言語の人気トップが交代、JavaやC／C++を抜き去ったのは

出典：日経クロステック、2021年7月7日（記事は執筆時の情報に基づいており、現在では異なる場合があります） DX（デジタルトランスフォーメーション）を推進するため、新規システムの開発が盛んだ。従来の会計や販売、生産管理といった基幹系システムだけでなく、データ分析やAI（人工知能）システムなどの開発に着手する企業が増えている。こうした新規システムの開発を進めるには、従来の基幹系システムとは異なる開発体制が求められる。システムに合わせて開発チームを構成し、開発対象のシステムに合ったプログラミング言語を選ぶ必要がある。プログラミング言語によって向いているシステム、または向いていないシステムがあるからだ。現在のIT エンジニアは開発対象に応じて利用する言語を増やしたり、場合によっては切り替えたりすることが求められる。では今、IT エンジニアが利用するプログラミング言語や開発環境は何か。これを調

petite_blue 2021/09/10

python

リンク

ソート可能なUUID互換のulidが便利そう - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? UUIDは重複しないIDを生成する手段として便利ですが、特にversion4(乱数によるUUID)を利用する場合は一意性を得るのと同時に乱雑さも得ることになりますので、UUIDに順序性を求めることができません。 UUID - Wikipedia https://ja.wikipedia.org/wiki/UUID UUID（Universally Unique Identifier）とは、ソフトウェア上でオブジェクトを一意に識別するための識別子である。UUIDは128ビットの数値だが、十六進法による550e8400-e29b-41d4-

petite_blue 2021/09/01

リンク

pdf2txt.py 便利すぎる（PDF表をテキスト化） | ず＠沖縄

SARS-COV-2関連情報を集めていると、国や自治体、企業が公開している情報がPDFなのにムカついてしまう。ExcelをPDF化したものもあって、素直にxlsも出せよと思う。（それでも画像データで公開している組織に比べればかなりマシなのが悲しい）例えば、沖縄県のワクチン接種率の情報がPDFだ。「沖縄県のワクチン接種進捗状況／沖縄県」に掲載されている「県内市町村ごとの新型コロナワクチン接種件数」がPDFだ。タイトルは .xlsx になっているので、元々はExcelであったのだろう。ご丁寧なことに情報が更新されると過去のPDFが消されてしまうので、接種率の変化を追っかけたい場合はPDFを手元に保存しておかないといけない。沖縄県の情報公開はこういうところがダメダメだと思う。消すなよ。表から情報を抜き出す情報を抜き出すツールとしては　adobeの【無料】PDFをExcelに変換 – Ad

petite_blue 2021/09/01

pdf
python

リンク

東京大学、Pythonプログラミング無料入門 pandasやJupyterなど幅広い | Ledge.ai

サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。

petite_blue 2021/08/30

python

リンク

今、Battlesnake（バトルスネーク）が熱い - git cloneしてAPIサーバー立ててプログラミングしてマルチプレイヤーバトル！

petite_blue 2021/07/29

game
python

リンク

Pythonの型を完全に理解するためのtypingモジュール全解説(3.10対応) - Qiita

はじめに Pythonでキチンと型アノテーションを書くのであれば一度は読んでおきたいのがtypingライブラリの公式ドキュメントです。前回の記事でも読んでくださいと(偉そうに)書いたわけですが、実のところこれは型アノテーションを解釈する側1に向けたドキュメントだったりもするのでアノテを書く側にとっては情報がごちゃごちゃしてるんですよね。加えて未翻訳の箇所もそれなりにあってま～～～～読みにくい。実際に読んでいただいた方々からの評判もすこぶる悪かったです。また機能は分かったけど結局どんな時に使えばいいのか分からないという致命的なコメントも聞きました。そこで今回はこれらの不満を解消すべく、公式ドキュメントを一般ユーザー向けに再編し具体的なユースケースを盛り込んだ非公式ドキュメントをご用意しました。なおPython 3.10は2021年10月04日リリース予定ですが、先駆けてドキュメント

petite_blue 2021/07/15

python

リンク

東大、デジカメ画像から植物の3次元形質を測定可能なPythonパッケージ公開

東京大学は6月15日、一般的なデジタルカメラの画像から、鉢植え植物の3次元データを高精度に自動測定するPythonパッケージ（EasyDCP:Easy Dense Cloud Phenotyping）を開発し、公開したと発表した。 EasyDCPを利用した測定の大まかな流れ　資料：東京大学同大学によると、近年は植物の3次元形質を非破壊的に測定するための手法が発展してきているが、既存のシステムは高価であり、大規模な施設や専門的な装置が必要といった理由から、生態学の分野ではそれらのシステムがほとんど用いられてこなかったという。しかし、生態学的研究において草丈、投影葉の面積、草姿など植物の形に関する測定は非常に重要であり、鉢植えの植物を安価で高速に測定するシステムが必要とされていた。そこで同大学は、一般的なデジタルカメラと、市販およびオープンソースのソフトウェアを組み合わせたパイプライン（E

petite_blue 2021/06/18

python

リンク

Pythonで並列処理をするなら知っておくべきGILをできる限り詳しく調べてみた - Qiita

最近Pythonでオーケストレーション層(BFF)のアプリケーションを書く機会がありました。 Python3.4からはasyncioが導入され、I/Oバウンドな処理はシングルスレッドでも効率的に捌けるようになったものの、依然としてCPUバウンドな処理はGILが存在することで、シングルプロセス下では並列処理が制限されます。このことから言語特性として、CPUバウンドよりもI/Oバウンドな処理を複数捌くことに適していると見ることができます。言語選択の意思決定をする際に重要なファクターとなりますが、そのためにはGILの仕組みを改めて知る必要があると思い、調べてみました。 GIL(グローバルインタプリタロック)とはそもそもGILとは何のことでしょうか。正式にはGlobal Interpreter Lock(グローバルインタプリタロック)といい、PythonやRuby等の言語に見られる排他ロック

petite_blue 2021/06/06

python

リンク

Pythonで省メモリに大量の文字列を扱う工夫 - MNTSQ Techブログ

たくさんの文字列（や離散的な符号列）をメモリに載せないといけないんだけど、いろんな制約があって通常のList[str]では載らない…ということありませんか？（まぁあんまりなさそうですね）たまたまそういうことがあったので、その際に検討した内容をまとめておきます TL;DR メモリをもっと増やしましょう富豪的に解決できるならいつでもそれが最高ですしかし、世の中それでなんとかならんこともたくさんあります用途があうのであれば専用のデータ構造を採用する例えばもし共通のprefixやsuffixが存在し、順序に興味がなければtrie treeなどが使えます例えば、弊社であれば、法人名をメモリに持ちたいなんてときもあります。そういうときに法人名の辞書をtrieで持ったりすることがあります「株式会社」「一般財団法人」や「銀行」といった共通語がたくさんでてくるのでtrie treeでごりごり削

petite_blue 2021/05/22

python

リンク

Pythonistaなら知っておきたい計算量のはなし - Qiita

最近久しぶりにアルゴリズムイントロダクションを読んでいるのですが、ふと「Python(CPython)のデータ構造に関する各操作の計算量ってどれくらいなのかな？」と気になったので調べてみました。以下のページを参考にしています: Python Time Complexity 以下では $n$ や $k$ といった記号を使います。ここで $n$ はコンテナ内の要素数、$k$ はパラメータ内の要素数かパラメータの値とします。では見ていきましょう。 2021/05/02 コメントでのご指摘を記事に反映しました。ありがとうございます。リストまずはリストです。Pythonではリストは内部的にはC言語の配列として表しているようです。そのため、先頭要素の追加や削除を行うとそれ以降の要素をすべて移動する必要があるため大きなコストがかかります。なので先頭に要素を追加したり削除する必要がある場合は、代わりに

petite_blue 2021/05/03

python

リンク

Pythonに型アノテーションを自動で付与する

2021/10 追記 Pyannotate はメンテナが居なくなったため更新が途絶えました。またより表現多く typing を反映できるため、これからは Monkeytype を推奨します。この記事は何か Python Advent Calendar 2020の 2 日目の記事です(元々 13 日目でしたが、2 日目の参加者が取りやめたので横入りしました)。「Python コードに自動で型を付与し、その型をテストで静的チェックして、保守性を高める方法」をご紹介する趣旨の記事です。書いた理由今回紹介するメインツールの pyannotate について、日本語で紹介している記事がほとんどなく、かつ古い情報が多かった為です(python3 サポートがない時代かつ、pytest との連携ができなかった時代)。「Python において型はいるのか？」という議論はしません。今回紹介するツールは以

petite_blue 2021/04/15

python

リンク

私が考えるLambda開発環境のベストプラクティス

概要（この記事のアイコン、Lambdaっぽいの頑張って探した..！） 2020年にLambdaにコンテナイメージがサポートされて以来、Lambda開発をしたことがなかった。 AWS Lambda の新機能 – コンテナイメージのサポート以前Lambdaを開発しているときは、適用するときにzip化が面倒だなとか、ローカルとクラウド上での動きが違うのでバグりやすいなとか、そのバグが適用しないと分からないので開発に時間がかかるなとか、色々と不便があったのを覚えている。先日、画像圧縮処理で久々にLambdaを触り、その際コンテナイメージを使った快適なLambda開発環境を考えたので紹介する。言語はPythonだが他の言語でも同じ構成で大丈夫なはず。結論ディレクトリ構造

petite_blue 2021/04/14

リンク

Downloading files from S3 with multithreading and Boto3

petite_blue 2021/04/11

リンク

Anaconda の NumPy が高速みたいなので試してみた - Morikatron Engineer Blog

こんにちは、モリカトロンでプログラマおじさんをやってる岡島です。 pip install で導入した NumPy と conda install で導入した NumPy とでは内部で使われているライブラリが違い、後者の方が高速だという記事を見つけました。 orizuru.io minus9d.hatena blog.com 要約すると Anaconda と pip では NumPy に使われている数値計算ライブラリが違っている pip が提供する Numpy は OpenBLAS を使っている Anaconda が提供する NumPy は Intel MKL (Math Kernel Library) を使っている両者を比較すると、Anaconda が提供する NumPy のほうが速いという事みたいです。今まで僕は Python のパッケージ管理を pip で行ってきましたが、Anac

petite_blue 2021/03/31

リンク

Python言語による実務で使える100+の最適化問題 | opt100

指針厳密解法に対しては、解ける問題例の規模の指針を与える。数理最適化ソルバーを使う場合には、Gurobi かmypulpを用い、それぞれの限界を調べる。動的最適化の場合には、メモリの限界について調べる。近似解法に対しては、近似誤差の指針を与える。複数の定式化を示し、どの定式化が実務的に良いかの指針を示す。出来るだけベンチマーク問題例を用いる。OR-Libraryなどから問題例をダウンロードし、ディレクトリごとに保管しておく。解説ビデオもYoutubeで公開する．主要な問題に対してはアプリを作ってデモをする．以下，デモビデオ：注意基本的には，コードも公開するが， github自体はプライベートそのうち本にするかもしれない（予約はしているが，保証はない）．プロジェクトに参加したい人は，以下の技量が必要（github, nbdev, poetry, gurobi); ペー

petite_blue 2021/03/30

リンク

pipとpipenvとpoetryの技術的・歴史的背景とその展望 - Stimulator

- はじめに - Pythonのパッケージ管理ツールは、長らく乱世にあると言える。特にpip、pipenv、poetryというツールの登場シーン前後では、多くの変革がもたらされた。本記事は、Pythonパッケージ管理ツールであるpip、pipenv、poetryの3つに着目し、それぞれのツールに対してフラットな背景、技術的な説明を示しながら、所属企業内にてpoetry移行大臣として1年活動した上での経験、移行の意図について綴り、今後のPythonパッケージ管理の展望について妄想するものである。注意：本記事はPythonパッケージ管理のベストプラクティスを主張する記事ではありません。背景を理解し自らの開発環境や状態に応じて適切に技術選定できるソフトウェアエンジニアこそ良いソフトウェアエンジニアであると筆者は考えています。重要なポイントのみ把握したい場合は、各章の最後のまとめを読んで頂

petite_blue 2021/03/30

python

リンク

numbaでざっくりPython高速化 - Qiita

numbaというライブラリを使うと、Pythonのコードを比較的簡単に高速化できます。うまくいけば、from numba import jitを書いて、高速化したい関数の前の行に@jitを書くだけで高速化できます。仕組みとしては、numbaはPythonの仮想マシンコードを取得し、LLVM IRにコンパイルし、LLVMを使ってネイティブコードにするようです。初回実行時は、コンパイル処理が走るので、若干遅くなりますが、重い処理だと、コンパイル時間を考えてもnumbaの方が速いこともあります。利点と欠点先に述べておきます。利点場合によっては、コード自体は改造せずに手軽に高速化できるコードの改造があったとしても、軽微な改造で済むことも多い別ファイルに分けてビルドする、みたいな手間なことが必要なく、手軽に.pyファイルの中で使える欠点すべてのPython機能がサポートされてい

petite_blue 2021/03/30

python

リンク

Python自然言語処理テクニック集【基礎編】

自分がよく使用する日本語自然言語処理のテンプレをまとめたものです。主に自分でコピペして使う用にまとめたものですが、みなさんのお役に立てれば幸いです。環境はPython3系、Google Colaboratory（Ubuntu）で動作確認しています。 Pythonの標準機能とpipで容易にインストールできるライブラリに限定しています。機械学習、ディープラーニングは出てきません！テキストデータの前処理が中心です。前処理系大文字小文字日本語のテキストにも英語が出てくることはあるので。 s = "Youmou" print(s.upper()) # YOUMOU print(s.lower()) # youmou 全角半角日本語だとこちらのほうが大事。全角半角変換のライブラリはいくつかありますが、自分はjaconv派。 MIT Licenseで利用可能です。 import jaco

petite_blue 2021/03/29

python
nlp

リンク

GoogleがPython用ファジーテストツールAtherisをオープンソースとして公開

あなたにとって重要なトピックや同僚の最新情報を入手しましょう最新の洞察とトレンドに関する最新情報を即座に受け取りましょう。継続的な学習のために、無料のリソースに手軽にアクセスしましょうミニブック、トランスクリプト付き動画、およびトレーニング教材。記事を保存して、いつでも読むことができます記事をブックマークして、準備ができたらいつでも読めます。

petite_blue 2021/03/14

python

リンク

はてなブックマーク

タグ

関連タグで絞り込む (82)

Pythonとpythonに関するpetite_blueのブックマーク (203)

お知らせ

月間はてなブックマーク数ランキング（2025年10月）

今週のはてなブックマーク数ランキング（2025年11月第1週）

今週のはてなブックマーク数ランキング（2025年10月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス