[B! Python] misshikiのブックマーク

Pythonスクレイピングで403が出たら読む記事　【curl_cffi・Cloudflare対策・2026年版】

本記事で紹介する手法は、対象サイトの利用規約・robots.txtを遵守した上での利用を前提としています。技術的に可能であっても、ToS違反・不正アクセスに当たる行為は行わないでください。ブラウザで普通に開けるのに、Pythonからアクセスすると弾かれる。User-Agentを変えても、ヘッダーを追加しても、まだ403が出る——そのとき、次の一手が curl_cffi です。以前、ECサイトの価格データを定期収集するスクリプトを書いていたとき、requestsでは問題なく取得できていたページが、ある日突然403を返し始めました。User-Agentをブラウザのものに変えても、Accept ヘッダーを追加しても改善せず。原因はTLSフィンガープリントの不一致で、curl_cffi に切り替えたところ1行の変更で解決しました。この記事では、curl_cffi の使い方を requests

misshiki 2026/04/30

Pythonスクレイピングでrequestsが403になる原因をUser-AgentとTLSフィンガープリントから解説。curl_cffiのimpersonate="chrome"への移行、Session、例外処理、Playwrightとの使い分けを整理。

Python

リンク

httpxとrequestsの違いと使い分け完全ガイド【非同期・HTTP/2・2026年版】

本記事で紹介する手法は、対象サイトの利用規約・robots.txtを遵守した上での利用を前提としています。はじめに Pythonでスクレイピングを始めると、最初に使うのは requests です。シンプルで直感的で、ほとんどの用途で十分に機能します。しかし、スクリプトをスケールさせようとしたとき「requests は非同期に対応していない」という壁にぶつかります。そこで調べると httpx が出てきます。「requests の上位互換なのか？」「全部 httpx に移行すべきか？」「curl_cffi はどう違うのか？」——この3択で迷った経験があります。以前、300件のURLを同期で取得していたスクリプトを非同期化しようとしたとき、httpx に移行するか asyncio + requests を使うか（これはできない）、curl_cffi の非同期版にするかで迷いました。違いを整

misshiki 2026/04/30

requests、httpx、curl_cffiの使い分け解説。50件以下はrequests、100件以上・403なしはhttpx非同期、Cloudflareや403対策はcurl_cffi。速度差はライブラリではなく非同期化で生まれる。

Python

リンク

Python 3.15ではより正確な型チェックが可能に（なる予定）　PEP 800で導入される非交和基底とは？

Python 3.15ではより正確な型チェックが可能に（なる予定）　PEP 800で導入される非交和基底とは？：Deep Insider Brief ― 技術の“今”にひと言コメント Python 3.15をターゲットとしたPEP 800が承認された。これが提案する「あるクラスが非交和基底であること」と、それを示す@disjoint_baseデコレーターについて紹介する。

misshiki 2026/04/25

Python 3.15向けPEP 800が承認。@disjoint_baseで「同時に継承できない基底」を示し、intかつstrのような到達不可能コードを型チェッカーがより正確に判定可能に。

Python

リンク

GitHub - itsmeadarsh2008/backlit-kbd: A beginner-friendly Python package for controlling keyboard backlight.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

misshiki 2026/04/23

backlit-kbd は Linux のキーボードバックライトを制御する初心者向け Python パッケージ。実機 sysfs 自動検出に加え、安全な mock backend、CLI、通知点滅 API、サンプル3本を備える。

Python

リンク

Pythonの仮想環境パスが.venvに統一される？　PEP 832が提案される

Pythonの仮想環境パスが.venvに統一される？　PEP 832が提案される：Deep Insider Brief ― 技術の“今”にひと言コメント Pythonで仮想環境を作るときってどこに作っていますか？　ディレクトリ名をどうするか悩んでいませんか？　これを解決してくれるかもしれないPEPが提出されました。どんなものか、ちょっと見てみましょう。

misshiki 2026/04/21

PEP 832が4月15日に公開。仮想環境の既定位置をプロジェクトルートの.venvにし、置けない場合は.venvファイルにパスを書く案。Python 3.15対応目標、4月17日時点でDraft。

Python

リンク

GitHub - dropseed/plain: The Python web framework for building apps.

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

misshiki 2026/04/17

dropseed/plainは、Django fork由来のPython Webフレームワーク。Postgres専用、Jinja、htmx、Tailwindを軸に、型重視・観測性標準装備・エージェント向けRules/Docs/Skillsまで揃えた「AI時代向け」設計を掲げる。

リンク

製造業RAG実装編：ChromaDB + Cohere でACL-aware retrievalを実装する【コード付き】

はじめに「田中保守員が冷却システムの点検手順を質問すると、手順書の内容が正確に返ってくる。山田一般スタッフが同じ質問をすると、『提供された文書には冷却システムの点検手順に関する記載がありません』と返ってくる」 ——この動作を、約150行のPythonコードで実現します。前回の設計編では、製造業向けRAGシステムにおけるアクセス制御の設計原則を解説しました。各文書に「誰が見ていいか」という情報（本記事ではallowed_groupsと呼びます）をメタデータとして持たせ、Query時にApp LayerがIdPからユーザーのグループ情報を取得してフィルタリングする——という設計です。今回はその設計を実際にPythonで動かします。本記事で実装するもの: 製造業の社内文書サンプル（設備点検マニュアル・経営資料等）を使ったACL-aware RAGパイプライン。ユーザーごとにアクセスできる

misshiki 2026/04/16

製造業向けRAGで、文書ごとの allowed_groups を使うACL-aware retrievalを約150行のPythonで実装した記事。ChromaDB＋Cohere＋Claudeで、権限外文書をFail Closedで除外しつつ、Rerankで関連文書を絞って回答する。

リンク

GitHub - arc53/fast-ebook: fast, rust based epub library for python

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

misshiki 2026/04/16

Rust製コアを使うPython向けEPUBライブラリ fast-ebook。READMEではMarkdown変換が56msで、ebooklib + html2text の375ms比で6.7倍高速と紹介。互換レイヤーも用意。

Python

リンク

CPythonはRustの夢を見るか　Rust for CPythonがPython 3.16に向けた計画を公表

CPythonはRustの夢を見るか　Rust for CPythonがPython 3.16に向けた計画を公表：Deep Insider Brief ― 技術の“今”にひと言コメント CPython（PythonのリファレンスC実装）にRustを導入する取り組みの進捗（しんちょく）が報告された。まずはPython 3.16でRust製の拡張モジュールをオプションとして組み込むことを目標として、PEPの提出が計画されている。

misshiki 2026/04/14

Rust for CPythonが、Python 3.16に向けてRust製拡張モジュール導入のPEP提出を計画。全面統合ではなく段階導入へ方針転換。狙いはメモリ安全性とスレッド安全性の向上で、proof-of-conceptとして _base64 も実装済み。

Python
Rust

リンク

What’s new in 3.0.2 (March 30, 2026) — pandas 3.0.2 documentation

misshiki 2026/04/14

pandas 3.0.2公開。Series.case_when() の pd.col() 対応追加に加え、json_normalize()、convert_dtypes()、sort_index()、to_datetime() などの回帰・不具合を修正。

Python

リンク

新米データサイエンティストが守るコードの３つの原則 - Qiita

この記事の背景多くのデータ分析プロジェクトは Jupyter Notebook の中で生まれます。しかしプロジェクトが「一度きりの分析」から「継続的に更新する予測システム」に育つと、ある日こんな壁にぶつかります。「先月のモデルを再現したいのに、同じ結果にならない」「前任者が書いた 500 行の関数、どこを直せばいいか分からない」「新しい特徴量を足したら、関係ないはずの推論パイプラインが壊れた」こうした問題の多くは、コードの設計で防げます。本記事では、筆者が実務で痛感した失敗をもとに、分析コードを壊れにくくする３つの原則と、それぞれの具体的な実装パターンを紹介します。３つの原則と対応パターン原則 1 読み手に優しい名前をつける ├── Python のスタイルガイドに従う ├── 文脈の重複を削る └── 「何をする関数か」が名前だけで伝わるようにする原則 2 関数は「ひ

misshiki 2026/04/10

分析コードを壊れにくくする3原則を整理。命名を揃える、関数を1責務に分ける、型ヒントとdocstringで意図を埋め込む、という基本をデータサイエンス実務向けの例で具体化している。

リンク

Monarch: an API to your supercomputer – PyTorch

misshiki 2026/04/10

MetaのPyTorch向け分散フレームワークMonarch。単一Python APIで大規模クラスタを扱い、Kubernetes対応、EFA/ROCm対応、分散SQLテレメトリ、TUI/OSSダッシュボード強化などを追加。

リンク

Streaming sort-merge joins in Polars

misshiki 2026/04/10

Polarsがソート済みキー向けのストリーミング型ソートマージ結合を解説。set_sorted で順序性をオプティマイザーに伝えると、物理計画で merge-join が選ばれ、ベストケースで18倍、実データでも3.5倍高速化。

Python

リンク

VS CodeのPython拡張機能が強化、venv内パッケージのシンボル検索が可能に

VS CodeのPython 拡張機能が強化、venv内パッケージのシンボル検索が可能に：Deep Insider Brief ― 技術の“今”にひと言コメント VS Code用Python 拡張機能の2026年3月更新版が公開された。仮想環境にインストール済みのパッケージのシンボルを［ワークスペース内のシンボルへ移動］で検索できるようになった。コードを深く理解するのに有用な機能だ。

misshiki 2026/04/10

VS CodeのPython拡張機能が更新。python.analysis.includeVenvInWorkspaceSymbols でvenv内パッケージのシンボル検索に対応。実験的なRust製並列インデクサーも追加され、大規模プロジェクトでは平均10倍高速化という。

リンク

ExecuTorch Becomes a Part of PyTorch Core to Expand On-Device Inference Capabilities – PyTorch

misshiki 2026/04/08

ExecuTorchがPyTorch Coreに統合。モバイル・AR/VR・組み込み向け軽量ランタイムでCPU/GPU/NPU/DSP対応。Meta発だがベンダー中立ガバナンスへ移行。モデル変換・量子化・デプロイ強化を推進。

Python
Meta

リンク

PyTorch Foundation Welcomes Helion as a Foundation-Hosted Project to Standardize Open, Portable, and Accessible AI Kernel Authoring – PyTorch

misshiki 2026/04/08

PyTorch FoundationがMeta開発のHelion採択。Python DSLでAIカーネルを記述し、Triton等へコンパイル。数百実装を自動チューニングし移植性向上。ExecuTorchはPyTorch Coreへ統合。

リンク

PythonフォーラムのPEPクイズが面白い　2つはホントで、1つはウソを見抜ける？

どうもHPかわさきです。日本で生まれ育ってきた筆者はよく知らないのですが、初対面の人たちが集まる中で緊張（アイス）をほぐす（ブレークする）ための「アイスブレークゲーム」の1つとして、「Two Truths and a Lie」というのがあるそうです。これは自分に関係するホントの紹介文を2つ、ウソの紹介文を1つ用意して、他の人たちにどれがホントでどれがウソかを当ててもらうもの。みんなであーだこーだと話しているうちに緊張がほぐれてくるとか。筆者は友だちが少ないし、いい年のおっさんが友だちを作る場面に遭遇することもないので試せません。誰か試してみてください。というわけで、今回はこの「Two Truths and a Lie」のPEP版を『Two Truths and a Lie, PEP edition』から紹介しましょう。なお、PEPとはPythonの仕様や提案をまとめた文書のことで、例え

misshiki 2026/04/07

PythonフォーラムでPEPクイズ。「3つ中2つ本物、1つ偽」を当てる形式。さらに実在するエイプリルフールPEPも混在。

Python

リンク

【10分で理解】次世代 Python Notebook「marimo」 - Qiita

はじめに今年も恒例のアドベントカレンダーの季節となり、なんのテーマで記事を書こうか？と、github上を彷徨っていたわけですが、jupyter等に変わる新たなpython notebookである、marimoがちょっと流行っていそうだったので、チュートリアルを触りつつ、記事にしてみようと思います。本稿について本記事では、marimo の公式チュートリアルを実際に操作しながらJupyter Notebook に比べた優位性を確認します。 marimoって jupyter notebookやjupyterlabは以下のようなモヤモヤポイントがありました。インタラクティブなUIには、別途、ipywidgets, Streamlit等が必要それ単独では、コードアシストや保管、ヒント等が若干貧弱1 あるセルの変数を更新しても、他のセルを再実行しないと変更が反映されない pythonコードを

misshiki 2026/04/06

marimoは次世代Python Notebook。*.py形式、リアクティブ実行、UI統合でJupyterの課題を解消。追加ライブラリ不要で変数更新やGit管理も容易。marimoはVS Codeで使いづらくて...改善されたかな。しかしAI時代でPythonファイル直のがいい

リンク

ラズパイをHDMI天気モニターに変えるPython製「StormShell」 - FabScene（ファブシーン）

Raspberry PiをHDMIで接続したモニターそのまま天気情報ディスプレイとして使いたいと思っても、デスクトップ環境の構築やブラウザの常駐は意外に手間がかかる。「StormShell」はその手間を省くために作られたPythonツールだ。Pythonの標準ライブラリだけで動作し、追加のパッケージインストールもAPIキーも不要。GitHubでMITライセンスのもと公開されている。ターミナル上にASCIIアートで天気情報をリアルタイム描画する仕組みで、気温・体感温度・湿度・風速・4時間予報を表示する。天気の状態に応じたアニメーション（晴れ・曇り・雨・雪・霧・嵐など11種類）が自動で切り替わり、日没後は星空と月の満ち欠けアニメーションに移行する夜間モードも備えている。月の満ち欠けはAPIなしでローカル計算する。気圧トレンドや大気質指数（AQI）、花粉情報も表示できる。 Raspberry

misshiki 2026/04/06

Python製「StormShell」でRaspberry PiをHDMI天気モニター化。API不要、ASCIIアート表示、夜間モードやAQIも対応。

リンク

Pythonが本当に分かりやすい言語かRubyと比較してみる。｜Hiroaki Satou

比較１Pythonの代表的な表記方法、リスト内包表記を例にして偶数だけ２乗にするコードはこんな風に書く # Python squares = [x**2 for x in a if x % 2 == 0]Rubyで同じことをするには # Ruby squares = a.select { |x| x.even? }.map { |x| x**2 } # または squares = a.filter_map { |x| x**2 if x.even? }こういうコードを書く比較２Pythonでは複雑な内包表記になる場合はジェネレーターを使う。下記はEffective Pythonより引用。 #python ジェネレータ式は () で囲んだリスト内包表記のような構文で生成します。以下のコードは、ファイルを読み込んで各行ごとの文字数を返す機能をジェネレータ式で実装したものです。ジェネレータ式

misshiki 2026/04/06

Pythonは簡潔だが暗黙表現多く複雑、Rubyは明示的で理解しやすい。Goはクラスなしで高速・シンプルだが表記が独特で分かりやすさは別軸。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (92)

Pythonに関するmisshikiのブックマーク (2,271)

お知らせ

月間はてなブックマーク数ランキング（2026年4月）

今週のはてなブックマーク数ランキング（2026年4月第4週）

今週のはてなブックマーク数ランキング（2026年4月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス