otori334のブックマーク - はてなブックマーク

otori334 id:otori334

ブックマーク / ja.stackoverflow.com (3)

Seleniumで取得保存したファイル名の特定
Ubuntu＋Python＋Selenium ご質問の前提条件から外れてしまいますが、 Selenium ではなく Puppeteer であれば、直接ダウンロードするパスとファイル名を指定する方法があります。 → puppeteer でファイルをダウンロードするときに、任意のパスと名前で保存する | Aqua Ware つぶやきブログ上記の記事は、 node.js + Puppeteer の例ですが、 pyppeteer を使うことで、以下のように Python でも同様の結果が得られます。 import os import asyncio # Fetch.enable に対応している Chromeimum リビジョンを指定 os.environ['PYPPETEER_CHROMIUM_REVISION'] = '884014' import pyppeteer event_loop =
otori334 2022/02/15
スクレイピング

印刷

Python

JavaScript

諸説
リンク
改行の、\nと\r\nの違いは何ですか？
\nはLF文字(Line Feed)、\rはCR文字(Carriage Return)と呼ばれる制御文字です。テキストの改行を表現する方法は、システムによって下記3パターンが存在します。その表現方法が使われている代表的なOSも併記しています。 \n(LF)：Unix系OS全般、Mac OS X \r\n(CR+LF)：Windows系OS \r(CR)：古いMac OS（9以前）コンピュータ上の表現としては\n1文字で扱うのが自然ですが、もともとタイプライター由来で\r\nが利用されていたという歴史的経緯があります。（CRが印字装置を左端に戻す動作＋LFが紙を1行分スクロールする動作）
$改行の、\nと\r\nの違いは何ですか？$
otori334 2022/02/08
制御

キーボード

電卓

歴史
リンク
線の太さを考慮した直線検出
ここでは、文字に対応する画素を「前景画素」と呼称して、一案を回答します。ハフ変換で検出できる「直線」とは、簡単にいえば「直線的な前景画素の並び」です。一方で、質問者さんがおっしゃる「太い線で書かれた文字」は、人間にとっては「太い線」かもしれませんが、画像上の画素の並び方でいえば、直線的な並びにはなっていないはずです。ですから、今回の問題の解法としてハフ変換は適していないと思います。対象画像がどのようなものかわからないのでなんとも言えませんが、代わりに「前景画素が密集している」ことが文字領域の特徴になり得ませんか？コメントを見ますと漢字が比較的多いとのことですので、文字以外の図形がスカスカの疎な線で描かれているのであれば、前景画素の局所的な密度が使えそうな気がします。具体的な処理例としては、テンプレートマッチングのように画像全体を適当な大きさのウィンドウで走査し、ウ
otori334 2021/05/28
画像処理
リンク
1