タグ

2022年1月2日のブックマーク (3件)

  • 【Python】BeautifulSoupの使い方・基本メソッド一覧|スクレイピング | Let's Hack Tech

    Pythonを使ったWebスクレイピングの比較的メジャーなライブラリBeautifulSoupのメソッドを一挙紹介します。 このページを読めばBeautifulSoupのほとんどの動作、メソッドを確認することができます。 以下の目次は展開でき、逆引きリファレンスの形式になっていますので、調べたい操作がある方は、気になる箇所へすぐにジャンプできます。 BeautifulSoupとは 一言で言うと、HTMLをパースするPythonのライブラリです。 スクレイピングという処理は、HTMLの取得と解析の二段構成です。 僕はHTMLの取得にはrequestsというモジュールを使うことが多いです。 一応標準のライブラリでもあるにはあるんですが、Pythonのhttpアクセスのディファクトスタンダードはrequestsかなと個人的には思っています。

    【Python】BeautifulSoupの使い方・基本メソッド一覧|スクレイピング | Let's Hack Tech
  • BeautifulSoup4のfind_allでタグを全てぶんまわす - なるぽのブログ

    目次 BeautifulSoup4のfind_allの使い方 find_allの構造 name(第1引数) attrs(第2引数) recursive(第3引数) text(第4引数) limit(第5引数) kwargs(第6引数) find_all()の返り値 タグ名を指定して要素を全て得る 複数のタグ名を指定して要素を全て得る 属性を指定して要素を得る 再帰をやめる テキストを指定して要素を得る 再帰上限数を指定する タグ名とクラス名を指定して要素を得る タグ名とID名を指定して要素を得る クラス名を正規表現で指定して検索し要素を得る おわりに 参考 BeautifulSoup4のfind_allの使い方 プログラミング言語のPython(パイソン)にはHTML/XMLをパースする外部ライブラリがあります。 その名も「BeautifulSoup4(ビューティフル・スープ・フォー)」で

    BeautifulSoup4のfind_allでタグを全てぶんまわす - なるぽのブログ
  • ベンダーロックインを解きほぐしていくために。AWSからホワイトペーパーを発行。 | Amazon Web Services

    Amazon Web Services ブログ ベンダーロックインを解きほぐしていくために。AWSからホワイトペーパーを発行。 今回のブログでは「ベンダーロックイン」についてどう考えれば良いか、どのように影響を回避することができるのか────AWSの知見をまとめたホワイトペーパーの概要を紹介します。 ご不明の点、「Contact Us」までお問合せください。(以下、グローバル・チームが執筆したホワイトペーパーの要旨紹介となります。) 邦訳完成: ベンダーロックインを解きほぐしていくために 2021年6月に 『Unpicking Vendor Lock-in』と題された英語版のホワイトペーパーが発行されました。今回、 日語版『ベンダーロックインを解きほぐしていくために』のダウンロードが可能となりましたことを、お知らせします( こちら)。────下記のような論点を踏まえることで、”難問”とし

    yasu-osu
    yasu-osu 2022/01/02
    「AWS のサービスは、 AWS “への” データの移行と AWS “からの” データの移行の両方をサポートするために設計されています。」と言い切る所が素敵。