gouei2001のブックマーク / 2017年9月22日

gouei2001 id:gouei2001

2017年9月22日のブックマーク (2件)

Pythonでwebスクレイピングはじめの一歩 - Qiita
Python3とBeautifulSoup4を使ったwebスクレイピングの初心者向けの記事です。過去記事を参照しましたが、警告が表示されたりバージョンの違いからか動かないことがあったため、改めてまとめてみました。概要 webスクレイピングの基本的な処理は、以下のような流れになります。 ①webページを取得。 ②取得したページを要素を分割し、任意の箇所を取り出す。 ③データベースに保存。 ①のwebページの取得にrequest、②の処理にBeautifulSoup4を利用します。 ③については環境によって異なるため、この記事では説明を割愛します。準備 Python3をインストール後、 pipコマンドを使って、BeautifulSoup4、requests、lxmlの３つのパッケージをインストールします。
gouei2001 2017/09/22
BeautifulSoup

ALL

.a

P.A.

スクレイピング

文字列

メソッド

コマンド

title

コマンドプロンプト
リンク
スクレイピングのサンプル - Qiita
from urllib.request import urlopen from bs4 import BeautifulSoup from pprint import pprint URL = 'http://news.yahoo.co.jp/' with urlopen(URL) as res: html = res.read().decode("utf-8") soup = BeautifulSoup(html, 'html.parser') titles = soup.select('.ttl a') # domを取得 titles = [t.contents[0] for t in titles] # テキストを取得 pprint(titles) >>> ['トランプ氏「司法行き過ぎ」', 'PKO日報特別防衛監察を指示', '病院で投与ミス一時心肺停止', '特攻服の中学生ら
gouei2001 2017/09/22
BeautifulSoup

()

scraping

python

スクレイピング

URL

print

title

open

UTF-8
リンク
- 2017年9月24日
- 2017年9月22日
- 2017年9月19日

お知らせ

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx

はてなブックマーク

タグ

2017年9月22日のブックマーク (2件)

Pythonでwebスクレイピングはじめの一歩 - Qiita

スクレイピングのサンプル - Qiita

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第2週）

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

2017年9月22日のブックマーク (2件)

Pythonでwebスクレイピング はじめの一歩 - Qiita

スクレイピングのサンプル - Qiita

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第2週）

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

Pythonでwebスクレイピングはじめの一歩 - Qiita