takamR1のブックマーク / 2017年3月24日

takamR1 id:takamR1

2017年3月24日のブックマーク (5件)

PythonでHTMLをパースする：HTMLParser
今回は Python の標準モジュールである urllib2 と HTMLParser クラスを使って Web 上のリソースにアクセスし、取得した HTML を解析する方法について説明します。 Web上からHTMLを取得 Python で Web 上にあるリソースにアクセスするためには urllib2 の urlopen() を使用します。以下のサンプルプログラムでは、指定した URLから HTML を取得し、その取得した HTML をそのまま表示しています。 # -*- coding: utf-8 -*- import urllib2 if __name__ == "__main__": url = "http://www.python.org" # Pythonの公式ページのURL response = urllib2.urlopen(url) # URLを指定してHTMLファイルを開
takamR1 2017/03/24
Python
リンク
HTMLParserでHTMLを解析する - YAMAGUCHI::weblog
動機そういえばXMLだけじゃなくてHTMLの解析もやってみたくなったから。方法 HTMLもXML系のパーサ使えばいいんだろうけど、HTMLParserってのがあるので使ってみました。使い方としてはざっくり下のコードみたいな感じ。 from HTMLParser import HTMLParser, HTMLParseError class TestHTMLParser(HTMLParser): def __init__(self): HTMLParser.__init__(self) def handle_starttag(self, tag, attrs): attrs = dict(attrs) # タプルだと扱いにくいので辞書にする print 'start', tag if 'div' == tag and 'class' in attrs: print '-->', attr
takamR1 2017/03/24
Python
リンク
html.parser — Simple HTML and XHTML parser
html.parser — Simple HTML and XHTML parser¶ Source code: Lib/html/parser.py This module defines a class HTMLParser which serves as the basis for parsing text files formatted in HTML (HyperText Mark-up Language) and XHTML. class html.parser.HTMLParser(*, convert_charrefs=True)¶ Create a parser instance able to parse invalid markup. If convert_charrefs is True (the default), all character references
takamR1 2017/03/24
Python
リンク
Python で HTML をパースする (HTMLParser)
HTMLParser で HTML を処理するPython に標準搭載されている HTML パーサである html.parser.HTMLParser は、イベントドリブンな HTML パーサです。 HTMLParser クラスを継承して独自のパーサを作成し、feed メソッドに HTML テキストを渡すことによってパースを開始します。下記のサンプルコードでは、開始タグ、終了タグ、テキストデータ、コメントが見つかったときに、それぞれ内容を出力しています。 sample.py from html.parser import HTMLParser # HTMLParser を継承してパーサクラスを作成する class MyParser(HTMLParser): def handle_starttag(self, tag, attrs): print("START :", tag, attrs
takamR1 2017/03/24
スクレイピング

Python
リンク
中嶋謙互～小学生が自力でプログラミングを学ぶと何が起こる？
この春小学4年生になる長男が「自分でシューティングゲームを作りたい」と言い出しました。最近購入した「ニンテンドークラシックミニファミリーコンピュータ」のゲームをいろいろプレーして影響を受けたようです。「グラディウス」と「メトロイド」はどちらが作るのが大変？「ドクターマリオ」みたいなゲームなら簡単なんじゃないか？みたいな想像を巡らせて、いらない紙に絵を描いてみたりしています。プログラマーの父としては願ってもないチャンスです。いろいろ考えて実際に長男に初めてのプログラミングに挑戦させてみました。その過程について今回は書いてみます。巷では小学生向けのプログラミング教育を小学校から始める議論があり、小学校低学年のうちからそのためにパソコンを与える家庭も多いだろうと思います。しかし結論から言うと今のところ私は、子供にパソコンを与えるのはもっと年齢が上がってからでよいと考えています。「ゲー
takamR1 2017/03/24
教育

プログラミング
リンク
- 2017年3月28日
- 2017年3月24日
- 2017年3月22日