エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
PythonでHTMLパース:リンクとアンカーテキスト抽出
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
PythonでHTMLパース:リンクとアンカーテキスト抽出
HTMLParserを利用してHTMLのタグ解析を行う。 特定のサイトにあるAタグを抽出して、リンクURLとアンカー... HTMLParserを利用してHTMLのタグ解析を行う。 特定のサイトにあるAタグを抽出して、リンクURLとアンカーテキストの組を作る。 さくらVPS CentOS 6.2 Python 2.6.6 ソースコード #!/usr/bin/env python # -*- encoding: utf-8 -*- import re from urllib import urlopen from HTMLParser import HTMLParser class out_link_parser(HTMLParser): def __init__(self): HTMLParser.__init__(self) self.links = {} self.linkurl = '' # aタグのみ処理を行い、href属性の内容をlinkurlに格納 def handle_starttag(self,