タグ

ブックマーク / takahiromiura.github.io (1)

  • 動的 Web サイトのスクレイピング — Python で行う Web Scraping ドキュメント

    動的 Web サイトのスクレイピングYahoo news のトピックス一覧から、記事のタイトルを抜き出すことができた次は、EDINET を例にとりましょう。 EDINET で有価証券報告書を見れる会社の沿革が書いてある HTML 文書を保存しようと思います。 まず下準備として、EDINET のサイトにアクセスします。 書類検索 をクリックします。 画面左の 全文検索 をクリックします。 文字列に 沿革 と入力します。 書類情報を指定するのところで、書類種別を指定する をクリックします。有価証券報告書 にチェックをします。 書類の目次範囲を指定する をクリックし、大分類の最初の項を選択し、小分類の最初の項を選択します。 検索をクリックします。 新しいページが開いたら、そのページの URL をコピーします。 URL は次のようになるでしょう。 ここが、今回のスタート地点です。 url =

  • 1