[B! スクレイピング] lax34のブックマーク

lax34 id:lax34

スクレイピングに関するlax34のブックマーク (12)

pythonを使った株価の自動収集 - Qiita
Register as a new user and use Qiita more conveniently You get articles that match your needsYou can efficiently read back useful informationYou can use dark themeWhat you can do with signing up
lax34 2020/02/19
Qiita

python

AI

csv

api

スクレイピング
リンク
実践/現場のPythonスクレイピング - Qiita
!! ======================== !! ※この記事は2019年の記事です。この記事で紹介している内容は2019年当時の内容である事を理解した上で、実際に設定する際は最新の情報を確認しながら行ってください。 !! ======================== !! SeleniumはE2Eテストの自動化などで大きな力を出してくれます。今回の記事では、下記の内容をまとめてみます。色々なユースケース抜け漏れ対策のwait.until()関数 => 実務ではとても重要 IDやClassが無くても、AltやPlaceholderなどから力技で抽出する技パスワード系無限スクロール系必要なツールをまずは揃える Python3.7 ChromeDriver https://sites.google.com/a/chromium.org/chromedriver/dow
lax34 2019/03/20
python

スクレイピング

scraping

ブラウザ

Qiita

あとで読む
リンク
「Pythonクローリング&スクレイピング」という本を書きました - orangain flavor
2016-12-23更新: 電子書籍書籍版の情報を更新しました。電子書籍版も好評発売中です！ Pythonを使ってクローリング・スクレイピングを行い、データを収集・活用する方法を解説した書籍です。 Pythonの基本から、サードパーティライブラリを使ったスクレイピング、様々なサイトからのデータ収集・活用、フレームワークScrapyの使い方、クローラーの運用までを扱っています。 Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド- 作者: 加藤耕太出版社/メーカー: 技術評論社発売日: 2016/12/16メディア: 大型本この商品を含むブログ (3件) を見るクローリング・スクレイピングとPython Pythonは言語自体の書きやすさ、ライブラリが充実していること、データ解析との親和性が高いことなどから、クローリング・スクレイピングに向いている言語です。
lax34 2016/11/24
python

スクレイピング

scraping

プログラミング
リンク
Google スプレッドシートで株価情報とか取得しちゃいましょう。 - 5億円稼いだらニートになるんだ。
初めに Googleスプレッドシート知ってるかな？オンラインで使えるエクセルみたいなもんなんだけど。エクセルは知らない人は、ググれ。さすがにそこまではフォローせんわ。僕はさぼてん君派です。っていう人いたらなかなかマニアック。私は株データとか管理するのにGoogleスプレッドシートを使ってるんですけど、なぜかというと、こうやってブログに公開しやすいから。 rilakkuma.hatenadiary.jp ちなみに今こんなん作ってます。証券コードを入れれば会社名とかデータが出ちゃうって寸法ですわ。おーこりゃ便利って思う？単純に管理とかデータ見つけるならそれ用のアプリ使った方がいいんじゃないかなって私は思います。 Googleスプレッドシートを使う前に使うにはまずグーグルアカウント登録しないとダメです。作り方？いろんなホームページとかで解説されてるからググろうぜ。ここはや
lax34 2016/05/20
google

株

スプレッドシート

投資

スクレイピング
リンク
まだmechanizeで消耗してるの? WebDriverで銀行をスクレイピング（ProtractorとWebdriverIOを例に） - 詩と創作・思索のひろば
今日はスクレイピングの話をします。今回のターゲットは三菱東京UFJダイレクト。金融機関もウェブサービスを提供するようになり、金にまつわる情報を電子化しやすくなりましたが、かれらが API を提供しているわけではないので、私たちのほうで取得・加工をしてやる必要があります。今やウェブサイトであれば当然のように JavaScript を使っているわけなので、いわゆる mechanize、つまり HTML の解釈をおこない、リンクのクリックやフォームの送信をシンプルに実装するようなやり方でのスクレイピングはすでに無理筋だといえます。もちろん今日においてはブラウザオートメーションという方法がすでにありますので、これを利用してやれば、なんの憂いもなく実際に人間が使うようなブラウザをプログラマティックに操作することができます。現在は Selenium WebDriver がデファクトで、これが使用す
lax34 2014/12/16
selenium

scraping

webdriver

スクレイピング
リンク
Webスクレイピングの注意事項一覧 - Qiita
[2020/09/09追記] 本記事の内容は著作権法改正より前に記載されたものです。最新の情報をご確認下さい。 * 著作権法の一部を改正する法律（平成30年法律第30号）について | 文化庁 * 令和2年通常国会著作権法改正について | 文化庁上記に関連して、次の記事を記載致しました。 * 【2020年度版】個人用クローラーの開発手順とその注意点 - Qiita はじめに Webスクレイピングで誰も嫌な思いをしなくて済むように、注意事項一覧を作りました。ただ、法律の専門家による解釈ではないので責任は取れません。この記事は、クリエイティブ・コモンズのCC-BYで公開致しますので、ご自由にご改修下さい。データをダウンロードする時目的は下記のものに限る。 * 個人や家族間で使用する * Web検索サービスを提供する * 情報解析をする ※参考：著作権法第30条・著作権法第47条(6
lax34 2014/07/28
スクレイピング

web
リンク
PHPでのスクレイピングやDOM操作をjQueryっぽく超簡単便利にできる「phpQuery」:phpspot開発日誌
phpmaster | Server-Side HTML Handling Using phpQuery PHPでのスクレイピングやDOM操作をjQueryっぽく超簡単便利にできる「phpQuery」。紹介記事を読んで使ってみました。 phpQuery はjQueryのPHP版でDOMの操作をjQueryっぽくできるライブラリです。 HTMLのスクレイピングはもちろん、HTMLを追加したり要素に属性を追加等のDOMを操作も簡単に行えます。 jQueryの便利さがPHP上でも十分に使えますので知っておくと確実に面倒な処理を楽に書けるようになるでしょう。スクレイピング HTMLのスクレイピングをする場合には超簡単かつ、jQueryを使ったことがある方なら抵抗なくすぐに習得できます。ちょっとコードを書いて実験してみました。と書くと <div id="two"></div>の中身である t
lax34 2012/06/18
dom

html

jquery

jQuery

pq

スクレイピング

php
リンク
WebスクレイピングライブラリGoutteで遊んでみる - hnwの日記
新年あけましておめでとうございます。今年もボチボチやっていきます。本稿ではPHP製のWebスクレイピングライブラリGoutteを紹介します。 Goutte（グット）とは Goutteは必要十分な機能を持ったWebスクレイピングライブラリです。そもそもWebスクレイピングというのは、外部Webページから必要なデータを取ってくるくらいの意味です。つまり、GoutteはWebスクレイピングを簡単に行う道具だと考えればいいでしょう。具体的には、GoutteはWebクローラとHTMLパーサを組み合わせたようなものです。Cookieやフォームの扱いなどWebブラウザとしての機能は一通り揃っていますし、CSS風の要素指定もできるなど、機能面では他のライブラリと遜色ないように感じます。さらに僕個人がGoutteに期待している点は、安定性とロングサポートです。Goutteは主要機能をSymfony2お
lax34 2012/01/16
symfony2

Request

php

library

スクレイピング

Goutte
リンク
node.jsとjQueryでスクレイピングするウェブアプリの作り方
やっぱ jQuery 便利ですよ(*´・ω・)(・ω・｀*)ﾈｰセレクタ使って jQuery でダカダカやってると、DOM とか正規表現でネチネチやるのがバカらしくなっちゃいます。と日頃から思ってたりしてまして、サーバサイド JavaScript がメインストリームになって、jQuery でウェブアプリをコーディングできれば超ラクできるかもと期待しています。で、先日サーバサイドJavaScriptとjQueryでスクレイピングという記事をうpったところ、やっぱ Rhino じゃなくて node.js がえーんよ(´･ω･｀)というコメントを頂きましたので、node.js と jQuery でサーバサイド JavaScript スクレイピングしてみることにしました。今回は node.js ですので、単にスクレイピングする（コマンドラインから実行する）スクリプトだけじゃなくて、スクレイ
lax34 2011/02/02
node.js

js

jQuery

jquery

あとで読む

JavaScript

スクレイピング
リンク
サーバサイドJavaScriptとjQueryでスクレイピング
jQuery でスクレイピングできたらセレクタ使えるし便利かなーと思ったりしたんですが、Rhino と env-js を使うと超簡単にできたのでレポートしてみます。 Rhino と env-js って何ぞい？ Rhino ってのは Java で書かれた JavaScript エンジンです。Rhino を使うとコマンドラインから JavaScript を実行できます。 Rhino には DOM が無いので単体では jQuery を実行することはできませんが、env-js という DOM ライブラリを使用するとこの辺はクリアできます。 env-js の中に jQuery を使ったサンプルがいくつか入ってますので、Java とか JavaScript とか詳しい方はそちらを見てもらった方が早いと思います。使ってみるまず env-js をビルドしないといけないのでその辺の手順から説明します。
lax34 2011/01/08
js

jQuery

jquery

javascript

スクレイピング
リンク
HTMLをDBみたいに使えるスゴイライブラリ『htmlSql』を CakePHPで使う - h2ospace - builder by ZDNet Japan
APIやRSSなどを提供しているサイトは、情報を簡単に扱うことができますが、例えば Yahoo!の検索結果とか、mixiのニュースとか、あるサイトの一部を取り出したいことってよくあります。（とはいえ、著作権違反には注意そんな時、PHPのライブラリである「html Sql」を利用すると便利。このライブラリに、ファイルでもURLでも文字列でも、HTMLで作られたものなら何でも与えると、解析して取り出しやすくしてくれます。しかも、その取り出し方はSQL！例えば、「id属性が’test’の p要素の内容を取り出したい」という場合には、次のようなSQLを使います。 SELECT text FROM p WHERE $id=="test" 超パワフル。ということで、これを CakePHPで利用するためのテクニック。まずは、ダウンロードしたファイルの中から次のファイルを「app/vendors」フォ
lax34 2010/07/13
php

SQL

html

ライブラリ

解析

db

プログラミング

スクレイピング
リンク
PHPでHTMLをパースする。 - purazumakoiの[はてなブログ]
スクレイピングをやってみる HTML Parserを使います。参考リンク HTML Parser for PHP:WEB管理者の為の総合ポータルサイトBenzo 研究開発:PHP HTML-parserの使い方 - livedoor Blog（ブログ）今回はクックパッド（COOKPAD）の「話題のレシピ」の情報を取得します。 ※クックパッドの表示系が変わったら動かなくなります。(2009/08/04動作確認済) 抽出元 COOKPAD demo スクレイピングテストソース（UTF-8） <?php // ライブラリを読み込む require_once('../lib/htmlparser.inc'); // まずはソースを一括取得するURLを指定 $parser = HtmlParser_ForURL("http://cookpad.com/"); // パースを行う while (
lax34 2009/03/09
php

html

スクレイピング
リンク
1