「Web-Scraper」を検索 - はてなブックマーク

1 - 40 件 / 492件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

Web-Scraperの検索結果1 - 40 件 / 492件

Librahack ：容疑者から見た岡崎図書館事件
- 880 users
- librahack.jp
- 暮らし
- 2010/06/20
出来事の詳細 3/13 新着図書データベースを作るためクローリング＆スクレイピングプログラムを作成したちょうどその頃、市場調査を行うためにECサイトのスクレイピングプログラムを作っていた。そのついでに、前々から構想していたLibra新着図書Webサービスを作ろうと思った。市場調査プログラムの一部をカスタマイズして、新着図書データベース作成プログラムを作った。この時、市場調査プログラムと新着図書データベース作成プログラムは同じプログラム内にあり、パラメータでアクションを指定して振り分けていた。 Webサービスを作ろうと思った動機は「なぜプログラムを作ったか」の通り。 Webサービスの概要は「どんなプログラムを作ろうとしていたか」の通り。普段読む本を入手する流れ：1. Amazonの各カテゴリの売れ筋をチェックしてレビューを確認し読むかどうか決める（または、書評ブログや新聞などのメディアで
- 事件
- security
- セキュリティ
- 図書館
- librahack
- web
- まとめ
- programming
- プログラム
- 司法
今日のCPANモジュール（跡地）目次
- 738 users
- e8y.net
- 暮らし
- 2007/05/25
Redirecting… Click here if you are not redirected.
- perl
- cpan
- webscraper
- scraper
- scraping
- module
- encode
- dbic
- programming
- *perl
簡単！たった１３行のコードでHTML取得＆解析をするPerlスクリプト - DQNEO起業日記
- 656 users
- dqn.sakusakutto.jp
- 暮らし
- 2010/06/05
１３行のコードで、Yahoo!Japanのトピックス一覧を取得する！ PerlでHTML取得・解析したいときはLWP::UserAgentとHTML::TreeBuilderというのを使うと簡単にできます。 LWP::UserAgentを使うと、Webページの取得ができます。 HTML::TreeBuilderを使うと、HTMLのDOM解析ができます。この２つのモジュールを使って、Yahoo!Japanのトピックス一覧を取得してみましょう。コメント行と空行を除くとたったの１３行です。 use strict; use warnings; use LWP::UserAgent; use HTML::TreeBuilder; # urlを指定する my $url = 'http://www.yahoo.co.jp'; # IE8のフリをする my $user_agent = "Mozilla
- perl
- HTML
- スクレイピング
- プログラミング
- 解析
- programming
- tips
- scraping
- web
- あとで読む
PythonとかScrapyとか使ってクローリングやスクレイピングするノウハウを公開してみる！ - orangain flavor
- 611 users
- orangain.hatenablog.com
- テクノロジー
- 2014/01/04
2016-12-09追記「Pythonクローリング&スクレイピング」という本を書きました！ Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド- 作者: 加藤耕太出版社/メーカー: 技術評論社発売日: 2016/12/16メディア: 大型本この商品を含むブログを見る 2015年6月21日追記：この記事のクローラーは動かなくなっているので、Scrapy 1.0について書いた新しい記事を参照してください。 2014年1月5日 16:10更新：デメリットを修正しました。以下の記事が話題になっていたので、乗っかってPythonの話を書いてみたいと思います。 Rubyとか使ってクローリングやスクレイピングするノウハウを公開してみる！ - 病みつきエンジニアブログ複数並行可能なRubyのクローラー、「cosmicrawler」を試してみた - プログラマにな
無料Webクローラー「EasySpider」　プログラミングスキル不要、マウスクリックだけで操作可能
- 510 users
- www.itmedia.co.jp
- テクノロジー
- 2023/07/12
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 シンガポール国立大学と中国の浙江大学に所属する研究者らが発表した論文「EasySpider: A No-Code Visual System for Crawling the Web」は、Excelを使用するように視覚的にWebスクレイピングタスクを設計し、実行できるカスタマイズ可能なWebクローラーシステムを提案した研究報告である。公式ページはこちら。このシステムは、マウス操作のGUI（Graphical User Interface）を使用して提供されており、コーディングの経験がなくても使えるため、ノンプログラマーでも簡単にタスクを設
WebスクレイピングライブラリGoutteで遊んでみる - hnwの日記
- 469 users
- hnw.hatenablog.com
- テクノロジー
- 2012/01/16
新年あけましておめでとうございます。今年もボチボチやっていきます。本稿ではPHP製のWebスクレイピングライブラリGoutteを紹介します。 Goutte（グット）とは Goutteは必要十分な機能を持ったWebスクレイピングライブラリです。そもそもWebスクレイピングというのは、外部Webページから必要なデータを取ってくるくらいの意味です。つまり、GoutteはWebスクレイピングを簡単に行う道具だと考えればいいでしょう。具体的には、GoutteはWebクローラとHTMLパーサを組み合わせたようなものです。Cookieやフォームの扱いなどWebブラウザとしての機能は一通り揃っていますし、CSS風の要素指定もできるなど、機能面では他のライブラリと遜色ないように感じます。さらに僕個人がGoutteに期待している点は、安定性とロングサポートです。Goutteは主要機能をSymfony2お
- php
- スクレイピング
- scraping
- ライブラリ
- library
- symfony
- web
- css
- WEB技術
- Symfony2
PHPでのスクレイピングやDOM操作をjQueryっぽく超簡単便利にできる「phpQuery」:phpspot開発日誌
- 416 users
- phpspot.org
- テクノロジー
- 2012/06/18
phpmaster | Server-Side HTML Handling Using phpQuery PHPでのスクレイピングやDOM操作をjQueryっぽく超簡単便利にできる「phpQuery」。紹介記事を読んで使ってみました。 phpQuery はjQueryのPHP版でDOMの操作をjQueryっぽくできるライブラリです。 HTMLのスクレイピングはもちろん、HTMLを追加したり要素に属性を追加等のDOMを操作も簡単に行えます。 jQueryの便利さがPHP上でも十分に使えますので知っておくと確実に面倒な処理を楽に書けるようになるでしょう。スクレイピング HTMLのスクレイピングをする場合には超簡単かつ、jQueryを使ったことがある方なら抵抗なくすぐに習得できます。ちょっとコードを書いて実験してみました。と書くと <div id="two"></div>の中身である t
- php
- スクレイピング
- jquery
- jQuery
- dom
- html
- scraping
- プログラミング
- web制作
- *web制作
Firebugクックブック #1 - bits and bytes
- 314 users
- labs.gmo.jp
- 暮らし
- 2008/08/22
最近の中学生のはじめてのプログラミング言語がJavaScriptだったりするこの時代、最も使いやすいJavaScriptの実行環境であるFirebugは現代のコマンドラインです。UNIXコマンドラインでgrepやuniqを使って、日常の細々した処理を行うのと同じようにFirebugとjavascriptを使いこなせると、日常作業のちょっとしたことをさくっとこなすことができます。ちょっとした作業だから手作業でやってもいいけど自動でやればミスったりしないし、気分的には楽なので自動でやりたい、という作業がけっこうないでしょうか。例えば、ページの中の特定の部分の文字列をリストにしてテキストファイルに保存したい、とか。そこで今回は私が普段よくやっている単純作業をFirebug+javascriptでさくっとかたづける方法を2回にわけてご紹介します。ページの中からテキストや属性の値を拾うページの
- firebug
- javascript
- firefox
- programming
- tips
- プログラミング
- tutorial
- extension
- tool
- firefox拡張
「PHPなめんな」と「(Perl|Python|Ruby)をなめんな」の違い : 404 Blog Not Found
- 273 users
- dankogai.livedoor.blog
- 暮らし
- 2008/01/29
2008年01月29日16:00 カテゴリLightweight Languages 「PHPなめんな」と「(Perl|Python|Ruby)をなめんな」の違い Matzさんの意見に、想定内の反応が返って来ている。 Matzにっき(2008-01-26) - [言語] Attacking PHP PHPがいかに駄目な言語か、という話。どの言語で書いてもおかしなコードを書く奴は書く。perlでもjavaでもrubyでも、どの言語で書いてもSQLインジェクションやらXSS脆弱性やらを作りこむ奴は作りこむ。ただそれだけの話というか、別な話だろう。両方とも事実だし、foo言語のuserがbar言語がいかに駄目かを語るというのは有史以前(コンピューター言語以前に自然言語でもある)からの話題なのだが、しかし"PHP sucks"には他とかなり異なる点が一つあるように見受けられる。それは、PHP
- php
- dankogai
- programming
- perl
- プログラミング
- ruby
- python
- 小飼弾
- プログラミング言語
- 言語
Webスクレイピングとは？Pythonで始めるWebスクレイピング実践・活用法 - RAKUS Developers Blog | ラクスエンジニアブログ
- 239 users
- tech-blog.rakus.co.jp
- テクノロジー
- 2020/10/30
はじめに Webスクレイピングの基本事項 Webスクレイピング(Scraping)とは Webスクレイピングの活用シーン Webスクレイピングの基本的な仕組み Webスクレイピングの注意事項取得先への攻撃とみなされたり、規約違反や、著作権法違反に問われることもある取得先の変更に影響を受ける取得先がAPIを公開しているならそちらを活用する方が良い Webスクレイピングの実践方法 Webスクレイピングを実践するには 1. ベンダーのサービスやツールを利用する 2. 自分でプログラムを作成するなぜPythonなのか？ Pythonでのスクレイピング実践方法事前準備 BeautifulSoup4のインストール模擬Webサイトの構築 Webサーバーを立ち上げる初級編：特定の要素から単一の要素を抜き出す中級編：あるページから繰り返しを伴う複数の要素を抜き出す上級編：複数のページから複
[O] これから15分で Remedie を始めるための資料
- 238 users
- overlasting.dyndns.org
- 暮らし
- 2009/01/08
« ぎんなんの封筒チン | トップページこれから15分で Remedie を始めるための資料 [Perl] Remedieを使い始めたので、さっそく手順をまとめました。この資料を15分くらいかけて上から下まで読み、 Mac OSX やDebian Linuxにインストールすると、割とあっさり、Remedieが動かせると思います。 Remedieとは Remedie は Perl で書かれたプラガブルなメディアセンターアプリケーションです。 Plaggerを生んだ、miyagawaさんによるアプリです。 - Plagger - Trac -- http://plagger.org/trac Remedieに、さまざまな動画ファイルの更新情報を登録することで Remedieは、自分のお気に入り動画で埋め尽くされた自分専用の動画閲覧インターフェイスになってくれま
- remedie
- perl
- plagger
- install
- miyagawa
- movie
- git
- 動画
- video
- まとめ
Webスクレイピングライブラリ "Yasuri" をリリースしました - Qiita
- 231 users
- qiita.com/tac0x2a
- テクノロジー
- 2015/05/05
はじめにこんにちは．私はWebスクレイピングが大好きなのですが、Rubyでもっと簡単にスクレイピングができればと思い、ライブラリを書いてみました．ようやくREADMEとUSAGEが書けたので公開しようと思います．ソースはGithubで公開しています．特にドキュメントの英語が大変怪しいので、つっこみいただけると喜びます． tac0x2a/yasuri gemでも公開しているので、以下のコマンドで簡単にお試しできます．簡単なサンプルと解説を書いてみました． Yasuriでお手軽スクレイピングよろしければ使ってみてください＞＜ Yasuri とは Yasuri (鑢) は簡単にWebスクレイピングを行うための、"Mechanize" をサポートするライブラリです． Yasuriは、スクレイピングにおける、よくある処理を簡単に記述することができます．例えば、ページ内の複数のリンクを
- ruby
- scraping
- スクレイピング
- mechanize
- gem
- プログラミング
- あとで読む
- rails
- Code_Ruby
- qiita
岡崎市立中央図書館事件 #librahack について愛知県警に電話して聞いてみた | [ bROOM.LOG ! ]
- 217 users
- blog.rocaz.net
- 暮らし
- 2010/06/24
ニコニコPodder iPhone/iPod/iPad対応ニコニコ動画簡単インポートツール aggregateGithubCommits GitHubレポジトリでのコミット数をAuthor/期間別に集計します probeCOCOATek 新型コロナ接触確認アプリCOCOAが配布するTEKを表示・集計連日Twitterでは #librahack ハッシュが大盛況だが、個人的には事実関係でよく分からないことも多く明白にしたいことではあったので、直接愛知県警に電話して事情を聞いてみました。岡崎署ではなく愛知県警なのは、そちらが事件捜査の主体的な役割を担っただろうと判断したからです。対応して頂いたのは生活経済課の方。お名前は出しません。愛知県警ではこの課がサイバー犯罪を担当しているそうです。担当して頂いた方は割と若めで理路整然と話したいクールなタイプ。多少警戒されて話されていたのが印象によく
- librahack
- 警察
- 事件
- security
- 犯罪
- web
- 図書館
- ネット
- 社会
- これはひどい
てきとうにクリックしたらてきとうにWeb::Scraperのコードを作ってくれるWebScraper IDE - bits and bytes
- 212 users
- labs.gmo.jp
- 暮らし
- 2008/03/12
まえに作ったWeb::Scraperのjavascriptバージョンwebscraper.jsとXPathをてきとうに作ってくれる機能を追加したwebscraperp.jsにHTMLのドキュメントから繰り返し部分をみつけてSITEINFOをつくるAutoPagerize Iteration Detectorみたいなみためをくっつけて、取り出したい部分をクリックしたらてきとうにXPathを生成してWeb::Scraperのコードにして出してくれるFirefoxのextensionを作りました。Firefox3専用です。ごめんなさい。ダウンロード WebScraper IDE (for Firefox3) 使い方今回もいつもお世話になっているスターバックスさんの店舗検索結果(住所・店名・条件から探す)を例に使い方をご紹介します。 WebScraper IDEをインストールするとツールメニュ
- webscraper
- firefox
- xpath
- perl
- scraping
- javascript
- scraper
- extension
- スクレイピング
- これはすごい
ニコニコ動画をソフトバンク携帯で見られるようにしてみた - saiten@blog
- 166 users
- saiten.hatenablog.com
- 暮らし
- 2007/12/15
2008/10/21 サービスとして公開しました。→[id:saiten:20081020:1224522031] ニコニコ動画モバイルという携帯からニコニコ動画を閲覧できるサービスがあるんですが、携帯3キャリアのうち、なぜかソフトバンクだけは今年の4月開始時から未だに対応していません。私的には1日1回ランキングを一通りチェックする程度には利用しているので、これを通学の時間帯に行えたらなぁ、と思ってたんですが、なかなかそんな話が出てこない。RC2開始時には対応するだろうと思ってたんですがモバイル関連の発表すらなかったですし。そういうわけで学園祭が終わってひと段落が着いていたのと、バイト先のネタ作りも兼ねて自分でニコニコ動画モバイルのソフトバンク版を作ってみることにしました。百聞は一見にしかず。とりあえず動画を作ってみたので見てみてください。参考までに一応他のキャリアで見た場合の動画も
Web::Scraper - naoyaのはてなダイアリー
- 165 users
- naoya-2.hatenadiary.org
- 暮らし
- 2007/05/09
Today I've been thinking about what to talk in YAPC::EU (and OSCON if they're short of Perl talks, I'm not sure), and came up with a few hours of hacking with web-content scraping module using Domain Specific Languages. 使ってみたよ! #!/usr/local/bin/perl use strict; use warnings; use FindBin::libs; use URI; use Web::Scraper; use Encode; use List::MoreUtils qw/uniq/; my $links = scraper { process 'a.key
- perl
- cpan
- scraping
- scraper
- webscraper
- scrapi
- スクレイピング
- naoya
- miyagawa
- web-scraper
tokuhirom blog
- 146 users
- blog.64p.org
- 暮らし
- 2009/03/24
Blog Search when-present<#else>when-missing. (These only cover the last step of the expression; to cover the whole expression, use parenthesis: (myOptionalVar.foo)!myDefault, (myOptionalVar.foo)?? ---- ---- FTL stack trace ("~" means nesting-related): - Failed at: ${entry.path} [in template "__entry.ftlh" at line 3, column 25] - Reached through: #include "__entry.ftlh" [in template "entry.ftlh" at
- perl
- webscraper
- cpan
- libxml
- web-scraper
- scraping
- XML
- html
- module
- xpath
Feed43: Convert web pages into professionally looking RSS feeds.
- 130 users
- feed43.com
- 暮らし
- 2006/01/25
Convert web pages into professionally looking RSS feeds. Create your first RSS feed How it works | FAQ I wish all my favorite sites provided RSS feeds. Wait no longer! Create RSS feeds for all websites you care about and read them from the comfort of your feed reader. Pro tip: You can create and use your feeds for free and even without creating an account! However, registering an account will give
- rss
- feed
- webサービス
- webservice
- generator
- web2.0
- ツール
- tool
- Web
- ajax
Perlを使って脆弱性を検証する：CodeZine
- 130 users
- codezine.jp
- 暮らし
- 2007/09/20
はじめに今回はXSSの脆弱性をチェックするPerlスクリプトを作成したいと思います。すべてのXSSによる脆弱性が回避できるわけではありませんが、テストコード作成のヒントになれば幸いです。対象読者 Webアプリケーション開発者で、XSSのテストケースを作成したい方。必要な環境 Perl 5.8以上が動作する環境。基本動作の確認はMac OS Xを利用しました。次のPerlモジュールを利用するので、あらかじめインストールしておいてください。 Template::Toolkit Web::Scraper Test::Base またCGIを使用するので、ApacheなどのCGIが実行できるWebサーバを用意してください。解説内容ソースコード解説まず最初にソースコードの解説をします。 xss.pl
- perl
- xss
- security
- セキュリティ
- webscraper
- test
- 脆弱性
- テスト
- プログラミング
- web
Big Sky :: Gistyで始めるGist/Githubのススメ
- 128 users
- mattn.kaoriya.net
- 暮らし
- 2008/12/16
最近Githubをよく使っているのですが、どうしてもGithubといえばプロジェクト管理なイメージがあり、プロジェクトを持ってない人から見ると少し遠い存在にみえがちです。ですが、ちょっとしたスクリプトを書きたい人、しかもリモートにもリポジトリを置きたい人いますよね。そんな時に便利なのがGistです。「Gistというと、単なるコードスニペットサービスでしょ？」と思われるかもしれませんが、Gistの凄いところはちょっとしたスクリプトをソース管理出来る所です。以下、簡単なperlスクリプトをソース管理しながら完成まで仕上げる過程を例を持って示してみます。ただし、ここで言っておきたい事が一つ。Gistを便利に使う為のツール、Gistyを入れるべきです。 GistyはGistにポストすると同時に所定の場所にgit cloneしてくれ、初期ポストからコーディング開始までをスムーズに促してくれま
- gist
- git
- github
- programming
- scm
- tutorial
- tool
- 開発
サイトのクローリングにはScrappyがすごくいいかもしれない - Perl勉強メモ　アルパカDiary出張版
- 127 users
- tori243.hatenadiary.org
- 暮らし
- 2011/07/10
クローリング楽しいですよね！ perlで高速にクロールしたいのであればGunghoなど使うのがいいかもしれませんが、基本手軽にやりたいことが多いので WWW::Mechanize+Web::Scraper という組み合わせでクロールするのが定番でした。しかしたまたま Scrappy を知り、少し触ってみたところすごくいいのではないか！？と思い記事にしてみました。*1 基本系(crawlコマンドを利用する場合) my $scrappy = Scrappy->new; $scrappy->crawl('１．クロールするルートURL', '２．URLにマッチするパス' => { '３．コンテンツにマッチするxpath or CSSセレクタ' => sub { my ($self, $item) = @_; # ４．キューに追加 $self->queue->add($item->{href
- perl
- スクレイピング
- crawler
- scraping
- cpan
- scraper
- library
- programming
- クロール
- web
ブログが続かないわけ | Web::Scraper 使い方(超入門)
- 124 users
- en.yummy.stripper.jp
- 暮らし
- 2007/05/13
３年前にこの本に出会って、僕はスクレーピングの虜になった。おかげで正規表現をたくさん書く機会が得られたし、CPANのモジュールともたくさん触れ合うことができたし、さらに自分自身でも構造化されたHTMLを書く習慣も身についた。ただ、やっぱり、スクレーピングは簡単ではない部分もたくさんあると思う。文字コードについても意識しなければならないし、なにより正規表現で必要な部分を抽出することそのものが結構骨のいる作業だ。HTML::TreeBuilder を使った方がいいのか、それとも正規表現だけでやったほうが楽なのか。そんなことを考慮しながらコーディングして行く。そこがスクレーピングの楽しいところでもあるのだが、そこがスクレーピングの敷居を高いものにしていることも否めない。そんな、愛らしくもあり憎たらしくもあるスクレーピングを簡単にやってしまうのがこのモジュール、Web::Scraper だ。
- perl
- scraping
- webscraper
- cpan
- スクレイピング
- scraper
- web-scraper
- programming
- HTML
Mac OSXでPerlの環境を整える | Heart Beat
- 122 users
- poccori.com
- テクノロジー
- 2008/04/06
*2010/08/12追記まずはMacportsのインストール PerlのインストールにもMacportsを使うと/opt/local以下にインストールしてくれるのでオススメします。 MacのデフォルトのPerlのインストールディレクトリを汚さないですし、アンインストールやアップグレードなどのバージョン管理もできるパッケージ管理ツールです。 MacPortsとは？ MacPorts(旧名DarwinPorts)というのはパッケージ管理ツールで、UNIX向けのオープンソースソフトウェアをダウンロード、configure、make、インストール、そのパッケージ使用するのに必要な他のパッケージも一緒にインストールなど面倒な作業をすべて代わりにやってくれる便利なソフト。 source: Macports – Macの手書き説明書事前にXcodeTools、X11をMacに付属しているインストー
- perl
- cpan
- mac
- osx
- programming
- インストール
- MacOSX
- Mac OS X
- プログラミング
- macports
HTMLをスクレイピングして解析(パース)する - まるさんかくしかく Tech学習と入門ログ
- 115 users
- marusankakusikaku.jp
- 暮らし
- 2007/04/14
Twitter Facebook B! Bookmark LINE Pocket Feedly HTMLをスクレイピング(scraping)してあれこれとするとき、僕はずっと正規表現に頼っていたのですが、ページの構造が変化するとすぐに使えなくなってしまうし、時間がかかる割りに退屈な作業なので何とかならないかなと思っていました。 PHPで探していたのですが、XML(とかRSS)をパースする関数やライブラリは、良く目にするものの、HTMLを処理できるものはなかなか見つかりませんでした。以下は、PHP(とかRuby、Perl)でHTMLをスクレイピングしたりパースするための方法。 PHPでスクレイピング＆パース HTMLを整形式のXML文書に修正するPHPクラス HTMLを、整形式のXMLに変換してくれるライブラリ。PEARのXML_HTMLSax3が同梱されているので、これだけでちゃんと動
- php
- scraping
- スクレイピング
- html
- xml
- perl
- ruby
- programming
- まとめ
- webdevelopment
GitHub - ripienaar/free-for-dev: A list of SaaS, PaaS and IaaS offerings that have free tiers of interest to devops and infradev
- 113 users
- github.com/ripienaar
- テクノロジー
- 2015/03/31
Brainboard - Collaborative solution to visually build and manage cloud infrastructures from end-to-end. Cloud 66 - Free for personal projects (includes one deployment server, one static site), Cloud 66 gives you everything you need to build, deploy, and grow your applications on any cloud without the headache of the “server stuff.”. Pulumi — Modern infrastructure as a code platform that allows you
- development
- free
- webservice
- webサービス
- 開発
- クラウド
- list
#21　和田裕介（ゆーすけべー） | gihyo.jp
- 100 users
- gihyo.jp
- 暮らし
- 2009/11/25
今回の対談は、9 月10.11 日に開催されたYAPC::Asia 2009会場となった東京工業大学大岡山キャンパスにて実施。ゲストは、「⁠Twib」「⁠YourAVHost」（⁠注1⁠）⁠ などのサイトでお馴染みの、ゆーすけべーこと和田裕介さんです。袋綴（と）じこそ実施には至りませんでしたが、一部、いまだかつてないエロ度の対談になりました。（撮影：武田康宏） Web開発に携わったきっかけ弾：今回はWEB+DB PRESSで初めての袋綴じということで…（笑⁠）⁠。ゆ：袋綴じって（笑⁠）⁠。弾：さっそくですが、Web開発に携わったきっかけってなんですか？ゆ：僕は大学院まで行ってるんですけど[2]⁠、そのときの研究は、コンピュータをいじることではあったんですが、インタフェースとかアート寄りで、コンピュータは専門じゃなかったんです。で、卒業と同時に父親と会社をやり始めて[3]⁠。Web
- yusukebe
- perl
- 小飼弾
- dankogai
- interview
- インタビュー
- web
- WEB+DB
- programming
- Webサービス
BeautifulSoupでスクレイピングのまとめ – taichino.com
- 97 users
- taichino.com
- テクノロジー
- 2010/02/11
何度かBeautifulSoupについては書いているのですが、未だに使い方が覚えられずにイライラします。仕方が無いのでまとめて置く事にしました。BeautifulSoupはHTMLから情報を取得するだけ無く、HTMLの編集もできますが、ここではスクレイピング用途のみに絞っています。使用するのは以下のHTMLです。このHTMLを使って色々と情報を取得したのが以下です。覚えるべきはfindAllだけです。注意する必要があるのは、textを指定した場合にタグオブジェクトが取れずに、テキストオブジェクトが取れるので、一旦parentで親のタグ取りましょうという事と、正規表現で条件指定する場合は、re.compileで正規表現オブジェクトを渡すという事位ですか。 #!/usr/bin/python # -*- coding: utf-8 -*- import re import urllib f
Web::Scraperのjavascriptバージョンwebscraper.js - bits and bytes
- 96 users
- labs.gmo.jp
- 暮らし
- 2008/02/15
perlのWeb::Scraperみたいな記述で、ページの中からデータを取り出すwebscraper.jsという小さなjavascriptのライブラリを書きました。ブックマークレットデータを取り出したいページでブックマークレットでwebscraper.jsを読み込んでFirebugコンソールで使います。ブックマークレット webscraper コードwebscraper.js つかいかた Web::ScraperのSYNOPSISで例としてあげられているebayでapple ipod nanoを検索した結果からデータを取り出すときは検索結果ページで上のブックマークレットを呼び出してFirebugコンソールで取り出す部分を記述します。こんなかんじ。 SYNOPSISのperlのコードで変数$ebay_auctionに一度代入されている部分をそのままインラインで書き直すと my $e
- javascript
- webscraper
- scraping
- xpath
- library
- web-scraper
- スクレイピング
- html
- lib
- development
Web::Scraperが便利すぎて困るの巻 (CodeZine編集部ブログ)
- 96 users
- blog.codezine.jp
- 暮らし
- 2007/10/11
こんにちは、編集マンの久次です。なんだかPerlのWeb::Scraperが便利すぎで、やばいです。これまでWWW::Mechanizeでごにょごにょやっていたのですが、一気にいろんなものが解決しました。それで、いろいろ書いていたら、HTML::TreeBuilderのlook_downというメソッドも強力なことにいまさらながら、気づいたので勉強がてら、ためしにコードを書いてみました。 Webの自動制御に今日も夢が広がる…。＜参考＞ Web::Scraper - Web Scraping Toolkit inspired by Scrapi - search.cpan.org naoyaのはてなダイアリー - Web::Scraper ブログが続かないわけ | Web::Scraper 使い方(超入門) Web::Scraper超便利 scrAPI Cheat Sheet
- perl
- webscraper
- scraping
- scraper
- cpan
- html
- module
- database
- Web-Scraper
- tool
Config::PitとWeb::ScraperとPlaggerで24時間365日のゲーム監視体制
- 94 users
- perl-users.jp
- 暮らし
- 2008/12/21
序文趣味のネットウォッチのために仕方が無く超便利なPerlを覚えようという感じの otsune です。そんなわけでコーディングの深い話はよくわからんので、今回はPerlとCPANを使ってネットウォッチを支援する手法について書きます。ウォッチしたいWebページを機械的に監視できれば、あとはPlaggerなどの便利ツールを使って「メールを出す」「im.kayac.comでメッセンジャーにアラートを出す」「ピザを注文する」など好きな処理をすることが出来ます。 RSSフィードやAPIなどがあるWebサイトであれば特に苦労はしないのですが、今回取り上げるOgame.jpはウェブブラウザーゲームなので、フィードなど便利な機能はまったく存在しません。そこでウォッチしたいWebページに対してWeb::Scraperを使ってYAMLを出力する短いスクリプトを書いてしまいます。メールを出すなどのこまご
- perl
- plagger
- web-scraper
- scraper
- webscraper
- cpan
- programming
- scraping
- pit
- *perl
A curated list of awesome Go frameworks, libraries and software - Awesome Go
- 93 users
- awesome-go.com
- テクノロジー
- 2014/07/09
Awesome Go We use the Golang Bridge community Slack for instant communication, follow the form here to join. Sponsorships: Special thanks to Awesome Go has no monthly fee, but we have employees who work hard to keep it running. With money raised, we can repay the effort of each person involved! You can see how we calculate our billing and distribution as it is open to the entire community. Want to
- golang
- go
- library
- Go言語
- framework
- programming
Web::Scraper を XML::LibXML で爆速にする hack! - woremacxの日記
- 86 users
- d.hatena.ne.jp/woremacx
- 暮らし
- 2008/02/02
id:miyagawa さんの Web::Scraper で、HTML::TreeBuilder::XPath の代わりに XML::LibXML を使うととても幸せになれそうなので実験してます。XML::LibXML に手を出す前に IRC で「tinyxpath とか htmlcxx とか使って xpath 周りを高速にしたい」とかボヤいてことがありました。そのときに、id:vkgtaro さんや id:tomyhero さんに激しく libxml や XML::LibXML をオススメされました。libxml をオススメしてもらえてなかったら、確実に路頭に迷ってました。以下が、変更したファイルと差分です。http://pub.woremacx.com/Web-Scraper/Scraper.pmhttp://pub.woremacx.com/Web-Scraper/Web-Scrap
- webscraper
- perl
- libxml
- scraper
- xml
- cpan
- web-scraper
- xml-libxml
- xpath
- スクレイピング
セブンイレブンのネットプリントをMac OS XやLinuxや*BSDなどで仮想プリンタとして使う - このブログはURLが変更になりました
- 84 users
- tmatsuu.hatenadiary.org
- 暮らし
- 2010/12/05
以前、CUPSからネットプリントに出力する簡単なプログラムを紹介したが、最近それが動かなくなったとコメントを頂いたので、色々書き直してみた。仕組み CUPS-PDFでPDFファイルを生成し、それをセブンイレブンのネットプリントサービスに投げるだけ。APIは用意されていないのでCGIを直接叩く。やり方アカウント取得 http://www.printing.ne.jp/register/index.html にアクセスしてユーザIDとパスワードを取得する。 CUPS-PDFのインストールまずCUPS-PDFをインストールする。 Linux/*BSDであれば各ディストリビューションのパッケージまたは本家サイトにあるtarball/rpmをインストール。gentooはemerge cups-pdfでok。 Mac OS XはCUPS-PDF for Mac OS Xをダウンロードしてインス
- linux
- printer
- mac
- ネットプリント
- cups
- pdf
- perl
- print
- webservice
- プリンタ
iview for Tombloo
- 82 users
- ido.nu
- 暮らし
- 2008/09/26
iPhoneでtumblrのdashboardやいろんなサイトの写真をただただひたすら見ていくためのiviewは、中ではAutoPagerizeみたいにXPathで定義されたサイトの構造に従って写真を取り出して表示しています。次のバージョン(0.0.8)で、iview用に書かれたsiteinfoみたいなのを外から読み込んで写真を表示できるようにしようとwedataのItem - データベース: iview - wedataに20くらいsiteinfoを書きました。このsiteinfoを使ってiviewのFirefox+Tomblooバージョンを作りました。tumblrだけでなくwedataに書かれたいろんなサイトでLDRize+reblogCommandと同じようにj/kで移動してtでtumblrにpostすることができます。使い方以下 iview for Tombloo のインス
- tombloo
- iview
- firefox
- tumblr
- iphone
- javascript
- greasemonkey
- tool
- autopagerize
- addon
パスワード設定をコードに書かない(Config::Pit) - モダンなPerl入門 - モダンなPerl入門
- 80 users
- perl-users.jp
- テクノロジー
- 2009/04/09
パスワード設定をコードに書かないようにするには Config::Pit をつかいます。なぜ必要なの？アカウント情報が必要なWebサービスを利用するスクリプトを作るとき、アカウントやパスワードをスクリプトのコードに直接書き込むと（ハードコーディング）、そのスクリプトがほかの人に見られてしまうことによりパスワードが漏洩してしまいます。 Config::Pitは、外部ファイルにWebサービスのアカウント情報を格納しておき、スクリプト側で必要なときに、読み出しできるようにします。これにより、スクリプト内にアカウント情報をハードコードすることがなくなり、スクリプト単体でのパスワード漏洩が防げます。例：コードを配布しようとして、 #!/usr/bin/perl use strict; use warnings; use utf8; use Encode; use WWW::Mechanize;
- perl
- pit
- cpan
- password
- security
- module
- ライブラリ
- Tech
- programming
Web::Scraper で XPath と CSS セレクタを混ぜて使う例 - Tociyuki::Diary
- 65 users
- tociyuki.hatenablog.jp
- 暮らし
- 2007/07/27
Web::Scraper はいたれりつくせりの仕掛けが仕込んであって、便利ですね。私が、割と良く使っている機能は以下 2 つです。 process の第一引数に、CSS セレクタだけでなく、XPath も指定できます。ただし、XPath を指定するときは先頭を必ずスラッシュ(/)で始めなければいけません。 process の第二引数以降の、値をどこから取得するかを指定する部分に、コード・リファレンスを置くこともできます。これを使うと、DOM ツリー中の値を加工して抽出することができます。具体例として、デイリーポータルZのアーカイブ一覧の中からべつやくれいさんのエントリを抽出してみることにします。まず、アーカイブ・ページのエントリ部分を取り出してやると、こうなっています。 <TD width="580" valign="top" class="tx12px"> <P> <B><FONT c
- perl
- xpath
- scraper
- css
- Web-Scraper
- webscraper
- cpan
- scraping
- module
- program
Dify のワークフローの概要｜npaka
- 63 users
- note.com/npaka
- テクノロジー
- 2024/05/04
以下の記事が面白かったので、簡単にまとめました。・Workflow - Dify 1. ワークフロー1-1. ワークフロー「ワークフロー」は、複雑なタスクを小さな「ノード」に分割することで、LLMアプリケーションのモデル推論への依存を減らし、システムの説明可能性、安定性、耐障害性を向上させます。「ワークフロー」の種類は、次のとおりです。・Chatflow : 顧客サービス、セマンティック検索など、応答作成に複数ステップのロジックを必要とする会話シナリオ用・Workflow : 高品質な翻訳、データ分析、コンテンツ作成、電子メールの自動化など、自動化・バッチ処理シナリオ用 1-2. Chatflow自然言語入力におけるユーザー意図認識の複雑さに対処するため、「質問分類」「質問書き換え」「サブ質問分割」などの問題理解ノードを提供します。さらに、LLMに外部環境との対話機能、すなわち「
- LLM
- AI
- あとで読む
- 人工知能
- ツール
Coroを使って並行処理 - JPerl Advent Calendar 2009
- 60 users
- perl-users.jp
- 暮らし
- 2009/12/21
こんにちわ。『層・圏・トポス』読者の会からの刺客、id:hirataraです。「並行処理」って言葉はなんだか魅力的ですよね！そこで、今日はCoroを使った並行処理を紹介します。なお、Coroはコアモジュールではありませんので、使ってみたい場合にはCPANからインストールして下さい。スレッドを作る Coroでは、asyncによって新しいスレッドを作ることができます。ただし、asyncでスレッドを作っても、何もしなければ他のスレッドに勝手に処理が移ることはありません。asyncで作成した別のスレッドに制御を移すには、明示的な操作が必要となります。ここではcedeを使って、asyncブロックへ処理を移しましょう。 use strict; use warnings; use Coro; async { print "Another thread\n"; }; print "main thre
- coro
- perl
- async
- thread
- tutorial
- cpan
- プログラミング
- *programming
Web::Query - jQuery風にスクレイピング - tokuhirom's blog
- 59 users
- blog.64p.org
- 暮らし
- 2011/02/21
http://frepan.org/~TOKUHIROM/Web-Query-0.01/README.pod Web::Query というスクレイピングフレームワークをかきました。一言でいうと「うごく pQuery」です。pQuery は jQuery とおなじ動きにするためかどうかしりませんが、わりと自前で実装していて、結果まともにうごいていません。うごくようになるのをまってようかなとおもっていたら2年経過していたので、自分でつくってみました(パッチをおくってもいいのだけど、別個の実装をつくったほうがはやい気がしたので)。HTML::TreeBuilder::XPath + HTML::Selector::XPath + LWP::UserAgent という構成です。使用例は以下のとおり。 use Web::Query; wq('http://google.com/search?q=f
- perl
- scraping
- jquery
- jQuery
- xpath
- Library
- HTML
- web
デザイナー必見！VPSで高速なMovable Type用サーバをゼロから構築する方法 - エンジニアブログ - スカイアーク
- 57 users
- product.skyarc.co.jp
- テクノロジー
- 2013/05/06
まだGW中に間に合いますよ！という事で最近[個人的]にサーバを構築する機会が多いので、サーバ構築のノウハウを公開したいと思います。 Movable Type専用というわけではないですが、PSGIでのサーバ構築手順がほとんど公開されていないようなのでなるべく初心者の人でも判るように解説したいと思います。かなり検証を行ったので、素のCentOS6.4(64ビット)であれば、上から順番にコピー＆ペーストでコマンドを実行するだけで、サーバが構築できるはずです。各コマンドについては細かく説明はしておりませんが、まずは構築してみる事から初めては如何でしょうか。わかりづらい箇所があればFBやTwitter等で質問を受け付けますので気軽にどうぞ。需要があれば一日かけてサーバ構築の勉強会でも実施しようかなと思っているので「いいね」と「はてぶ」お願いします！目標本番でも使えるサーバ(最低限のセキュリテ
- movable type
- VPS
- nginx
- サーバ
- apache
- perl
- MT
- centos
- server
- MySQL