クローリング速度自動調整のすゝめ - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/shiozaki

3 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

クローリング速度自動調整のすゝめ - Qiita

Scrapyでクローリングをするときにダウンロード間隔をどうするべきかは悩ましい問題です。クローリング... Scrapyでクローリングをするときにダウンロード間隔をどうするべきかは悩ましい問題です。クローリング対象のシステムの負荷を考えると、短すぎるダウンロード間隔は避けるべきです。ですが、適切な間隔値は対象サイトごとに異なり、また時間帯によっても異なります。そのため、サーバーのレスポンスタイムやレスポンスコードによってダウンロード間隔を動的に変えることが出来れば便利です。 Scrapyにはそのための機能であるAutoThrottle Extentionがあるため、これを利用してみます。使い方使い方はかなり簡単で、settings.pyに以下の設定を書くだけです。あとはこれだけで自動的にダウンロード間隔を調整してくれます。仕組みさて、この拡張機能はどのように動作しているのでしょうか？以降ではその仕組を説明していきます。まずクローリング対象サイトに対して並列リクエストをしたい目

ブックマークしたユーザー

terkel2024/05/24
somemo2020/12/08

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx