プログラムでWeb上から情報を取得する際によく登場する技術用語として、「スクレイピング」と「クローリング」があります。 両者はさまざまな本や解説サイトで登場している用語ですが、これらの用語の意味の違いを正しく理解していますか? 今回はスクレイピングとクローリングの違いを、実際のコードの比較を交えて解説します。 スクレイビグは、情報を「抽出」すること スクレイピング(scraping)とは、「こする」「削りとる」「剥離物」を意味する英単語です。 そこから転じて、「何らかのデータ構造から余分な情報を削りとり抽出すること」を、IT分野では「データスクレイピング」と呼ぶようになりました。 データスクレイピングは特に、プログラム間でやりとりされる人間が読むのに適さないデータから、人間が読めるレベルまで余分な情報を除去し、必要な情報のみ抽出する際によく用いられる言葉です。 なおこのデータスクレイピング