Webページから情報収集をしてくる処理をスクレイピングって言うらしい。シェル芸勉強会でもスクレイピングみたいなことをやった。 福岡県久留米市では、オープンデータカタログとして人口情報をCSVにて公開している。 久留米市:オープンデータカタログ ただ、過去の情報はExcel形式での公開。xlsx形式ならばエクシェル芸で捌けそうであるが、残念ながら旧形式のようだ。 平成25年より新しいデータについては、HTMLでWebページとして公開されている。ならばスクレイピングでCSVにした方が扱いやすいのでは? ということで、人口情報が記載されたWebページからCSV作成して保存するスクレイピングなシェルスクリプトを作ってみた。パソコンはMac、OSはOSX Yosemiteだが、Linux、FreeBSDなどでも動くはず。 必要なコマンド GNU系のツールについては、OSXやFreeBSDの場合は追加