ただの集団 Advent Calendar 2018 の1日目の記事。 はじめに パチンコ屋の出玉情報を公開するサイトは増えてきたが、情報は各ページに散っていて、WebAPIも提供されていないので、情報を集約して活用するにはクローリングを行う必要がある。 仕事ではScalaを勉強中なので、Scala + jsoupでPAPIMO-NETをクローリングするサンプルを実装する。 なぜjsoupか? Akka HTTP Client 本来はScalaらしくAkka HTTPを使用する予定だったが、単独ではスクレイピングに向かないので別途パーサーを使う手間を考慮してやめた。 scala-scraper Scala製で使いやすそうだが、しばらくメンテが行われていないように見受けられる。一般にScalaはJavaよりもバージョンアップにかかるコストが高く、メンテが定期的に行われていないライブラリは後の