スクレイピングして遊ぶために、文字コードを判別してHTMLソースを取得するコードをScalaで書いてみました。 実装 HtmlScraping.scala import scala.io.Source import scala.util.matching.Regex object Html{ def getSource(url: String): List[String] = { val src = Source.fromURL(url, "ISO-8859-1").getLines.toList var charset: String = null val regex = new Regex("""charset[ ]*=[ ]*[0-9a-z|\-|_]+""") for(line <- src){ val lower = line.toLowerCase if(lower.conta