そして、いざ実際の複合機の管理画面のデータをスクレイピングで取得してみたら驚いた。 HTMLタグがごそっとない! <body>の直下に<script>があって</script>の次が</body> サイトの構成丸々とJavascriptで作られているやんけ! JSでサイト表示部分のプログラムまでスクレイピングで取得できていたのでサイトの構造はだいたい理解できた。 さて、 スクレイピングで取得できるのは文字列 HTMLタグで特定の文字列がとれるけど、jsの変数名はタグじゃないから特定できない。 コード全体の文字列は取得可能 さて、どうしたか。 文字列にして分割して分割しました。 着目した点 JS部分は一行ごとに「;」がある。 欲しい値はコードの中間部分 欲しい値は変数に配列として記述されている。 やったこと まずスクレイピングで取得したコードの文字列を「;」で分割して配列に格納した。 #スク
![【Python】スクレイピングで取得先のページがHTMLではなくJavaScriptでページを構成していた場合の対応](https://cdn-ak-scissors.b.st-hatena.com/image/square/154e22f764c382fb3f6343344e9fde77444e25ef/height=288;version=1;width=512/https%3A%2F%2Faga-note.com%2Fwp-content%2Fuploads%2F2018%2F02%2Fpython-640x366.jpg)