エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Windows 10で始めるBash(6) Webページの情報をシェルスクリプトで取得する
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Windows 10で始めるBash(6) Webページの情報をシェルスクリプトで取得する
BUW(Bash on Ubuntu on Windows)には「curl」というWebサーバーへのアクセスなどを行うコマンドが用意さ... BUW(Bash on Ubuntu on Windows)には「curl」というWebサーバーへのアクセスなどを行うコマンドが用意されている。例えば「curl http://news.mynavi.jp/dp/business」と実行すれば、対象となるHTMLファイルを標準出力で取得するというものだ。その利用シーンは多岐にわたるが、今回からはRSS/ATOMフィードを配信していないWebサイトの情報を取得するために、curlコマンドを使ったシェルスクリプトの作成にチャレンジする。 ターゲットにするのは総務省の報道資料一覧を配信するWebページ。取得したHTMLの内容を見ると文字コードはシフトJISを使っている。また、報道資料一覧はTDタグを使ったテーブルを用いているようだ。確認したところ、このページでは他にテーブルを用いていないため、TDタグを抽出すれば、必要な情報を取り出せる。 抽出方