bashで人気言語アンケートサイトの結果をcsvに変換してみる - labunix の ラボゆにっくす や ハッカーニュース人気言語 - karasuyamatenguの日記 にインスパイヤされて gawk (GNU awk) で作成してみます。 ここでは gawk の特徴のうち、以下の項目を使っています。 Socket 通信で w3m や wget 等に頼らず直接ダウンロードする RS (レコードセパレータ) に正規表現を用いることにより、HTML のタグを削除する 実際のコードは以下のようなものです。 #! /usr/local/bin/gawk -f # popular_language.awk # ハッカーニュース人気言語を CSV で出力する BEGIN { # Socket の設定 base_url = "news.ycombinator.com"; port = 80; qu