結論 $ RET='\ ' $ cat /Users/shuzo/src/paper.html | sed -e 's/>/>'"$RET"'/g' | grep "<a" 何してるのか RET Bash内で使う変数を宣言します。 この場合、改行を突っ込みます。 .bashrcに書いても有効です。 頻繁に使うようなら、最初から登録しておくのも手かもしれません。 cat 文字列を出力します。 sed sed -e 's/>/>\RET/g' ポイントは、「\」で一旦エンター押して改行する事。 \nとか使えると良かったのですけどね。 sedにはそういう機能が無いらしいのでこうします。 これがないと、 <li><a href="... というような連続したタグを同時に引っ張り出してしまいます。 grep 今回はリンクを引っ張り出します。 参考もと Bash Cookbook: Solutions
![bashでHTMLパースする - Bye Bye Moore](https://cdn-ak-scissors.b.st-hatena.com/image/square/465fb5078cd32b36ae9457df19f4775861313dd2/height=288;version=1;width=512/http%3A%2F%2Fecx.images-amazon.com%2Fimages%2FI%2F51HaT9flh1L.jpg)