Ruby: HTMLからリンクのURLを抽出するワンライナー | 開発業務日誌

世の中カテゴリーの変更を依頼記事元:

office-ikason.com

2 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Ruby: HTMLからリンクのURLを抽出するワンライナー | 開発業務日誌

ruby -ne '$_.scan(/<a href=["\x27]?(.+?)["\x27].*?>(.*?)<\/a>/){|a,b| puts a; puts b;}' < site.tx... ruby -ne '$_.scan(/<a href=["\x27]?(.+?)["\x27].*?>(.*?)<\/a>/){|a,b| puts a; puts b;}' < site.txt ポイントは、URLを囲むのがダブルクォートとシングルクォートに対応していること。例えば、href=”…”でもhref=’…’でも対応してます。上記の正規表現の”\x27″はシングルクォートの16進表現です。実行例： ↓ $ cat xx.txt <a href="http://news4vip.livedoor.biz/" target="_blank">ニュー速クオリティ</a> <a href='http://blog.livedoor.jp/booq/'>まとめたニュース</a> $ ruby -ne '$_.scan(/<a href=["\x27]?(.+?)["\x27]

ブックマークしたユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - 世の中

いま人気の記事 - 世の中をもっと読む

新着記事 - 世の中

新着記事 - 世の中をもっと読む

設定を変更しましたx