MOONGIFTはオープンソース・ソフトウェアを紹介するブログです。2021年07月16日で更新停止しました Webページから情報を抽出するニーズは常に存在します。メタタグはそのためにあるのですが、任意に設定できるので利用者側のニーズに合っていない可能性があります。そこで本文を取得したり、タイトルや更新日を取得するスクリプトなどが作られています。 今回紹介するkeywords-extractはWebページからキーワードを抽出してくれるソフトウェアです。 keywords-extractの使い方 keywords-extractを実行したところです。文字数などを閾値に設定できます。 $ keywordsextract --url https://en.wikipedia.org/wiki/Search_engine_optimization --n 3,4 [ 'Search engine'
![keywords-extract - Webページからキーワードを抽出 MOONGIFT](https://cdn-ak-scissors.b.st-hatena.com/image/square/5b77db804c69b51b3167dd1e1ade43bf4e33b573/height=288;version=1;width=512/https%3A%2F%2Fmoongift-assets.s3.amazonaws.com%2Fassets%2Fnone-c3f80f5acd8206a735bb12db1e77cb6d.png)