mecabっていう日本語構文解析プログラムがあります。 今日は、それを使って「日本語を自動解析して用語を抜き出し、コピペ文を自動生成するスクリプト」の作り方を学習します。 必要なもの・root権限で動かせるlinux/unixなマシン。 ターミナルで動作します。面倒くさいGUIなんか作りません。シェルスクリプト万歳! ・yumかapt mecabをインストールするのに必要になります。 レポジトリとかは知らんけど、yum install mecabとかapt-get install mecabとかしてmecabを入れてください。 1. mecabを使って日本語から固有名詞っぽいものを抜き出す1行シェルスクリプト。超簡単です。コピペでも動く多分。 これをmecab_extract.shって名前で保存して実行属性を付けよう。 #! /bin/bash cat /dev/stdin |mecab|
![ワードサラダを作ってみよう](https://cdn-ak-scissors.b.st-hatena.com/image/square/b1638cdb5807a4788e4ba3c1109a984166e095fc/height=288;version=1;width=512/https%3A%2F%2Fanond.hatelabo.jp%2Fimages%2Fog-image-1500.gif)