はじめに テキストデータを処理するためのフリーソフトウェアを紹介します。 テキスト検索系ツール 秀丸エディタ 機能:大規模ファイルの編集にも適する高機能テキストエディタでコーパスデータの処理のためにも役立つツールと言えます。様々なフリーのマクロが利用できるのも嬉しいですね。 利用条件:シェアウェア(4,305円) 動作環境:WindowsVista/XP/Me/2000/98/95/NT ダウンロード:こちらのサイトから andGrep - 絞り込み/否定検索機能付きGREPマクロ 機能:秀丸用のマクロ。複数の文字列を含む行の抽出(絞り込み検索)や、指定文字列を含まない行の抽出(否定検索)を任意の数の文字列、任意の順序で指定して実行することができます。このマクロで秀丸にKWIC検索機能を実装できます。非常に便利です。 利用事例: 毎日新聞コーパスから本文のみをテキストデータとして抽出する。