タグ

TextProcessingに関するsconvictのブックマーク (5)

  • ファイルの分割(split)と結合(cat)跡地 - 試験運用中なLinux備忘録・旧記事

    (2015/9/27)記事は「Linuxでファイルを分割・結合する方法(コマンド)」へ移動した。

    ファイルの分割(split)と結合(cat)跡地 - 試験運用中なLinux備忘録・旧記事
  • テキスト処理ツール - コーパス日本語学のための情報館

    はじめに テキストデータを処理するためのフリーソフトウェアを紹介します。 テキスト検索系ツール 秀丸エディタ 機能:大規模ファイルの編集にも適する高機能テキストエディタでコーパスデータの処理のためにも役立つツールと言えます。様々なフリーのマクロが利用できるのも嬉しいですね。 利用条件:シェアウェア(4,305円) 動作環境:WindowsVista/XP/Me/2000/98/95/NT ダウンロード:こちらのサイトから andGrep - 絞り込み/否定検索機能付きGREPマクロ 機能:秀丸用のマクロ。複数の文字列を含む行の抽出(絞り込み検索)や、指定文字列を含まない行の抽出(否定検索)を任意の数の文字列、任意の順序で指定して実行することができます。このマクロで秀丸にKWIC検索機能を実装できます。非常に便利です。 利用事例: 毎日新聞コーパスから文のみをテキストデータとして抽出する。

    テキスト処理ツール - コーパス日本語学のための情報館
  • 文字コード変換ツール for .NETの詳細情報 : Vector ソフトを探す!

    「文字コード」カテゴリーの人気ランキング FileCode Checker ファイルの文字コード/改行コードを一括して判定・変換(ユーザー評価:3.5) Text Code Converter 指定したディレクトリに在るファイルの文字コード自動識別して一括変換(ユーザー評価:4.5) 文字コード一括変換 文字コードを変換してくれるフリーソフト(複数ファイルの一括変換にも対応)(ユーザー評価:0) ZiiDetector ファイルの文字コードを一括で変更(ユーザー評価:4.5) IVS検索 IVS文字(異体字)・変体仮名の検索のほか、辞書検索を使った文字の検索・入力にも利用できる(ユーザー評価:0) 「テキストファイル用」カテゴリのソフトレビュー 検索君 テキストファイル文字列検索、ファイル名検索 1.5 - 正規表現やIFilterにも対応。シンプルなインタフェースで使いやすいテキスト&フ

  • 複数テキスト結合の詳細情報 : Vector ソフトを探す!

    「テキストファイル用」カテゴリーの人気ランキング clipnote(クリップノート) クリップボードを読込んで起動し文字数をリアルタイム表示する関数電卓等の特殊機能を多数搭載したエディタ(ユーザー評価:4) テキスプローラー テキストファイルに特化したエクスプローラー型ビューアー(ユーザー評価:3.5) LikeGrep 正規表現を用いず、複数の条件で検索ができ、置換などの編集処理も同時に可能(ユーザー評価:0) CSVClipper 複数のテキストデータ(CSV等)から必要データのみを抜出し一つのファイルに 間引きにも(ユーザー評価:4.5) CSVイディー CSVファイルが編集できる(ユーザー評価:0) 「テキストファイル用」カテゴリのソフトレビュー 検索君 テキストファイル文字列検索、ファイル名検索 1.5 - 正規表現やIFilterにも対応。シンプルなインタフェースで使いやすいテ

  • ファイルの違いを調べるには

    これは、最初のファイルの「2」行目と、次のファイルの「2」行目が異なっている(Change)ことを表している。「<」が付いているのが最初のファイル、「>」が付いているのが次のファイルだ。 上記の表記だと、慣れないと分かりにくい。もう少し分かりやすく表示するには、-cオプションを使用するといいだろう。 $ diff -c a.txt b.txt *** a.txt       Fri Apr 20 02:33:03 2001 --- b.txt       Fri Apr 20 02:34:37 2001 *************** *** 1,3 **** ファイルの違いを調べるには、 ! diffコマンドを 使用する。 --- 1,3 ---- ファイルの違いを調べるには、 ! difffコマンドを 使用する。

  • 1