2017年6月6日のブックマーク (2件)

  • 意外と知らない grep コマンドのオプション | バシャログ。

    もう仕事とかどうでもいいからみんなで花見しよう!花見!って感じの天気ですね。どうもこんにちは nakamura です。 基的なコマンドほど意外と知らない機能あったりするよね~という事で今回は grep コマンドのオプションをおさらいしてみました。おそらく有史以来もっとも使われた Unix コマンド BEST10 には入っていると思われる grep 先輩ですが、いざおさらいしてみるとあるわあるわ知らないオプションが・・・。はい、もっと勉強します・・・。 とりあえず僕がよく使う&もっと早く出会っていれば・・・と思ったオプションをいくつか紹介していきます。 基的な挙動に関するオプション -G -e ・・・デフォルトオプション -i ・・・大文字小文字を区別しない -v ・・・パターンにマッチしなかった行を抜き出して表示 何もオプションを指定しない場合 grep は -G -e の挙動になりま

    意外と知らない grep コマンドのオプション | バシャログ。
  • 文字列の類似度を測る(1) レーベンシュタイン距離|Colorless Green Ideas

    ある文字列と別の文字列の類似度を測る手法の1つである、レーベンシュタイン距離について紹介する。文字列の類似度は検索エンジンやDNAの塩基配列の調査などにも使用されており、応用範囲は広い。 はじめに Googleの検索結果の訂正候補 検索サイトで検索語を間違えて入力してしまった場合、検索エンジンが訂正候補を出してくれることがある。図に掲げた例では、「マクドナルド」と入力しようとして、誤って「マクラナルド」と入力してしまっているが、Google は「マクドナルド」の検索結果を返している。誤ったものを入力すると、その誤ったものと似た正しいものを返しているのである。 このように訂正候補を出すには、まず入力されたものと似ているものを探し出すということが必要になる [1] 。そして、似ているものを探し出すには、何をもって似ているとするのかということを決めなくてはならない。つまり、類似度の尺度が必要とな