タグ

grepに関するgfxのブックマーク (8)

  • highway という高速検索ツールを作りました · けんごのお屋敷

    いまや grep、ack、ag、pt、sift など様々な grep ツールが存在し、高速 grep ツール戦線が激化している昨今ですが、いかがお過ごしでしょう。私は普段から検索ツールには pt を使っていますが、ふとしたことから文字列探索アルゴリズムに興味がわいてきて highway という高速パターンマッチングツールを開発しました。pt や sift が流行りの Go 言語で実装されている中、我が道を行く highway は C 言語での実装にしました (単に Go 言語を知らないだけとも言う\(^o^)/)。 highway (github) highway とは マルチスレッドで動作する高速パターンマッチングツールです。速そうな名前をつけたくて「高速」でググったら「高速道路」がたくさん出てきたのでこの名前になりました。そりゃそうだ。 機能 基的な機能としては pt とほぼ同じです

    highway という高速検索ツールを作りました · けんごのお屋敷
    gfx
    gfx 2015/10/19
  • Go言語でag(The Silver Searcher)ライクな高速検索ツールをつくった。EUC-JP/Shift-JISも検索できマス。

    いまや高速パターン検索といえばag(The Silver Searcher)ですが、検索対象がUTF-8のテキストを前提としているため、EUC-JPやShift-JISといったファイルを検索するのに課題があります。 これまで、それらの日語文字セットを検索できるようにするため、色々とagの改造、公開を行っていました。 ag(The Silver Searcher)でEUC-JP/Shift-JISのファイルも検索できるようにしてみた 日語圏特化型ag -白金- の配備が完了しました しかし、特定の国の文字コードだけに特化した修正というのをmasterに取り込んでもらうわけにもいかず、派生ブランチとして追随するのも、やはり面倒… そこで年始にGo言語を触ったのをきっかけに、Go言語でパターン検索ツールをつくってみました。 せっかくなのでポストagを目指して、プラチナサーチャー(The Pl

    Go言語でag(The Silver Searcher)ライクな高速検索ツールをつくった。EUC-JP/Shift-JISも検索できマス。
  • ackを捨てて、より高速なag(The Silver Searcher)に切り替えた - Glide Note

    Geoff’s site: The Silver Searcher: Better than Ack ggreer/the_silver_searcher · GitHub パターン検索にはackを利用していて、通常利用時には特に不満は無かったんですが、 ファイル数が多いディレクトリだと遅かったので、もっと他の方法が無いかと調べていたら ackの3〜5倍速いというThe Silver Searcherというものが あったので導入。 The Silver Searcherの特徴 公式に書いてあるThe Silver Searcherの特徴 ackの3〜5倍高速 .gitignore、.hgignoreに記載されているものを検索対象から除外 検索対象から除外したいファイルは.agignoreに記載 agというコマンド名で、ackと比べてコマンドが短い(33%減!) なぜ高速なのかは https

    gfx
    gfx 2013/03/04
  • grep, egrep, fgrep の使い分け方

    grep, egrep, fgrep の使い分け方 1995年4月に jus関西の UNIX 研究会(第61回)で、 「イキでいなせな(e|f)?grep の使い分け方」と題し、 grep ファミリの使い分け方について 15 分の発表をしました。 そのときに使った OHPシート(発表で使わなかったページもありますが)を 以下に公開します。 古くなってしまった情報や、間違っている情報もあると思います。 変な所を見つけた方は、ぜひご一報下さい。晩ご飯おごります。 OHPシートは、Mac の persuasion 3.0J で製作しました。 この元ファイルも配布しています。ご入用の方はご連絡ください。 発表の構成では、 あやメーリングリスト < aya@creamy.ics.es.osaka-u.ac.jp > での議論、 特に齊藤明紀先生・中川寛治氏のコメントを参考にしました。 複写再配布等は

  • 性感染症が心配になったら何科を受診すればいい?

    一昔前にとても大きな話題になったエイズでは、多くの患者さんが命を落としています。 ニュースなどであまり見なくなりましたが、感染者は今も増加し続けています。 事実ではない噂レベルの話が広がり、その印象を持っている人も多いかもしれませんが、正しい情報を身につけておけば、適切な対応ができるはずです。 風邪や他の感染症などと比べてあまり表に出ない病気の一つですが、かかると厄介なものです。 性感染症はSTDといって、性行為で感染する病気を総称した呼び名です。 つまり、勝手に感染するわけではなく、必ず誰かから移されるわけです。 STD感染が確認されると、その感染経路をたどることがあります。 相手は自分と親しい人だったり、母子感染なども考えられますから、原因を明らかにすることは急務です。 性感染症を疑う場合、その原因となる行動があります。 心配や不安があるのなら、一度保健所や病院で検査してもらったほうが

    gfx
    gfx 2011/04/29
    すごい!!!
  • How to Implement World Fastest Grep.

    当です. 世界最速のgrep 作りました. このネタで学会発表とかしました. #=> JSSST, プログラミング・シンポジウム 「動的なコード生成を用いた正規表現マッチャの実装」 最近... 「世界最速のgrep」とはしゃいでも研究室内で相手にされなくなってきました. 先輩「へぇ, そうなの.」 同僚「はいはい最速最速.」 後輩「grepってなんですか?」 先生「そんなことより並列化は? 英語で論文書いて. PS3上で動かして.....」

    gfx
    gfx 2011/02/10
    これはすごい!!!
  • http://grep.cpan.me/

  • インテル・AMDのCPUアーキテクトが明かす: GNU grep が速い理由 - karasuyamatenguの日記

    GNU grepの元祖作者がFreeBSDハッカーをschoolしている。 http://lists.freebsd.org/pipermail/freebsd-current/2010-August/019310.html FreeBSD対GNU grepのパフォーマンスを議論していると思われるとことに「俺はgrepの初代作者だ」と名乗って現われた男がいる。 履歴書(http://duckytech.com/resume.pdf)を見ると、GNU coreutilsに貢献した後、インテルやAMDCPUアーキテクトを勤めている男だ。これは話を聞いた方がよさそうだ。 FreeBSDユーザでもある彼はリストを観閲していたらたまたまGNU対BSDのgrep論争に当ってしまったようだ。BSDのリストにGNU grepの秘密を解く。 技1: 全ての入力バイトを見ないから速い 技2: 見るバイトに関

    インテル・AMDのCPUアーキテクトが明かす: GNU grep が速い理由 - karasuyamatenguの日記
  • 1