タグ

テキスト処理に関するDiomedeidaeのブックマーク (2)

  • stringiで輝く☆テキストショリスト - Qiita

    @kohske 2015年2月25日 はじめに テキスト処理を制する者は世界を制す Rのテキスト処理、ショボイと思ってませんか? 実際、ショボイです。 「統計処理はRでやるけど前処理でのテキスト処理はアウトソーシング」これRあるあるのひとつです。 ですが、stringiパッケージによってRは立派なテキスト処理ツールになります。 特に大量のテキストをサバく必要がある場合、stringiはチョッパヤです。 テキストショリストの皆様に於かれましてはこれを使わない手はありません。 テキスト処理のアウトソージングはもう終わり、stringiで今日から楽々テキストショリスト生活。 ちなみに読み方は「ストリンジィ(IPA [STRINɡI])」です。 stringiパッケージとは Fast, correct, consistent and convenient string/text processin

    stringiで輝く☆テキストショリスト - Qiita
  • なるべく書かないawkの使い方 - ザリガニが見ていた...。

    awkという、古くからのスクリプト言語がある。(1977年生まれ。読み方は「オーク」である。エイ・ダブリュ・ケイではない)man awkをPDFに変換してみると、たったの3ページ強しかない。 $ man -t awk|pstopdf -i -o ~/Downloads/awk.pdf とてもシンプルな言語仕様ではあるが、awkには必要十分な表現力がある。特にテキストを処理する場面においては、最小限のシンプルな記述で、気の利いた処理を素早くこなす。無駄のないawkワンライナーを見ると、ある種の感動を覚える。awk以降に生まれたスクリプト言語は、少なからずawkの影響を受けていると思われる。 awkを知ることで、間違いなく幸福度は上がると思う。いつかきっと「知ってて良かった」と思える時が来るはず。もっともっと、awkを知りたくなってきた。 基動作 awkの基動作は、とってもシンプルである。

    なるべく書かないawkの使い方 - ザリガニが見ていた...。
    Diomedeidae
    Diomedeidae 2013/12/10
    自分的タイムリーネタ。後で参考にしよう。
  • 1