タグ

awkに関するfukudamasa09のブックマーク (2)

  • JavaScript 標準ライブラリ RegExp - Wikibooks

    [編集] RegExp 正規表現とは、文字列の検索や置換に用いられる、文字の規則表現の方法である。 JavaScriptは文字列に執着があったのか、高度な正規表現の機能を備えている。 正規表現は、Unixの世界で、grepやsedで、文字列の検索の機能として採用され、その後awkという言語がそれに続き、Perlがその文法を受けついだ。 正規表現は、言語ごとに機能の違いがあり、汎用言語ではPerlが最も高機能だが、それぞれに気にかける程の差は無い。 例えばHTMLでの要素名を取得する際には、"<"の文字から始まり英数字が続くため、これを検索するには正規表現では次の様に記述する。 /<[a-zA-z]+/ これでHTMLの要素名を取得するには完全ではないのだが、とりあえずその点を飛ばして解説をする。 JavaScriptでは、正規表現をスラッシュ"/"の間に記述をする。 この規則の場合は小なり

  • データ集計コマンドを極めてシステム処理と業務速度を爆速化するお話 - Y's note

    Index データ集計コマンド 爆速で検索したいぜ! lookを使う LC_ALL=Cを設定する データのランダムサンプリングがしたいぜ! sedを使う awkを使う sortの--random-sortを使う Script言語を使う shufを使う ランダムサンプリング速度比較 合計と平均値を集計したいぜ! 列データ取得 重複行のカウント 合計値出力 平均値出力 複数ファイルのデータ結合がしたいぜ! 共通項目での結合 同じ行数での結合 まとめ データ集計コマンド joinコマンドが便利過ぎて生きるのが辛い - Yuta.Kikuchiの日記 lookコマンドによる二分探索が速すぎて見えない - Yuta.Kikuchiの日記 今日はデータ集計を行う上で絶対に覚えておいた方が良いコマンドと知識を紹介したいと思います。これを身につければシステム処理と業務効率化に大きく繋がると思います。この記

    データ集計コマンドを極めてシステム処理と業務速度を爆速化するお話 - Y's note
  • 1