タグ

2015年7月24日のブックマーク (8件)

  • 大きなテキストファイルをawkで処理するときにcatで投げ込むのと、ファイル読み込みするのどっちが速いか比較 - カメニッキ

    追記が増えたので整理 経緯 2.5GBのテキストファイルを加工する必要があり、①vimで開いて加工→vim死亡②sublime textで開いて加工→sublime text死亡となったため、awkを用いて以下の様なコマンドを実行した。 $ cat sample.txt | awk '$5 ~ /((26|27|28|29|30)\/Jun|(01|02|03)\/Jul)/{ print }' > result.txt すると 「catいらなくね?」と指摘 さらにMATSUMOTO, Ryosuke (@matsumotory) | Twitter < 「キャッシュに入れて高速化してるんかと思った」 とコメントをもらいました。ので、どっちが速いかの検証です。 注意 加工の目的はログファイルからある期間だけの行を抜き取りたい 正規表現がいけてないのは気にしない 比較 awkにファイル指定す

    大きなテキストファイルをawkで処理するときにcatで投げ込むのと、ファイル読み込みするのどっちが速いか比較 - カメニッキ
    pmint
    pmint 2015/07/24
    標準入力のリダイレクト"<"使わんの?/ 小さいファイルでも同じ結果なら速いんだろうな。/ 並列化で速くなるという論理はcatとawkの間にどういう魔法が作用しているんだろ。最近のPCはCPU性能で速くなるものなの?
  • names of things

    pmint
    pmint 2015/07/24
    ウォード・カニンガムによるFedWiki関連用語集。FedWikiの操作マニュアルにもなる。
  • xiki in sfw mockup

    pmint
    pmint 2015/07/24
    "Xiki in SFW mockup"
  • wikity.net Is for Sale

    pmint
    pmint 2015/07/24
    Federated Wikiをブログ風の2カラムサイトにして表示してるのかな。
  • CC0 日本語版の公開

    このたび、クリエイティブ・コモンズでは、CC0の日語版を正式に公開いたしましたので、ここにお知らせいたします。 CC0リーガルコード そのコモンズ証 クリエイティブ・コモンズでは、クリエイターや権利者の方が自分の作品をパブリックドメインで提供し、著作権法上の制約などを一切課さないようにしたい、という際にお使いいただけるツールとして、CC0(シー・シー・ゼロ)を提供しています。このツールの文書部分は、世界共通の文面を使用することになっております。日語版は英語版にできるだけ忠実に作成された翻訳になっております。また、英語版を正式版とする「参考訳」ではなく、英語版やその他の言語の翻訳版と並ぶ、正式版のひとつと位置づけられます。 クリエイティブ・コモンズ・ジャパンでは日語版ドラフトを作成の上、2012年11月から12月にかけてパブリックコメントを実施いたしました。予定より大幅に遅れてのリリー

    CC0 日本語版の公開
    pmint
    pmint 2015/07/24
    cc0
  • CCライセンス・バージョン4.0 日本語版の公開

    このたび、クリエイティブ・コモンズでは、CCライセンス・バージョン4.0の日語版を正式に公開いたしましたので、ここにお知らせいたします。 CCバージョン4.0 表示 リーガルコード 同コモンズ証 CCバージョン4.0表示−継承リーガルコード 同コモンズ証 CCバージョン4.0表示−改変禁止リーガルコード 同コモンズ証 CCバージョン4.0表示−非営利リーガルコード 同コモンズ証 CCバージョン4.0表示−非営利−継承リーガルコード 同コモンズ証 CCバージョン4.0表示−非営利−改変禁止リーガルコード 同コモンズ証 CCライセンスバージョン4.0は、2011年ワルシャワで開催されたクリエイティブ・コモンズの国際会合において公式に検討が開始され、メーリングリストやウィキ、国際会議などを通じて意見、要望などを集約し、2013年11月に策定・公開されました。主な変更点には、以下のような点が含ま

    CCライセンス・バージョン4.0 日本語版の公開
    pmint
    pmint 2015/07/24
    cc 4.0
  • 即席コーンスープのダマが許せない

    カップの底にダマが残ってるのに気付いてもう一度お湯を加えるのも面倒だし そのままダマをして、ニッチャりした濃い塊を味わうのも嫌だ。 ダマにならないよう一生懸命かき混ぜていると、ふと我に返って 「楽したい、手間かけるのが嫌だからインスタント使ってる筈なのに、なんでこんな必死にならなきゃダメなんだ」 と馬鹿らしくなる。 ダマにならない作り方のコツをググってみても 「まず少量のお湯でこねてペースト状にしてから、残りのお湯を加える」と 「粉が固まらないよう、一気にお湯を全量入れる」とバラバラ。 そのうち、即席コーンスープから遠ざかっている自分がいた。 そんな時に見かけたのがこのブコメ クノールから出た冷製スープがとても捗る - sabacurry のコメント http://b.hatena.ne.jp/entry/259655347/comment/sabacurry 一瞬、我が目を疑った。いや

    即席コーンスープのダマが許せない
    pmint
    pmint 2015/07/24
    めったにない。/ 粉の状態が一番溶けやすいので、普通に湯を注ぐ。とろみが出るまでまとまらなければいいだけなので、ゆっくり混ぜる。クルトンの食感・熱さ・とろみの変化を楽しみながら味わう。以上。
  • プログラムのインデントにスペースを使うという悪習

    タブではなく、スペースをインデントに使えというコーディング規約をよく見かけるけど、 タブのほうが便利じゃないかと思うわけ。 よくタブは環境によってインデントが崩れるというけど、 タブの数さえ揃えておけば、設定で一発でなおるけどどうなの? スペースだと、そもそも各環境で設定する必要が無いとか言う人いるけどさ、 それは表示だけの問題であって、入力の都合はぜんぜん考えてないよね。 スペースを4回だか8回押すとか、普通に考えて不毛だよね。 指疲れるわ。 だいたいのIDEはタブキーを押せば自動的にスペース4文字だか8文字に変換されるっていうけどさ、 たかだかインデントの為に、IDEを導入するコストと、設定ひとつ変えるコストはどちらが安上がりかって話。 PCの移行コストをかけたくないから、 できるだけ、ツールはカスタマイズせずにデフォルト設定がイケてるものを選ぶようにしている。 カスタマイズ前提のツー

    プログラムのインデントにスペースを使うという悪習
    pmint
    pmint 2015/07/24
    というか宗教。スペースを使うんならフォントも特定しないといけないんだけど、そこまで頭の回る人はいないらしい。逆にフォントが自由なら、スペース幅は不明なはず。「78桁目で改行すると読みやすい」などと一緒。