タグ

hashに関するtmsanrinshaのブックマーク (3)

  • Elasticsearch にログを重複・欠損なく格納する案 - Qiita

    はじめに Elasticsearch を持っているなら、ログは余すことなく入れておきたくなるだろう。 パースは後でもできるので、とりあえず入れておくだけ。 ただし、情報量を落とすことなくログを入れたい。 ログは件数が意味をもつこともあるので、重複は避けたいし、欠損してほしくはない。 そのためには、個々のログに対して一意となる ID を指定すればよさそうである。 もしもログ送信元 (Logstash など) や送信先 (Elasticsearch) に異常が発生し再送の必要が生じても、 ID があれば重複なく格納できるようになるため、再送を十分に行えるなら欠損分を補えるだろう。 ちなみに、もし重複を許すなら、途中まで読んでいたログファイルをもう1度読み込みなおせばよい。 なお、もし再送を十分な回数できるなら、ID が(Elasticsearch の自動生成 ID など)ログに対して一意でなく

    Elasticsearch にログを重複・欠損なく格納する案 - Qiita
  • Awkプログラミング入門−第17回

    講座「文系のためのawkプログラミング入門」 今回のテーマは連想配列です。連想配列は、C言語やBasic言語にもない独特の配列です。C++ や perlなど比較的新しい言語には同様の実装がなされています。連想配列も名前からわかるように配列の一種なんですが、前回学んだ配列の添え字は数でした。連想配列は数ではなく文字列を、添え字にしたものです。使い方を覚えれば実にユニークなテキスト処理のツールに成ります。 I 連想配列 実例を示しましょう。 # script 17-1 BEGIN{ meibutsu["大阪"] = "たこやき" meibutsu["名古屋"] = "きしめん" meibutsu["福岡"] = "辛子明太子" meibutsu["静岡"] = "お茶" print "大阪の名物は " meibutsu["大阪"] print "名古屋の名物は " meibutsu["名古

  • 巨大な bookmarklet を信頼できる形で配布する方法 - kazuhoのメモ置き場

    Twitter で聞いてみたところ @hasegawayosuke さんいわく、Bookmarklet の文字数制限は最短だと約2,000文字らしいです。 でも、その長さで bookmarklet を書くのって難しいですよね。かといって、別のサーバから JavaScript をダウンロードして実行するとなると、そのダウンロードされたスクリプトが安全か、という問題が出てきます。 ならば、暗号学的ハッシュ関数を2,000文字以下で実装し、ダウンロードしたスクリプトの改ざん検証を行った上で実行すればいいのではないか。そうすれば、文字数の制限に悩むことなく Bookmarklet の開発に勤しめるのではないでしょうか。 ジャジャーン!というわけで、とても短い SHA-1 の JavaScript 実装を作りました*1。 GitHub - kazuho/sha1.min.js: SHA-1 impl

    巨大な bookmarklet を信頼できる形で配布する方法 - kazuhoのメモ置き場
  • 1