タグ

ブックマーク / freak-da.hatenablog.com (8)

  • 大量のデータから一定個数のデータをランダムに採取するReservoirサンプリング - 本当は怖いHPC

    大量の実験データがあるが、馬鹿正直に全部プロット等すると時間がかかりすぎる。実験の初期段階とかで試行錯誤しながら素早く作業をしたい時には、一定個数のデータをランダムに抜き出してプロット等したい事が多い。 そのとき、全体の個数の見当がついていれば、大体の見当で割合を設定して確率的に取得すればよい。例えば、データの全数が約100万個で、とりあえず1000個取り出したいなら、乱数を用いて0.1%の割合でデータを採取すれば良い(ぴったり1000個にはならないだろうがそれは問題ではない)。 全体の個数が不明の場合はそうはいかない。最初に全体の個数を数えてから割合を設定しようとすると、全データを2回走査、つまり2パスの操作が必要になるし、標準入力からデータが流れてくる場合(いわゆるストリーム処理)の場合は、個数を取得するためには全体を保存しておかなければならない。これらの操作は、大規模なデータにおいて

    大量のデータから一定個数のデータをランダムに採取するReservoirサンプリング - 本当は怖いHPC
  • 高層ビルのエレベーターホールには、なぜ階数表示がないのか - 本当は怖いHPC

    以前に高橋幸雄先生の授業で聞いて非常に面白いと思ったこと。 オフィスビルとかホテルとか、エレベーターが何基も設置されているビルの場合、エレベーターホールに階数表示が無いことが多い。エレベーターホールで画像検索してみればわかると思う。 これはなぜだろうか。 その理由は、「客がいても、その階を通過することができるようにするため」だ。 基的に、多数のエレベーターを効率よく動かすのは難しい。工夫された高度なアルゴリズムが使われていることが多い。目標は「客の平均待ち時間を短くする」ことだ。ある階でボタンが押された場合、どのエレベーターがその客を迎えに行くか、という判断が平均待ち時間に大きな影響を与える。難しいアルゴリズムの中で、この点がもっとも重要なところだ。 高層ビルの場合、エレベーターはかなりの速度で走っている。既に客を乗せて走っているエレベーターが他の客を乗せるために停止すると、減速→停止→

    高層ビルのエレベーターホールには、なぜ階数表示がないのか - 本当は怖いHPC
    InoHiro
    InoHiro 2012/08/26
  • 【派閥別】Gitのコミットを間違えたときの対処法まとめ - 本当は怖いHPC

    追記:たくさんブクマしていただいて驚いております。ブクマコメントだと、やはり git push -f は反則だろという意見がサイレントマジョリティのようですが、そこはそれ、自 己 責 任 追記2(2011/11/07):commit messageをミスった場合について訂正しました。 git rebase -i で直近のコミットを "edit" にして修正すると、 「--amend使えや」と言われるようです。 gitのコミットをしくじった時の対処法について、一覧性の高いまとめがなかったので作りました。正確さは保証できないので、コマンド名ヒントに自分でググって下さい ほかのやり方があるよ、間違ってるよ等のご指摘歓迎です。 派閥別 gitでコミットミスった時のまとめ | ├─ 一人で使ってるよ |   | |   ├─ 手元に変更を取り戻したいよ(1)(そうだね、add忘れだね派) |   |

    【派閥別】Gitのコミットを間違えたときの対処法まとめ - 本当は怖いHPC
    InoHiro
    InoHiro 2011/11/07
  • Pomodoroテクニックでテキパキ作業を片付ける - Text::Easyhacking

    これは良いテクニック。Pomodoroは、時間管理のテクニックの一つで、25分を「1Pomodoro」とし、1Pomodoro → 5分休憩 → 1Pomodoro → ・・・と続けていくというテクニックです。個人的には、休み時間はデタラメにやっています。詳しいことは、テクニックについての詳細は、「Pomodoro Technique(ポモドーロ・テクニック)」25分単位で集中する時間管理術 や、The Pomodoro Technique (公式サイト:英語)などを参照。自分は、Androidのアプリを使いながら、Evernoteのチェックボックス・RTMでのGTDと併用して実践中。その中で、Pomodoroテクニックのメリットをいくつか感じたので書いてみます。AndroidとかiPhoneのアプリは有料版もあるけど、無料版で十分だと思われます(たぶん)。ちなみに、Pomodoroという

    InoHiro
    InoHiro 2011/02/09
  • parallel と concurrent、並列と並行の違い - 本当は怖いHPC

    2017/01/10 誤字脱字を修正しました 2016/11/07 内容を修正しました 2010/09/17 文章を修正しました 一般的に、parallelは並列、concurrentは並行と訳されます。検索してもずばり書かれた物がなかったので、僕なりの理解を書いてみます。 (注:言葉の定義の問題なので、複数の流儀があり得ます。端的に言えば、いわゆるCPUSIMD命令を「並行」と見なすかどうかに違いが現れます) 参考リンク: http://d.hatena.ne.jp/NyaRuRu/20060129/p2 http://d.hatena.ne.jp/muimy/20070322/1174526368 一番妥当(だと思う)定義 一言で言えば、 Concurrent(並行)は「複数の動作が、論理的に、順不同もしくは同時に起こりうる」こと Parallel(並列)は、「複数の動作が、物理的に

    parallel と concurrent、並列と並行の違い - 本当は怖いHPC
    InoHiro
    InoHiro 2010/09/22
  • TOEIC 900 点を取る方法 - 本当は怖いHPC

    僕は、一年半くらい前にTOEICを初めて受験して、925点だった(結局、後にも先にもこれ一回しか受けていない)。友人にどう勉強すればよいのかと聞かれて、いろいろ考える機会があったので、せっかくだからここで晒しておこうかなぁと思った次第。 主なターゲットは、700点前後で伸び悩んでいる大学生、くらいである。 当たり前だけど、これはあくまで僕の感覚なので参考程度に。たぶん、他の人とはちょっと観点が違うと思うので。 受験英語は重要である まず、高校受験・大学受験の受験英語を軽視してきた人は、考え方を変えた方がよいだろう。受験英語は重要だ。受験英語「だけ」では不十分であるが、過信しない限り「英語が出来ること」への近道になり得る。 ちなみに、僕は大学受験のセンター試験英語は200点(満点)だった。たまたま簡単な年だった。 まず模試をやろう まずは、模試をやろう。模試形式の問題集を買ってきて、きちんと

    TOEIC 900 点を取る方法 - 本当は怖いHPC
  • RSpecの標準Matcher一覧表 - 本当は怖いHPC

    追記2(2015/09/08)ありがたいことに、未だにこの記事をブックマークしてくださる方がいらっしゃいますが、2008年に書いた記事なのでご注意下さい。内容はアップデートしていません。私自身はすでにRubyを使っていません。 追記:古い情報ですので、記事の日付とお使いのRSpecのバージョンを見比べて、参考程度にご覧ください。大部分は通用するはずですが。 Matcherをいちいち調べるのが面倒になって、公式のリファレンスマニュアルは一覧性が低いから、自分で一覧表を作った。 RSpecそのものについては、スはスペックのス 【第 1 回】 RSpec の概要と、RSpec on Rails (モデル編)などをどうぞ。そのうちRSpec on Rails版も作る予定。 名前 not((should_notで使えるかどうかという意味。)) 意味・機能 == ○ ==演算子を利用して比較する。ex

    RSpecの標準Matcher一覧表 - 本当は怖いHPC
  • Rails 2.0.4 メンテナンスリリースの訳(※適当) - 本当は怖いHPC

    via Ruby on Rails Weblog - "Rails 2.0.4: Maintenance release" というわけで変更点を翻訳(主だったところだけ)。わからなかったところは原文のままにしてあります。詳細はTracのチケットとpatchを参照してください。 それにしても ActiveRecord 周りは小難しいものが多いなぁ…。 訳の追加(と修正)があればコメントください m(_ _)m What's new in Rails 2.0.4 - Action Mailer メールログを簡略化 … デバッグレベル:infoでは受信者のみ、メールの文は :debug レベルのみ提供。#8000 [iaddict, Tarmo Tänav] TMail を version 1.2.1 へアップグレード [raasdnil] ActionMailer::TestCase#set

    Rails 2.0.4 メンテナンスリリースの訳(※適当) - 本当は怖いHPC
  • 1