タグ

計算に関するaontのブックマーク (5)

  • 高速演算記 第3回 「チューニング技法その1 CUDAプログラミングガイドからピックアップ」 | G-DEP

    今回はFermi解説から一旦はずれ、実際にプログラムを開発する際のチューニングポイントを紹介したいと思います。CPUで実行していたコードをそのままGPU上で動作させても速度向上が得られない場合は以下の点を確認してみてはいかがでしょうか。 まずはじめに基機能のおさらいをしたいと思います。 前回からご紹介している通り、Fermi内部ではマルチプロセッサと呼ばれる実行ユニットが複数存在しています。各実行ユニットは1つのスケジューラと、32個の演算コアから構成され、スレッドを2サイクルあたり2ワープ処理することが可能となっています。32スレッドをワープと呼ばれる1つの単位として扱い、GPU上でスレッドを実行する上で扱いやすい単位とされています。また、少し粗い単位として複数スレッドをブロックとして扱うことが可能です。1ブロック内の最低スレッド数はありませんので、1スレッドのブロックを構成することも

  • 10秒で覚えられて計算がバツグンに速くなる方法 読書猿Classic: between / beyond readers

    ■補数って? 10、100,1000……から、ある数を引いた残りの数のことを(基数の)補数というが、今回の主役は、 それよりも1少ない、いわゆる減基数の補数(注)である。 10進数だと、ぶっちゃけ足して(各桁が)9になる数(の組)だ。 具体例を出すと「9-1=8」だから、8は1の補数である。いうまでもないが、1は8の補数である。 ■まずは「おつり算」 日常生活で最も多い計算は「おつりを計算すること」だろう。 これは補数を使った計算の第一歩にちょうどいい。 速算に 10000-3452=? を計算することは、3452の基数の補数をもとめることだけれど、 まず減基数の補数を求めちゃえばいい。そしてこれは次の方法で反射的にできる。 減基数の補数は基数の補数よりも1だけ少ないということを心に留めておくと、 次の表を覚えておく(というより反射的に出るようにしておく)だけで、 「繰り下がり」なんかに希

    10秒で覚えられて計算がバツグンに速くなる方法 読書猿Classic: between / beyond readers
  • gnuplotでガウシアン・フィッティング(重み付き) - 天文学的研究メモ

    以前やったこの方法だと、各データ点の重みがすべてデフォルトの値である1になってしまうということを知りました。そこで、gnuplotのマニュアルをついに手にすることに。日語訳があって、当に助かりました。 参考:gnuplot のページ (Takeno Lab) 書式: fit {[xrange] {[yrange]}} <function> '<datafile>' {datafile-modifiers} via '<parameter file>' | <var1>{,<var2>,...} `fit` コマンドはユーザ定義関数を (x,y) または (x,y,z) の形式のデータ点の集合への当てはめを可能にします。それにはMarquardt-Levenberg 法による非線形最小自乗法 (NLLS) の実装が用いられます。関数内部に現われるユーザ定義変数はいずれも当てはめのパラメー

    gnuplotでガウシアン・フィッティング(重み付き) - 天文学的研究メモ
    aont
    aont 2010/09/21
    範囲を指定してフィッティングなど
  • 47NEWS(よんななニュース)

    父の野球追いかけ2年半 花咲徳栄高校、岩井監督の長男・福さん 親子で甲子園 父を「先生」と呼び師弟として過ごす 監督は「当はお父さんとして野球を教えたかった」と音 監督と選手としての歩み終り、父と子に戻る 将来の夢はスポーツアナリスト、新たな道へ

    47NEWS(よんななニュース)
    aont
    aont 2010/08/30
    アカデミックの人たちはむしろあまり興味が無いのかな
  • Low-discrepancy sequence - Wikipedia

    In mathematics, a low-discrepancy sequence is a sequence with the property that for all values of N, its subsequence x1, ..., xN has a low discrepancy. Roughly speaking, the discrepancy of a sequence is low if the proportion of points in the sequence falling into an arbitrary set B is close to proportional to the measure of B, as would happen on average (but not for particular samples) in the case

    aont
    aont 2010/08/23
    準乱数の作り方
  • 1