タグ

2013年8月18日のブックマーク (13件)

  • いつからその方法で偏りのない乱数が得られると錯覚していた? - アスペ日記

    私はつい最近まで勘違いしていました。 ここのページに書いてあるような方法で、一様分布する整数が得られると。 int random(int n) { return (int)(( rand() / (RAND_MAX + 1.0) ) * n); } この方法、一見すると実に一様分布が得られそうに見えるんですよね。 どういう思考回路を通っているかというのを自己分析すると、次のような感じです。 1. rand() では 0〜RAND_MAX のランダムな整数が得られる。 2. それを RAND_MAX + 1 で割ると、[0, 1) に一様分布する実数が得られる。 3. [0, 1) の一様な実数を n 倍して小数点以下を切り捨てたら、0 から n-1 に一様分布する整数が得られる。 これの罠なところは、1 と(特に)3 が正しいというところだと思います。 ただ、2 がダウト。 思いっきりダウ

    いつからその方法で偏りのない乱数が得られると錯覚していた? - アスペ日記
    sucrose
    sucrose 2013/08/18
  • ICWSM読み会やりました(小規模) - KIWAM_KEN_DIARY

    社内の学術に興味あるマンな同期と@takayu_kとでICWSMの読み会やりました。 僕が読んだのがKAISTのチームで、ベストペーパーだったといううわさの Booming Up the Long Tails: Discovering Potentially Contributive Users in Community-Based Question Answering Services を読みました。 Icwsm読み会 from Akihiro Koide シンプルな話なのでなかなか面白かったです。 他の人が読んだのは、 Automatic Summarization of Events From Social Media あるイベントの要約をTwitterから獲得するために、尤もらしいTopK個のTweetを獲得するというもの。トピックモデルでは、基的にIIDを仮定しているが、Twi

    ICWSM読み会やりました(小規模) - KIWAM_KEN_DIARY
    sucrose
    sucrose 2013/08/18
  • 良い乱数・悪い乱数

    C言語標準ライブラリの乱数rand( )は質に問題があり、禁止している学会もある。 他にも乱数には様々なアルゴリズムがあるが、多くのものが問題を持っている。 最も多くの人に使われている乱数であろう Visual Basic の Rnd の質は最低である。 そもそも乱数とは 乱数とは、来サイコロを振って出る目から得られるような数を意味する。 このような乱数は予測不能なものである。 しかし、計算機を使って乱数を発生させた場合、 次に出る数は完全に決まっているので、予測不能とはいえない。 そこで、計算機で作り出される乱数を疑似乱数(PRNG)と呼び区別することがある。 ここでは、特にことわらない限り乱数とは疑似乱数のことを指すとする。 計算機でソフト的に乱数を発生させることの最大のメリットは、 再現性があることである。 初期状態が同じであれば、発生する乱数も全く同じものが得られる。 このことは

    sucrose
    sucrose 2013/08/18
  • Cのrand()よりmt19937の方が速いことがあるという話 - Educational NLP blog

    おはようございます。2年ぶりの記事ですね。 もう1月程前になってしまいましたが、id:sleepy_yoshi:20130720 で id:sleepy_yoshi さんが高速な非復元抽出をやっておられ、その中で、Cのrand関数を使っておられました。僕は、普段、std::mt19937を使っていたので、ちょっと比較してみた、という記事です。 C++11では、大別して、2つの擬似乱数生成の方法があります。1つはC(cstdlib)のrand関数で、高速ですが乱数の質が低く、もう1つはrandomヘッダのmt19937(メルセンヌ・ツイスタ)で、低速ですが乱数の質が高い(科学実験に適する)と、一般には思われていると思います。この高速・低速ですが、mt19937を使うことがボトルネックになるほど遅いことは殆どない、というのが今までの実感でした。なので、僕は、非復元抽出のような処理では、特にボト

    Cのrand()よりmt19937の方が速いことがあるという話 - Educational NLP blog
    sucrose
    sucrose 2013/08/18
  • コールバック……駆逐してやる…この世から…一匹…残らず!! - Qiita

    このテキストは JavaScript のコールバック地獄に疲れたひとのためのコールバック駆逐術指南書です。対象読者は JavaScript道初段くらいの人です。このテキストを読むと、以下のそれぞれの手段における非同期処理制御の仕組み、利点および欠点がわかるようになるかもしれません。 コールバック地獄 jQuery.Deferred async.js Concurrent.Thread generators co fibers Web Workers (※なぜか『進撃の巨人』の一部ネタバレが含まれるので注意してください) それは『何故人はコールバックするのか』という話でしょうか? 非同期処理って面倒ですよね。JavaScriptではいわゆる コールバック地獄 というやつにしばしば陥りがちです。たとえば、Ajax でふたつのファイル hoge.txt と piyo.txt を持ってきて、それら

    コールバック……駆逐してやる…この世から…一匹…残らず!! - Qiita
    sucrose
    sucrose 2013/08/18
  • 構文解析器の省メモリ化を頼まれた - ny23の日記

    外国の方から,公開している構文解析器を日語学習支援の Android アプリに使いたい,というメールが来た.前段の形態素解析器 (Kuromoji) は 10MiB 程度で動作するそうで(多少解析が遅くなっても良いから)構文解析器もその程度の消費メモリ(ディスク)で動かせないか,という質問(要望). 現在公開している構文解析器の消費メモリは (Mac mini Server (Late 2012)) で 28 MiB ぐらいで,構文解析器としては比較的省メモリな設計になっているのだけど,高速化のため素性の組み合わせを陽に展開しているのである程度メモリが必要となる.そこでまず,素性の組み合わせを展開しない PKI を分類に使うことを薦めてみた.手元で試したところ,解析速度は 1/60 ぐらいになってしまうが動作に必要となるメモリ・ディスクは 6 MiB ぐらいになった.[追記] ディスクは

    構文解析器の省メモリ化を頼まれた - ny23の日記
    sucrose
    sucrose 2013/08/18
  • Learning the meaning behind words

    The latest news from Google on open source releases, major projects, events, and student outreach programs. Today computers aren't very good at understanding human language, and that forces people to do a lot of the heavy lifting—for example, speaking "searchese" to find information online, or slogging through lengthy forms to book a trip. Computers should understand natural language better, so pe

    Learning the meaning behind words
    sucrose
    sucrose 2013/08/18
  • partake.in

    This domain may be for sale!

    sucrose
    sucrose 2013/08/18
  • 施策の効果をどうやって測るか(3) - compute.esパッケージによる効果量の計算 - About connecting the dots.

    前回までで説明した効果量について,実際にRで計算してみましょう.使用するのは{compute.es}パッケージです.基は実験系の研究分野でメタ分析を実施する際に使われるパッケージだそうです.パッケージマニュアルはこちらにあるので,詳細はこちらを見てください. 適用可能な検定の種類 対象となる検定と,効果量を算出するメソッドを以下にまとめました.いろいろ種類がありますね.たとえば2*2のクロス表におけるカイ二乗検定は,chiesを使えば効果量が算出できます.またt検定における平均値の差は,mesを使って同様に効果を算出することができます. 検定 効果量を算出するメソッド ANCOVA F-test a.fes() ANCOVA means a.mes() ANCOVA means (pooled sd) a.mes2() ANCOVA p-value a.pes() ANCOVA t-te

    sucrose
    sucrose 2013/08/18
  • はてなブログでのGoogleアドセンスの効率的な貼り方 - 無意味の意味

    2013-08-16 はてなブログでのAdsenseの効率的な貼り方 報告 さて金儲けの話をしましょう。金があれば色々便利です。そんな守銭奴ヤマネのこのサイトですが、以下の4つのGoogleのアドセンスで最もクリックされている位置はどれでしょう。 ①:サイドバー最上部(PCのみ表示) ②:記事下表示(PCとスマホ両方表示) ③:スマホタイトル下(スマホのみ表示) ④:タイトル右部(PCのみ表示) 結論から申し上げますと、③>②>①>④です。Googleのアドセンスは1ページに付き3個しかバナーを貼れない規約となっているため、④は現在削除していますがほぼクリックされませんでした。 売上内訳 詳しい金額はGoogleの規約上言えないのですが、直近1週間の比率で言うと以下のようになります。 ①:サイドバー最上部(PCのみ表示)→売上の約13% ②:記事下表示(PCとスマホ両方表示)→売上の約37

    sucrose
    sucrose 2013/08/18
  • 駄文にゅうす - 廃人クラスの個人ニュースサイト管理人は、更新終了後どういった生活を送るの?

    富山、観光 & アニメ舞台訪問まとめ おおかみこどもの雨と雪 「おおかみこどもの雨と雪」の花の家のモデルとなった古民家へ行ってみたよ 「おおかみこどもの雨と雪」の花の家のモデルとなった古民家へ行こうとする人達へ 棚田@おおかみこどもの雨と雪 動画 【おおかみこどもの雨と雪】古民家でまったり雨宿り【花の家】 ‐ ニコニコ動画(YouTube 高画質版) 「おおかみこどもの雨と雪」舞台訪問 「花の家」舞台モデル→大岩までの道 - YouTube 「おおかみこどもの雨と雪」舞台訪問 上市町北島付近→「花の家」舞台モデルまで - YouTube 称名滝 2005年5月中旬の午後2時から3時半にかけて撮影 ‐ ニコニコ動画 恋旅~True Tours Nanto~ 「恋旅~True Tours Nanto~」 フォトラリー用メモ改め行ってきた 立山黒部アルペンルート 8/20~8/31間、アルペンル

    sucrose
    sucrose 2013/08/18
    「カトゆーさんはどのくらいの数のRSSを巡回されているんですか?」「数えたことなかったですけど今見たら大体1100ほどですね…あと登録してないサイトは人力でいくつか」
  • わたモテ黒木智子が激しくSADであることについて | 社会不安障害と向き合う

    下の画像は世界のSAD(Social Anxiety Disorder:社会不安障害)当事者達の間で今話題になっているアニメの第一話のワンシーン。 主人公の女子高生黒木智子が学校の門を出たところで、先生に「気をつけて帰れヨ」と声をかけられ、硬直。声が出なくなり、挨拶もできなくなり、焦っているシーンである。 日のアニメであり現在放映中らしいが(オフィシャルページ)、このアニメについて知ったのは私がゆるく繋がっている日国外のSAD達からの情報だった。 なにしろSADという精神疾患を舞台の中央に置いた初めての漫画であり、大変画期的であると当事者たちに称賛されている。SADに悩む世界の多くの人々がこのアニメを見て「共感した」、「泣いてしまった」とネット上に書いている。 漫画として有名になったのは海外でのことで、いわば逆輸入的に日でも広まったらしい。 観て思った。この主人公は激しくSADである

    わたモテ黒木智子が激しくSADであることについて | 社会不安障害と向き合う
    sucrose
    sucrose 2013/08/18
  • オープンデータで運行情報を NHKニュース

    首都圏の鉄道各社と東京都は、電車が今、どこを走っているかを示すリアルタイムの運行データの公開に乗り出すことになりました。政府が進める「オープンデータ」の取り組みの一環で、新しいサービスの開発や災害時の活用につながると期待されます。 この取り組みに参加するのは、JR東日や東京メトロ、小田急電鉄など首都圏の鉄道12社と東京都交通局で、国土交通省や総務省、東京大学も協力します。 ここでは、これまで個別に管理され公開されていなかった、車やバスが今どこを走っているか示す位置や時刻のデータ、それに駅の混雑の情報などを、「オープンデータ」として公開していきます。 これによって、交通情報を使ったサービスを自由に開発できるようになり、例えば電車が走っている位置をスマートフォンの地図にリアルタイムで表示したり、目の不自由な人向けに運行情報を音声に変換して提供したりといった活用が期待されます。 さらに、災害な

    sucrose
    sucrose 2013/08/18