コミュニケーションが生まれるツイートまとめツール
先日@niamさんと@tsubosakaさんのつぶやきを見てて,確率{pi}で復元抽出するWalker's alias methodというものを知りました.たまたま,今日,復元抽出する用事があったので,思い出して調べた次第.私も昔同じことをやろうとして,O(log n)でいけるからまぁいいやと思っていたのですが,このアルゴリズムだとO(1)でいけます. 解説はこのあたりのブログを参照. 比較的高速な復元抽出アルゴリズム高速に非復元抽出をするアルゴリズムはないだろうか?(2)さて,私は理解力が足りなくてこのあたりの説明を読んでもなんでこれでいいのかさっぱりわからなかったので,絵に描いて理解しました.確率{pi}で復元抽出するためには,piに比例した面積の図形を壁に貼ってダーツをすればいいのです.{0.1, 0.05, 0.3, 0.1, 0.45}だったとします.するとこんなの. まさか毎回
指定した確率分布に従った乱数発生を効率的に行う「別名法 (alias method)」を Perl で実装してみた 2014-04-16-3 [Algorithm][Programming][学び] 取りうる値の個数が有限個の任意の離散分布に従う乱数を発生させる「別名法 (alias method)」を Perl で実装してみました。ロジックは下記参考文献に載っていたのそのままで、ソース中のコメントは引用となっています。 ■東京大学教養学部統計学教室 (編集), "自然科学の統計学", 東京大学出版会, 1992. 別名法は、例えば「大吉15%、中吉30%、吉30%、凶20%、大凶5%」の割合でランダムにおみくじを出すプログラムを書くときの効率的なアルゴリズムです。 深く考えない実装だと、 $r = rand(1) if ($r < 0.15) { return "大吉"; } elsif
第1回:予測と意思決定のためのアナリティクス技術 日時:2014年6月9日(月) 会場:化学会館7F(本会場) 受付開始時間:9:30~ 大阪大学中之島センター5F 講義室507(遠隔会場) 受付開始時間:9:30~ ビッグデータブームによって機械学習や統計科学をはじめとするアナリティクス技術がにわかに注目を浴びており、各所でデータ解析の取組が盛んに行われています。 しかしながら、ただ単にアナリティクス技術を適用しさえすればデータから素晴らしい価値が自動的に得られるというものではなく、データからアクションに結び付けていくことはそれほど容易なことではありません。本セミナーでは「予測」と「意思決定」、すなわちアクションにつながるアナリティクス技術に焦点を当て、最新技術動向と先進的応用を中心に基礎から解説します。 コーディネータ:鹿島 久嗣(京都大学 大学院情報学研究科 知能情報学専攻 教授)
Courseraの機械学習ネタの続き。今回はロジスティック回帰をやってみます。回帰と付くのになぜか分類のアルゴリズム。以前、PRMLの数式をベースにロジスティック回帰(2010/4/30)を書いたけど今回はもっとシンプル。以下の3つの順にやってみたいと思います。 勾配降下法によるパラメータ最適化 共役勾配法(2014/4/14)によるパラメータ最適化(学習率いらない!速い!) 正則化項の導入と非線形分離 ロジスティック回帰は線形分離だけだと思ってたのだけど、データの高次の項を追加することで非線形分離もできるのか・・・ 使用したデータファイルなどはGithubにあります。 https://github.com/sylvan5/PRML/tree/master/ch4 勾配降下法によるパラメータ最適化 2クラスのロジスティック回帰は、y=0(負例)またはy=1(正例)を分類するタスク。ロジステ
日本通信の三田聖二社長は、4月4日より全国のイオンで販売が始まった“イオンスマホ”について、10%のサンプル調査ながら購入者の60%が60歳以上であったことを自身のTwitterで明らかにしました。 また、このプロジェクトについて「大成功」ともつぶやいています。 Googleの「Nexus 4」と、日本通信の「スマホ電話SIM for Nexus 4」は、2014年4月4日より全国のイオンで販売されています。 三田社長は13日、次のようにつぶやいています。 10%サンプルですけれど、先週、60%のAEONスマホンのお客様は六十さい以上でした。 — Frank Seiji Sanda (@FSSanda) April 13, 2014 あくまでサンプル調査ですが、購入者の60%が60歳以上とのことです。また、具体的な数値は不明ですが、大半のユーザーが初めてのスマートフォンを持つユーザーである
総合情報サイト「Yahoo! JAPAN」を運営するヤフーが、全社を挙げてビッグデータの活用に熱を入れている。1日当たり約20億ページビュー(PV)、月間で約580億PVにも上るサイトの膨大なデータを分析して、ビジネス成長に向けた次の戦略に生かしていきたい考えだ。 そのための投資も惜しまない。ビッグデータ活用を支えるシステムとして、約3700台のサーバで構成される並列分散処理基盤「Hadoop」のクラスタを立ち上げたり、データサイエンティストと呼ばれるような統計やデータ分析に長けた人材を積極的に採用したりする。 2012年7月には、データ専門の組織であるデータソリューション本部を新設した。同本部は、Yahoo! JAPANにまつわるあらゆるデータを統括する。扱うデータの中身は、ユーザーのアクセスデータや検索データ、広告データ、地図データ、ショッピングの購買データ、会員登録データなど多岐にわ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く