2. Probabilistic Programming • 確率モデルをプログラムの形で書く • パラメータの推論の部分のコードはユーザが 書かずに自動で推論が行える • Ex: – BUGS (DSL) – Hierarchical Bayes Compiler (DSL) – Factorie (Scala) – Infer.NET (C#) 第5回自然言語処理勉強会 2
2. Probabilistic Programming • 確率モデルをプログラムの形で書く • パラメータの推論の部分のコードはユーザが 書かずに自動で推論が行える • Ex: – BUGS (DSL) – Hierarchical Bayes Compiler (DSL) – Factorie (Scala) – Infer.NET (C#) 第5回自然言語処理勉強会 2
宝クジの購入は非合理的 人間は確率的な思考が得意ではありません。宝クジが当たる確率は非常に低く、賞金の期待値は投資額の半分しかありません。宝クジの購入が非合理的なのは明らかです。にもかかわらず、たくさんの人が一攫千金を夢見て購入するのは不思議です。 宝クジの場合は嫌なら買わなければよいのですが、保険の種類の選択に悩んだり、携帯電話の料金プランに悩んだりと、確率計算と無縁に生活することは困難です。 間違えやすい確率問題 確率計算が必要な問題は、直感に反することがよくあるので注意が必要です。 誕生日一致問題 確率の見積りを間違えやすい例として、「N人の人間がいるとき、同じ誕生日の人がいる確率はどれぐらいか?」という問題があります。誕生日は365種ありますし、自分と同じ誕生日の人を知っていることは珍しいので、かなり多くの人間を集めないと誰かの誕生日が一致することはないだろうと思いがちです。しか
2011年03月09日22:00 カテゴリ書評/画評/品評Math 見事な取捨選択 - 書評 - 数学ガール/乱択アルゴリズム 数学ガール/乱択アルゴリズム 結城浩 著者ご本人より督促が。 弾さん、ツッコミRTもうれしいのですが、書評を書いて下さらんか(半分マジ) RT @dankogai: ミルカミザルカ< @hyuki: 数学セガール/沈黙のアルゴリズムless than a minute ago via Echofon結城浩 hyuki お待たせしました。 「カルキュラスのアリエッティ」でも「算法少女ミルカ☆テトラ」でもありません。本当の第四作です。 本書「数学ガール/乱択アルゴリズム」は、大好評シリーズとなった数学ガール第四作。 404 Blog Not Found:書評 - 数学ガール 404 Blog Not Found:孤独解消型数学入門 - 書評 - 数学ガール/フェルマー
私も線形計画法で双対性を教わったとき、「だから何なんだ」でした。しかしラグランジュ乗数法でわかって、線形計画法はその特殊な場合として納得できました。つまり少なくとも私の場合、ラグランジュ乗数法を経由しなければ双対性にどんな意味があるか、わかりませんでした。 f(x) を目的関数、g(x) = 0 を制約条件とすると、最適化問題 min_x {f(x) | g(x)=0} の解は、ラグランジュ関数 L(x,m) := f(x) + m g(x) の鞍点 dL/dx = dL/dm = 0 です。x が主変数、m が双対変数とかラグランジュ乗数と呼ばれるものです。 このとき L を見てわかるのは、最適点においては g を目的関数と思って f を制約条件と思っても x は同じだ、ということです。つまり目的関数と制約条件との役割を入れ替えても解は同じです。 これを制約条件がたくさんある場合に一般化
大相撲の勝敗結果を分析すると、ちょっとした不自然さが見つかります。前回に引き続き、ネット上のデータを利用して解析を試みます。八百長疑惑に揺れる角界ですが、その真相は? 今回の前口上 連載ものの途中なのにまた少し時間が空いてしまいました。申し訳ございません。ただそのお陰というわけでもありませんが、偶然にも大相撲の八百長事件が世間を賑わすという、この連載にとってはタイムリーな状況になりました。そこで、今回は過去12年のデータから八百長のような行為がデータで確かめられるかどうかということに内容をフォーカスしたいと思います。当初の予定だった、Yahoo!スポーツの大相撲データを自動採取して、Google Refineで自動整形させるというネタについては、次回以降に回したいと思います。 また、この「大相撲のアノーマリー」を計算するために利用しているデータは、Yahoo!スポーツから持ってきたために、
This domain may be for sale!
残念ながら、同じロジックは日本の宝くじには使えなさそうですが...。 北米では、宝くじは年間700億ドル(約5.7兆円)産業です。これは、映画興行と音楽とポルノを全部合わせたよりも大きな市場です。そんな宝くじ産業の根幹を揺るがす事件がありました。地質統計学者のモハン・スリヴァスタヴァさんが、カナダのスクラッチ式宝くじで「当たり」の券を見分ける方法を発見してしまったのです。 今月号のWIREDに、スリヴァスタヴァさんの話が載っています。彼は普段、金鉱の候補となった鉱山で採掘された石のサンプルを見て、その山でどれだけ金がとれそうか判断する仕事をしています。その仕事のときと同じ頭の使い方で、彼はカナダのTic-Tac-Toeというスクラッチ式宝くじの当たり券を90パーセントの確率で見破る手法を編み出しました。 その手法の前に、Tic-Tac-Toe(や、北米でよく使われているスクラッチ式宝くじ)
R による統計解析の基礎 中澤 港 3 目次 第 1 章 統計学とは何だろうか? 9 1.1 統計学の歴史 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.2 不確実性とランダム(乱雑さ) . . . . . . . . . . . . . . . . . . . . 10 1.3 統計解析の手順 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.4 統計解析の2大方針 . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.5 統計解析の道具 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 第 2 章
大村 平(おおむら ひとし、1930年〈昭和5年〉1月2日 - 2021年〈令和3年〉6月1日)は、日本の航空自衛官、著述家。 東京都出身。第18代航空幕僚長、技術畑からは初の航空幕僚長。工学博士。 自衛官としての勤務の傍ら、初等数学や統計学において啓蒙書を多数著した。 名古屋陸軍幼年学校に入校し2年時に終戦を迎えた。在学中はパイロットを目指していた[1]。終戦後は旧制・東京高校を経て東京工業大学に進学[1]。大学では機械工学を専攻し卒業後は製糸会社に勤めるが、仕事として今ひとつ物足りない感じを受け、1956年(昭和31年)に公募幹部(3等空尉)として航空自衛隊に入隊[1]。 入隊後は防府基地で1か月の入隊教育を受けたのち、浜松基地の実験航空隊に配属された[1]。その後、整備幹部の教育を受けて宇都宮基地へ派遣され、当時開発中のT-1練習機の整備の勉強と、その傍ら試験飛行にも携わる。当時のテ
日本発の「Topcoderトレーニング講座」は最強最速アルゴリズマーへの最短経路 こんな記事も出して貰えたところですし、凄く簡単に、自分の中での教育論みたいな部分を少し話してみようかと思います。 ある物事を習得するのに必要なのは何か?という話をした時に、僕が絶対に必要だと思っているのは、「すげぇ!!」ってなることだと思っています。当然だとは思いますが、せっかくなので具体例を見ていきましょう。 Wikipediaにおける、動的計画法の記事を見ると、このようになっています。 動的計画法(どうてきけいかくほう、英: Dynamic Programming, DP)は、コンピュータ科学の分野において、ある最適化問題を複数の部分問題に分割して解く際に、そこまでに求められている以上の最適解が求められないような部分問題を切り捨てながら解いていく手法である。分割統治法がトップダウン的な手法であるのに対し、
2011/01/23 "第9回 データマイニング+WEB 勉強会@東京−2nd Week−方法論・ソーシャル祭り−"を開催しました。 第9回 データマイニング+WEB 勉強会@東京 ( TokyoWebmining 9)−2ndW−方法論・ソーシャル祭り−: ATND Google グループ ※会場参加者ID写真(id:bob3 さんに感謝) 1st Week内容まとめ: 第9回 データマイニング+WEB 勉強会@東京 ( #TokyoWebmining #9) −1st Week− 大規模解析・機械学習・クオンツ 祭り− を開催しました - hamadakoichi blog 会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思ってい
何を隠そう、数学はこのブログ随一の非モテコンテンツ。 もうこの数学って単語見た瞬間にブラウザの戻るボタン押されたりタブ閉じたりされているんじゃないかって思ってる。 まー、でもここはそういうブログなのだ。 半年くらい前に始めた微積、実はもう3周目くらいに突入している。 1周目はホント辛くってさ、何もかもがほぼ忘却の彼方だったので予備知識はほとんどない状態だったんだ。もうね、高校生の頃に習ったような公式類を忘れているもんだからその歩みは匍匐前進レベル。ブックオフで高校生向けの参考書を買ってきて、あーそうだっけなぁと思いつつ復習してようやく元の微積の本に戻るということを繰り返していた。だから1周目は全体を俯瞰するだけと思っていたのに想定外に時間がかかりまくった。で、2周目にようやく突入して今度は練習問題を解くということを中心に。今の3周目は証明と応用に重心を置いて読んでいる感じ。 で、今その3周
2011/01/16 "第9回 データマイニング+WEB 勉強会@東京−1st Week− 大規模解析・機械学習・クオンツ 祭り−"を開催しました。 第9回 データマイニング+WEB 勉強会@東京 ( TokyoWebmining 9)−1st Week− 大規模解析・機械学習・クオンツ 祭り−: ATND Google グループ ※会場参加者ID写真(id:bob3 さんに感謝) 会場提供し運営を手伝って下さった ニフティ株式会社 のみなさん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。会場参加、USTREAM参加ともに多くの方々の参加を嬉しく思っています。 今回、第9回では初めて開催期間を2週に渡り開催します(1/16, 23)。2週開催の目的は1."多くのテーマを対象とし"、かつ 、2."各テーマにしっかりと時間を充て、深い議論を行えるようにす
背理法と数学的帰納法はなぜ嫌われるか?真鍋 和弘(札幌篠路高校)1.ぱじめに 証明法の中での背理法と数学的帰納法は日本では高校1年生(数学A)で学ぶことになっているが,これは少し早すぎるような気がしている.伝統的に日本では,数学は計算ができることが重視され,論理性を重んじるヨーロッパなどとは事情が異なるからである.しかし高校では背理法と数学的帰納法は必要ないかというと決してそうではなく,大学レベルの数学を学ぶ際には,これらのことに少しでも触れた経験がある学生とそうでない学生との間には相当の差が生じると思われる. 大学入試にあまり出題されないからという理由で,背理法と数学的帰納法をカットしている進学校も多いと思われるが,彼らが将来必要とする数学的素養はきちんと学ばせるべきだと思う.さらには,理工系の大学に進まない高校生にとっても,①背理法と数学的帰納法の考え方は面白く誰にでも理解できる内容で
「ノンパラメトリック」って言うくらいだからパラメータ無いんかと思ってたら、パラメータめっちゃあるし。 機械学習のネーミングのひどさはこれに始まった話じゃあないけど、それにしたって。 ノンパラの一番素朴なやつ( K-means とか)は本当にパラメータ無くてデータだけだから納得なんだけど、だんだん欲が出てパラメータ足しちゃったり派生させちゃったりしてるうちに、よくわかんなくなってきちゃったんだろうかねえ。まったく。 どれどれ、と英語版 Wikipedia の "Non-parametric statistics" を見たら、なんか意味が4種類くらい書いてあるし。じゃあ名前分けろよ。 en.wikipedia.org とりあえずここで言う「ノンパラ」とは、変数の個数決めなくていい「分布の分布」なメタっぽいやつのこと。つまりディリクレ過程とか、ディリクレ過程とか、そこらへん。 「あー、ノンパラベ
『NUMBERS 天才数学者の事件ファイル』(ナンバーズ てんさいすうがくしゃのじけんファイル、原題: Numb3rs、Numbers、公式には NUMB3RS)は、アメリカ合衆国で2005年から2010年にかけて放送されていたテレビドラマである。 FBI特別捜査官ドン・エプスと、彼に協力する弟の天才数学者チャールズ・エプスの活躍を描くドラマである。番組の製作総指揮はリドリーとトニーのスコット兄弟、制作はニコラス・ファラッチ (Nicolas Falacci) とシェリル・ヒュートン (Cheryl Heuton)、プロダクションはスコット・フリー・プロダクションズ、製作局はCBSパラマウント・ネットワーク・テレビジョン、アメリカではCBSネットワークで放送されていた。 日本ではサスペンスシアター FOXCRIMEで、2006年10月から第1シーズン、以後第2・第3シーズンまでが放送された
はじめに:2010年弾丸ツアー 今年一年を一言でまとめると、「データと向き合った」一年でした。 2009年の終わり、私は The Datacenter as a Computer の読書会を通して、分散システムによる大量なデータの処理がこれからの時代にもっと重要になるということを学びました。 The Datacenter as a Computer 読書会 その流れを受け、1月には id:marqs や id:daisukebe とともに「集合知プログラミング」の読書会を開き、データマイニングの基礎を勉強しました。 大量のデータを扱う前に、小さなデータを扱う術を身につける必要があると思ったからです。 Programming Collective Intelligence 100111View more presentations from Sho Shimauchi. 第1回集合知プログラ
「=」は代入演算子だとして、次のような関数呼び出しを考えてみます。 f(y = x + 1, x + y) 変数xの値が2, 変数yの値が5の状況を例とします。引数を左から右の順で評価するなら、関数に渡る実引数は f(3, 5) となり、f(x + 1, x + x + 1) と変わりません。最初のyの値は破壊されます。一方、引数の評価が逆順、右から左なら、f(3, 7)、つまり、f(x + 1, x + y) となります。 (y = x + 1, x + y) を式のタプルと見ると、タプル成分の評価順序を決めないと値が確定しません。このような状況も含めて、圏論により計算をモデル化をする試みが次の論文に載っています。 Title: Cartesian effect categories are Freyd-categories Authors: Jean-Guillaume Dumas,
『算法少女』(さんぽうしょうじょ)は、安永4年(1775年)に出版された和算書。当時の和算書で唯一、著者が女性名義になっている珍しい本であり、現在では国立国会図書館などでわずかに見ることの出来る稀覯本である。国会図書館に所蔵されている資料は国立国会図書館デジタルコレクションで閲覧できる[1]。また、1935年(昭和10年)に謄写版が古典数学書院から復刻された[2]。 本書を題材に、児童文学作家の遠藤寛子が小説『算法少女』を著していて[3][4]、同作は後に漫画化・アニメ映画化された[5]。 2009年(平成21年)に本書の現代語訳と問題の解答を解説し、資料として天理大学附属天理図書館蔵『算法少女』の影印を収録した『和算書「算法少女」を読む』がちくま学芸文庫から出版された[6]。 『算法少女』序文によると、娘が父親の協力の下にこの本を著わしたとあるが、本名はない。父親は壺中隠者、娘は単に平氏
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く