並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 4404件

新着順 人気順

正規分布の検索結果1 - 40 件 / 4404件

  • 平成31年度東京大学学部入学式 祝辞 | 東京大学 (上野千鶴子 - 認定NPO法人 ウィメンズ アクション ネットワーク理事長)

    平成31年度東京大学学部入学式 祝辞 ご入学おめでとうございます。あなたたちは激烈な競争を勝ち抜いてこの場に来ることができました。 女子学生の置かれている現実 その選抜試験が公正なものであることをあなたたちは疑っておられないと思います。もし不公正であれば、怒りが湧くでしょう。が、しかし、昨年、東京医科大不正入試問題が発覚し、女子学生と浪人生に差別があることが判明しました。文科省が全国81の医科大・医学部の全数調査を実施したところ、女子学生の入りにくさ、すなわち女子学生の合格率に対する男子学生の合格率は平均1.2倍と出ました。問題の東医大は1.29、最高が順天堂大の1.67、上位には昭和大、日本大、慶応大などの私学が並んでいます。1.0よりも低い、すなわち女子学生の方が入りやすい大学には鳥取大、島根大、徳島大、弘前大などの地方国立大医学部が並んでいます。ちなみに東京大学理科3類は1.03、平

      平成31年度東京大学学部入学式 祝辞 | 東京大学 (上野千鶴子 - 認定NPO法人 ウィメンズ アクション ネットワーク理事長)
    • 機械学習を使って東京23区のお買い得賃貸物件を探してみた - データで見る世界

      さて、改めて今回の目的を確認しておくと、機械学習を使って東京都23区のお買い得賃貸物件を発見しよう、というものです。前回までの記事で、お買い得賃貸物件を発見するためのデータを収集し、分析にかけられるよう前処理してきました。 www.analyze-world.com www.analyze-world.com 今回の記事では、いよいよ機械学習を使って分析していきましょう。前回まではPythonを使っていましたが、この分析ではRを用いています。なお、コードはGitHub(https://github.com/ShoKosaka/Suumo)に上げておきますので興味ある方は参照ください。 最初に、データの中身をざっくり見ていきます。具体的には、分析のキーになるポイントをグラフにしながら、賃貸物件の現状や変数同士の関係性を把握していきます。 データ探索 まず、23区の中でどこが物件数が多いのかを

        機械学習を使って東京23区のお買い得賃貸物件を探してみた - データで見る世界
      • Talpa memorandum

        橘玲の『「読まなくてもいい本」の読書案内』を読んだので、感想とメモをまとめておく。 この本、タイトルは『「読まなくてもいい本」の読書案内』だが、実際には「読まなくていい本」はほとんど紹介されていない。紹介されているのは、当たり前の話かもしれないが読むべき本だ。他の読書案内本と異なっているのは、”こういう本は読まなくて良い”と、ばっさり切り捨てているところ。読むべきか・読まなくてもよいかの基準は、20世紀後半に爆発的に進歩した科学研究の成果に置いている。著者は、この時期に起きた科学研究の大幅な進歩を”知のビッグバン”、”知のパラダイム転換”と呼び、これ以前に書かれた本は(とりあえず)読む必要がないと言い切る。古いパラダイムで書かれた本は捨てて、新しいパラダイムで書かれた本を読もうという話だ。ちょっと乱暴な分け方ではあるが、1980年代に大学生だった私には案外納得できるものだった。学生時代に最

        • データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家

          2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C

            データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
          • 1ヶ月で統計学入門したので「良かった本」と「学んだこと」のまとめ - ぴよぴよ.py

            前回の「ゲームプログラマからデータサイエンティストに転職しました」 の記事でもお話したとおり、5月からデータ解析する人になりました。 とはいえ、データ解析に関しては未経験。 少しでも不安を減らすために、4月の有給消化期間は統計学のお勉強しました。 今回はおすすめしてもらった中で読んで良かった本の紹介、そして読んだ本の簡単なまとめを書いて行きたいと思います。 ※前提: 4月時点の自分の知識に関して 自分は大学は情報科学を専攻していたが、難しい数式は苦手 統計学は1コマ分受講していたが、単語を覚えている程度でかなりあやうい まず一番最初に読みたい本 「完全独習 統計学入門」 「簡単に統計学の全体像がつかめる入門書はないか」とTwitterで相談したら、こちらの本を数名の方が薦めて下さった。 完全独習 統計学入門 作者: 小島寛之出版社/メーカー: ダイヤモンド社発売日: 2006/09/28メ

              1ヶ月で統計学入門したので「良かった本」と「学んだこと」のまとめ - ぴよぴよ.py
            • プログラミングできる人とできない人との間の深い溝 - masatoi’s blog

              どうしてプログラマに・・・プログラムが書けないのか?を読んでいて出てきたので出展の一つを訳してみた。Separating Programming Sheep from Non-Programming Goatsの和訳。 プログラミングというものには向き不向きが強く出るということはわりと知られていると思うが、このエントリではプログラミングができるかできないかは比較的簡単なテストによって、プログラミングの訓練を始める前の段階で分かると主張している。どうしてプログラマに・・・プログラムが書けないのか?では、そもそもこの事前テストをパスしていないような人達までプログラマとして応募してくると言っており、その判定法として有名なFizzBuzz問題を挙げている。 追記(2019/2/28) 注意: なおこの論文はしばらく前に著者の一人によって撤回されたようです Camels and humps: a r

                プログラミングできる人とできない人との間の深い溝 - masatoi’s blog
              • データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ

                追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層

                  データサイエンティストというかデータ分析職に就くための最低限のスキル要件とは - 渋谷駅前で働くデータサイエンティストのブログ
                • 数学を避けてきた社会人プログラマが機械学習の勉強を始める際の最短経路 - Qiita

                  巷ではDeep Learningとか急に盛り上がりだして、機械学習でもいっちょやってみるかー、と分厚くて黄色い表紙の本に手をだしたもののまったく手が出ず(数式で脳みそが詰む)、そうか僕には機械学習向いてなかったんだ、と白い目で空を見上げ始めたら、ちょっとこの記事を最後まで見るといいことが書いてあるかもしれません。 対象 勉強に時間が取れない社会人プログラマ そろそろ上司やらお客様から「機械学習使えばこんなの簡単なんちゃうん?」と言われそうな人 理系で数学はやってきたつもりだが、微分とか行列とか言われても困っちゃう人 この記事で行うこと 数学の基礎知識に慣れるための、数式が最初から出てこないプログラマ向けの数学入門書の紹介 機械学習の初学者には鉄板の、オンライン講座(MOOC)の機械学習コース紹介 環境 WindowsでもMacでもLinuxでも大丈夫(MATLAB/Octaveというツール

                    数学を避けてきた社会人プログラマが機械学習の勉強を始める際の最短経路 - Qiita
                  • 画像処理の数式を見て石になった時のための、金の針 - Qiita

                    画像処理は難しい。 Instagramのキレイなフィルタ、GoogleのPhoto Sphere、そうしたサービスを見て画像は面白そうだ!と心躍らせて開いた画像処理の本。そこに山と羅列される数式を前に石化せざるを得なかった俺たちが、耳にささやかれる「難しいことはOpenCVがやってくれるわ。そうでしょ?」という声に身をゆだねる以外に何ができただろう。 本稿は石化せざるを得なかったあの頃を克服し、OpenCVを使いながらも基礎的な理論を理解したいと願う方へ、その道筋(アイテム的には金の針)を示すものになればと思います。 扱う範囲としては、あらゆる処理の基礎となる「画像の特徴点検出」を対象とします(実践 コンピュータビジョンの2章に相当)。なお、本記事自体、初心者である私が理解しながら書いているため、上級画像処理冒険者の方は誤りなどあれば指摘していただければ幸いです。 画像の特徴点とは 人間が

                      画像処理の数式を見て石になった時のための、金の針 - Qiita
                    • 人生は運よりも、運の運用方法に大きく左右される - ふろむだ@分裂勘違い君劇場

                      高所得者が「オレは運が良かっただけ」と言うのはポジショントークであることが多いので、鵜呑みにしない方がいい。 彼らは、ある意味、イカサマ賭博をやっている。 このイカサマの正体を暴いてみる。 冷静に分析すると、私の知り合いの高所得者たちは、以下の様な特徴が多い。 ・人よりも多くのことを試す。 ・上手く行かなかった時に損切りするのが素早い。 ・「たまたま」上手く行ったら、その幸運を全力の全力で最大限利用して、スキル、実績、人脈、資産を得る。 ・一度スキル、実績、人脈、資産を得たら、それらを最大限に利用して、さらなるスキルと実績と人脈と資産を作り、それらが雪だるま式に増えていく。 ・運任せの大博打はしない。確実性の高い勝算のあるときだけ大きく賭ける。 ・人よりも多くの不運を想定し、不運を事前に回避するための手を人よりも念入りに打っている。 ・不運に見舞われたときのダメージを最小限にするための保険

                        人生は運よりも、運の運用方法に大きく左右される - ふろむだ@分裂勘違い君劇場
                      • 積分とは・対数とは・微分とは〜「分かる」とはどういうことか〜

                        文系向け「統計学」の授業で、積分・対数・微分を復習する機会があった。その時の「1枚スライド」を公開した。この図をめぐって、「分かる」とはどういうことか、について多くのコメントをいただいた。それを、まとめました。(話が同時並行で進行するので、スレッド風の「まとめ」です。) 注意:積分は、統計学の場合、正規分布表を見るために必要。対数の必要性は、尤度関数(尤もらしさ)の対数をとって計算を簡単にする式変形で使うため。微分の必要性は、確率密度関数の最大値(尤度最大の条件)を求めるため。どれも統計学で必須の内容。 注意2:(追記8/6)ここに出てくる「指数、対数、微分、積分」は「感染症の数理モデル」の基礎となっている。 注意3:(追記8月9日)番外編『「積分」と「源氏物語」〜「晩年の清少納言」から「京都女子大」まで』へのリンクはこちらです。https://togetter.com/li/157284

                          積分とは・対数とは・微分とは〜「分かる」とはどういうことか〜
                        • コンピュータサイエンスが気になるプログラマに勧める書籍リスト - Rubyist Magazine 第61号 巻頭言

                          コンピュータサイエンスが気になるプログラマに勧める書籍リスト Rubyist Magazine 第 61 号をお届けします。 (今回は内容に合わせて文体を変えております。ご了承ください。) さて、コンピュータサイエンス(以下「CS」)は知らないけど日々プログラミングしている、というプログラマの方はたくさんいらっしゃるかと思います。 そんな方でも、ふとCSを知ってる方がいいのかなとか、CSも知らないとまずいのかな……などと思い、改めて勉強してみたいけどとっつきが悪いとか、うっかり手にとったCSの教科書が何を言ってるかさっぱりで10秒で閉じた、という方もいらっしゃるかと思います。 それでもCSが気になるので、「本腰を入れて勉強をする前に、どういうことをやってるのか眺めてみたい」くらいの温度感の方向けに、CSに隣接するジャンルで、職業プログラマや趣味プログラマの人なら読めそうな書籍のリストを作っ

                          • まあ、なんちゅうか、トラバも盛大に伸びているので、私の書くここまで、..

                            まあ、なんちゅうか、トラバも盛大に伸びているので、私の書くここまで、元増田は辿り着かないかもしれませんが・・・ 私はゲノム科学者ですが、元増田の持つ疑問は、別に自然なものだと思うんですよね。というより、ゲノム配列決定が非常に身近になっている昨今、ちゃんと向き合っていかなければならない疑問だと思っています。私は私の持つ知識の範囲で、疑問にお答えしたいと思います。倫理は専門外なので扱いません。タブーとか扱いません。裏の意図を読もうとしているブコメが多数ありましたが、理系なのでよくわかりません。 まず、元増田の挙げているような、運動能力、将棋の能力、見た目の美醜とか、学歴、といったヒト個人ごとに異なる特徴を「形質」と言います。形質を遺伝学の観点から見ると大きく分けて二つあり、単一遺伝子型(メンデル型)と多遺伝子型(多因子型)です。 おそらく優生学にせよ遺伝にせよ、専門外の人が通常頭に思い浮かべる

                              まあ、なんちゅうか、トラバも盛大に伸びているので、私の書くここまで、..
                            • 行動経済学の『ずる』は予想以上に不合理 - 本しゃぶり

                              ダン・アリエリーの論文の一つに再現性が無い。 調査の結果、データが全部捏造されたものだという。 どうしてこうなった。 ダン・アリエリーへの疑い ベストセラーとなった行動経済学の本に『予想どおりに不合理』がある。このブログでも何度かお勧めしている本で、読んだ人も多いだろう。 予想どおりに不合理  行動経済学が明かす「あなたがそれを選ぶわけ」 作者:ダン アリエリー早川書房Amazon 本書の著者、ダン・アリエリーが共著者である論文について、データ捏造の疑いがかけられ話題となっている。 実験の主導者であるアリエリーは、「データが捏造されていること」については同意しているが、問題のデータは研究パートナーの「保険会社からもらったもの」であり、自分および共同執筆者たちはプライバシーの観点からデータ収集・データ入力・データのマージには関与していないと言っている*1。 本件はデータの不正を暴く過程が面白

                                行動経済学の『ずる』は予想以上に不合理 - 本しゃぶり
                              • 勉強に役立ちそうなエントリの一覧 - 大人になってからの再学習

                                このブログでカバーされている「勉強に役立ちそうなエントリ」の一覧です。 ★をつけたものは、書くときに頑張ったような気がするので、見て損は無いと思う。というもの。 ■ 理工系の大学学部生くらいを対象とした用語の説明 ・★ベクトルの内積とは - 大人になってからの再学習 ・★固有ベクトル・固有値 - 大人になってからの再学習 ・★log(1+x)のテイラー展開・マクローリン展開 - 大人になってからの再学習 ・★写像:単射、全射、全単射 - 大人になってからの再学習 ・★フーリエ変換 - 大人になってからの再学習 ・★フーリエ級数展開の式を理解する - 大人になってからの再学習 ・★フーリエ級数展開の式を理解する(2) - 大人になってからの再学習 ・★プログラミングで理解する反射律・対称律・推移律・反対称律 - 大人になってからの再学習 ・★群・環・体 - 大人になってからの再学習 ・★分散

                                  勉強に役立ちそうなエントリの一覧 - 大人になってからの再学習
                                • 国政選挙で勝つということ - やしお

                                  自民党総裁選と衆院選を控えて、最大野党の立憲民主党も政策アピールに入っていて、その政策が刺さらない、粒度が変、センスがない、安保も経済もない、と左右両サイドからネットで叩かれる光景をよく見かけて、ちょっと思ったことのメモ。 選挙戦 「選挙で勝つ」には「票をたくさん集める」が必要で、その票には大きく分けて、投票時点での世の中の空気感や、党や候補者のイメージに左右されて入る浮動票と、特定の党や個人に固定的に投票される組織票とがある。投票率が高ければ浮動票の比率も高まり「風が吹く」と言われるような大勝/大敗が起こり得るし、低ければ組織票の比重が大きくなる。 浮動票と組織票には、それぞれ党自体の方針で確保されるものと、候補者・国会議員や地方組織・地方議員の働きによるものとがある。 この4つのエリアそれぞれで対応が必要になる。(ただ各エリアで確保できても調和が取れていない/方針がちぐはぐだと政権交代

                                    国政選挙で勝つということ - やしお
                                  • 統計学を勉強するときに知っておきたい7つのポイント

                                    マイクロソフト社が技術分野でもっと熱い専攻の一つとして分析/統計をあげている(Microsoft JobsBlog)。同社以外でも統計学は、今後最も有益なスキルの一つだと考えているようだ(NYT - For Today’s Graduate, Just One Word: Statistics)。しかし、データマイニングの話も一般化しつつあって学習ノウハウなども公開されているが、経験にあわない部分が多い。統計学を初めて勉強するときに知っておいた方が良い7つのポイントをあげてみた。 1. 学習機会やテキストは山のようにあるので利用する 確率・統計の日本語テキストは山のようにあり、大学のコースワークを振り返っても、理文問わずにほとんどの学部で確率・統計はあったはずだ。大学院のコースワークでは英語の文献を好む傾向があるが、上級テキストでも日本語のものも少なくない。また「マンガでわかる統計学」のよ

                                      統計学を勉強するときに知っておきたい7つのポイント
                                    • 制御工学の基礎あれこれ

                                      In English ■初めに PID制御や現代制御などの制御工学(理論)の基礎や、制御工学に必要な物理、数学、ツール等について説明します。 私のプロフィールを簡単に説明しますと、私は自動車関連企業に勤めており、そこで日々制御工学(理論)を利用しながら設計開発をしております。 ここで説明する内容は、制御理論を扱い実際にモノに実装していく上で最低限理解しておいた方が良い内容と思います。 少しでも皆様の役に立ち、学力の底上げに貢献し、ひいては日本の発展、ひいては人類の発展に貢献できたらこの上ない喜びです。 内容を説明する際に次のことを心掛けています。 ① できるだけシンプルに。より少ない文章で内容を的確に説明する。 ② 1ページの記事のボリュームを多くし過ぎない ③ 文字のフォントは大きすぎず、行間を開けすぎない。(画面スクロールが頻繁になると情報が伝わりづらくなる) ④ 内容の説明とは直接関

                                      • Wikipediaがわかりにくいので(数学とか)、わかりやすいサイトを作ってみた - 大人になってからの再学習

                                        このブログをはじめてから2年8か月と少し(ちょうど1000日くらい)が経った。 これまでに公開したエントリの数は299。 つまり、このエントリは記念すべき第300号!というわけ。 ブログとしてある程度の存在を認められるには300記事が1つの目安であるという説があるので[要出典]、 この300回目のエントリは当ブログにとって大きな節目と言える。 前回299号のエントリでは「なぜWikioediaはわかりにくいのか(数学とか)」という内容を書いた。 そこで言いたかったことを3行でまとめると次の通り。 ■ Wikipediaの説明は理工系の初学者にはわかりにくいね。 ■ そもそも説明のアプローチ(思想とも言う)が違うので、わかりにくくて当然だね。 ■ もっとわかりやすい説明の仕方がありそうだね。特に図を使った説明は直観的な理解を助ける力があるね。 まぁ、だいたいこんな感じ。 そして、その記事につ

                                          Wikipediaがわかりにくいので(数学とか)、わかりやすいサイトを作ってみた - 大人になってからの再学習
                                        • Web系女子がLispと出会って統計学に目覚めるまでのお話 - あんちべ!

                                          こんにちは!今年の春からWeb系企業でHTML/CSSデザイナーとして働きだしたキラキラ女子(を目指してる)のあんちべ(23)です!よろしくお願いします!私は普段自社のWebサービスのCSSなどを書いている*1のですが、最近データマイニングに興味を持ち始め、データを分析して、自社サービスの売り上げ改善に貢献したいなーと思うようになりました!でも。。。私は文系出身で統計学とか全然わからない*2し、プログラミングも得意じゃない*3し、高価な統計解析ソフトを買うのも辛いです。。。無い無い尽くしですね><;!そんな私に救いの手が!インストール作業不要で、便利な統計処理機能が色々あって、しかも無料という素晴らしいソフト*4を発見しました!その名も"Incanter"です!なんでも、 Lispっていう古くから使われてきた実績のあるプログラミング言語で動いてて、Lispの文法でどんな処理をすればよいかを

                                            Web系女子がLispと出会って統計学に目覚めるまでのお話 - あんちべ!
                                          • この本がスゴい!2013

                                            人生は短く、読む本は尽きない。 せめて「わたし」が知らない凄い本と出合うべく、それを読んでる「あなた」を探す。このブログに込めた意味であり、このブログを通じて数え切れないほど「あなた」に教えてもらった。 ともすると自分の興味を森羅と取り違えがちなわたしに、「それがスゴいならコレは?」とオススメしてくれる「あなた」は、とても貴重で重要だ。そんな「あなた」のおかげで、ネットやリアルを通じて出会い、ここ一年で読んできた中から選りすぐりを並べてみる。 なお、ここでの紹介は氷山の一角、一番新しくアツいのは、facebook「スゴ本オフ」を覗いてみてほしい。読まずに死ねるか級がざくざくあるゾ。 フィクション ■ 『東雲侑子は短編小説をあいしている』 森橋ビンゴ(ファミ通文庫) ラノベを読むのは、存在しなかった青春を味わうため。 「いいおもい」なんて、なかった。劣等感と自己嫌悪に苛まれ、鬱屈した日々が終

                                              この本がスゴい!2013
                                            • 機械学習に本気で取り組むためにやった数学周り 前半戦結果 - きのこる庭

                                              自分と同じようなバックグラウンドで「機械学習周辺の数学まわりの勉強をしたい」という人の助けに少しでもなれればと思い、半年間の勉強の軌跡を公開することにした。 ● 前提 ・数学の勉強と言える勉強は高校数学で言う所の数II・Bまでしかやってこなかった。 ・数学が超得意だったかというとそういうわけではなく、まあ普通なライン。 ・大学は情報系で文理一緒だけど、正直大学数学らしい数学はあまりやってこなかった。 ・社会人になって以来ずっと数学コンプレックスで「大学の時もっと理系の勉強をしておけばよかった」と後悔する日々だった。 ・「とにかくツールとか沢山触りまくって慣れた方が良い」という意見も沢山頂いていたのだけど、 – やはり専門の文献を読むとブワーッと数式が出て来て「うっ」となる自分が情けなく感じる経験をした – このまま勉強しないで年をとった後に「あの時やっておけば」という後悔はしたくなかった

                                                機械学習に本気で取り組むためにやった数学周り 前半戦結果 - きのこる庭
                                              • 画風を変換するアルゴリズム - Preferred Networks Research & Development

                                                Deep Neural Networkを使って画像を好きな画風に変換できるプログラムをChainerで実装し、公開しました。 https://github.com/mattya/chainer-gogh こんにちは、PFNリサーチャーの松元です。ブログの1行目はbotに持って行かれやすいので、3行目で挨拶してみました。 今回実装したのは”A Neural Algorithm of Artistic Style”(元論文)というアルゴリズムです。生成される画像の美しさと、画像認識のタスクで予め訓練したニューラルネットをそのまま流用できるというお手軽さから、世界中で話題になっています。このアルゴリズムの仕組みなどを説明したいと思います。 概要 2枚の画像を入力します。片方を「コンテンツ画像」、もう片方を「スタイル画像」としましょう。 このプログラムは、コンテンツ画像に書かれた物体の配置をそのま

                                                  画風を変換するアルゴリズム - Preferred Networks Research & Development
                                                • もうなんか間違ったことしか書いてなくて増田が何でこんなもの書こうと思..

                                                  もうなんか間違ったことしか書いてなくて増田が何でこんなもの書こうと思ったのかちょっと意味が分からないんだけど 一応気になったところだけ訂正・説明を入れておく。(ほぼ全文にわたっているが…) 途中で「なんでこんな中間テストの採点みたいなことやってんの…」みたいな気分になったけど 万が一これを読んで本気にしている人がいるといけないので義務感で最後まで書きました。 あまりの衝撃に最初からテンション高いですけどね。もう疲れたからこのまま上げます。 なんなんやいったい... 遺伝病の断種は、遺伝病の根絶について特に有効ではないと考えられています。まず、潜性遺伝病の場合はどうでしょうか。これは、両方の染色体に、多くは遺伝子機能欠失型の遺伝子変異があると起こります。親は、片方しか持っていなければ健康なのですね。すると、両方の遺伝子変異を持つ遺伝病患者を断種させたところで、片方だけを持つ親が世の中にたくさ

                                                    もうなんか間違ったことしか書いてなくて増田が何でこんなもの書こうと思..
                                                  • 株式会社ディー・エヌ・エー 第三者委員会調査報告書の全文開示公表のお知らせ (キュレーション事業に関する件)

                                                    2017 年3月 13 日 各 位 会 社 名 株式会社ディー・エヌ・エー 代表者名 代表取締役社長兼 CEO 守安 功 (コード番号:2432 東証第一部) 問合せ先 執行役員経営企画本部長 小林賢治 電話番号 03-6758-7200 第三者委員会調査報告書の全文開示公表のお知らせ 2017 年3月 11 日に第三者委員会(注)より調査報告書を受領いたしましたので、その 全文を添付のとおり公表いたします。 (注)2016 年 12 月 15 日開示の「第三者委員会の設置に関するお知らせ」および 2016 年 12 月5日開示の 「キュレーションプラットフォーム事業に関するお知らせ~第三者調査委員会の設置および当社キュレーションプラッ トフォームサービス全記事非公開化に関するお知らせ~」参照 以上 本件に関するお問い合わせ先 株式会社ディー・エヌ・エー(http://dena.com/

                                                    • Web開発におけるコンピュータサイエンス - 機械学習編1 - Hatena Developer Blog

                                                      この教科書は、はてなサマーインターンの講義資料として作成されたものです: https://github.com/hatena/Hatena-Textbook この章では機械学習について、Webサービスの開発で必要とされる知識を中心に、とくに自然言語処理にフォーカスしながら解説します。 Webサービス開発と機械学習 実現困難な機能の例 闇雲な実装 もう少しましな実装 機械学習によるパラメータ決定 分類問題のための機械学習手法 パーセプトロン 判別アルゴリズム 学習アルゴリズム 特徴量のとり方 形態素解析 量をともなう特徴 組み合わせ特徴量 モデル 機械学習の種類 教師あり学習 分類 (質的変数の予測) 回帰 (量的変数の予測) 教師あり学習でのデータセット 教師なし学習 クラスタリング 次元削減(次元圧縮) 頻出パターンマイニング 異常値検出 アルゴリズムの評価 訓練データとテストデータ 学

                                                        Web開発におけるコンピュータサイエンス - 機械学習編1 - Hatena Developer Blog
                                                      • 標準偏差とは何か!その求め方と意味を図解で徹底解説

                                                        ここでは高校数学で登場し、統計学を学ぶ上でとても重要な役割を担う「標準偏差」について、図解を駆使し、その求め方と意味について解説していきます。 標準偏差の求め方や意味を理解するには、以下の4つのSTEPを踏めば簡単に理解することができます。 標準偏差は「式を覚える」のではなく「イメージ化」することがとても重要です。 4つのSTEPを本質的なイメージで捉えることで「標準偏差とは何か」や「標準偏差はどうやって求めるのか」がスッキリ頭に入ってきますので、ぜひ最後までお付き合い下さい。 標準偏差の求め方 標準偏差を求める式がこちらになります。 いきなりかなり難しい式が登場してきました(汗 この式を覚えることはなかなか厳しいですよね。 ただ、この式の記号のひとつひとつをイメージ化しながら読み解くことで、この難しい式が実はとてもストーリー性のある面白い構造をしていることが分かってきます。 ここではその

                                                          標準偏差とは何か!その求め方と意味を図解で徹底解説
                                                        • 【Day-14】株価や仮想通貨で使える、5つのテクニカル分析を解説&Pythonで実装してみた - プロクラシスト

                                                          データ分析ガチ勉強アドベントカレンダー 14日目。 時系列データでまず思いつくのは、株価のチャートですよね。 また、最近はやっている仮想通貨。私も最近coincheckに入金しました。 ビットコイン取引所 "coincheck" やっぱ、実際にお金が絡むとちゃんと勉強しようって言う気になる!笑 せっかくチャートを見るわけだし、その見方について勉強しておこうと思いました。 そしてせっかくなので、自分で実装してどういう仕組みなのかまで知っておこうと思いました。 理系だからね、分からないものを使うのは嫌だからね。 というわけで、Python(主にPandasとMatplotlibを用いながら)でテクニカル指標についてやっていきます。扱うデータは三年分の日経平均株価。 指標について知りたい人も、自分で実装してみたいという人もどうぞ。 テクニカル分析とファンダメンタル分析 実装において ローソク足

                                                            【Day-14】株価や仮想通貨で使える、5つのテクニカル分析を解説&Pythonで実装してみた - プロクラシスト
                                                          • 現役東大生だが上野千鶴子の祝辞はゴミだと思う

                                                            女子学生の置かれている現実その選抜試験が公正なものであることをあなたたちは疑っておられないと思います。もし不公正であれば、怒りが湧くでしょう。が、しかし、昨年、東京医科大不正入試問題が発覚し、女子学生と浪人生に差別があることが判明しました。文科省が全国81の医科大・医学部の全数調査を実施したところ、女子学生の入りにくさ、すなわち女子学生の合格率に対する男子学生の合格率は平均1.2倍と出ました。問題の東医大は1.29、最高が順天堂大の1.67、上位には昭和大、日本大、慶応大などの私学が並んでいます。1.0よりも低い、すなわち女子学生の方が入りやすい大学には鳥取大、島根大、徳島大、弘前大などの地方国立大医学部が並んでいます。ちなみに東京大学理科3類は1.03、平均よりは低いですが1.0よりは高い、この数字をどう読み解けばよいでしょうか。↑ソースはここhttp://www.mext.go.jp/

                                                              現役東大生だが上野千鶴子の祝辞はゴミだと思う
                                                            • アブラハムPB社「いつかはゆかし」事業に対する公開質問状: やまもといちろうBLOG(ブログ)

                                                              このいちぶぶろぐのどくしゃのみなさま、たいへんおさわがせしております。 この記事は、「いつかはゆかし」のサービス元であるアブラハム・プライベートバンク社(以下、アブラハム社)に対する意見表明と公開質問状となっております。 アブラハム社代理人より頂戴していました、問題とされるエントリーおよびこの写しとなっているBLOGOSの当該記事については、指定された3月7日18時に一時非表示の対応をいたしました。読者の皆様におかれましては、くれぐれも魚拓を取ったりローカルにjpg保存するなどしたデータをほうぼうに流通させないようお願いいたします。 問題点を要約した内容をプレスリリースとして報道全社に対して打っておきました。お時間のない方はこちらで私の持っております問題意識の全容をご確認ください。 「いつかはゆかし」虚偽広告と不正販売キックバックの疑いか アブラハム「いつかはゆかし」事業に関する公開質問状

                                                                アブラハムPB社「いつかはゆかし」事業に対する公開質問状: やまもといちろうBLOG(ブログ)
                                                              • 脱成長派は優し気な仮面を被ったトランピアンである――上野千鶴子氏の「移民論」と日本特殊性論の左派的転用/北田暁大 - SYNODOS

                                                                脱成長派は優し気な仮面を被ったトランピアンである――上野千鶴子氏の「移民論」と日本特殊性論の左派的転用 北田暁大 社会学、メディア史 政治 #新自由主義#脱成長#移民論 以下では上野千鶴子氏の「移民悲観論」について相当に厳しい調子で批判を展開する。読者のなかには、「それほど強く批判する必要はない」「上野氏の業績を否定するのか」といった印象を持つ方が一定数いらっしゃると思う。たしかに、我ながらいささか感情的に書き殴っているという自覚は持っている。 私自身は、上野氏に学問的にも人間的にも大きな恩義を感じているし、日本のフェミニズムを切り開いた上野氏の業績に畏敬の念を抱いている。しかしここ数年、しばしば見かける上野氏の、おそらくは無自覚の「新自由主義」的な議論に危うさを感じ、学恩を受けた一人として、その議論の問題について対談やSNSなどさまざまな場で、同時代の社会学者として疑問を投げかけてきた。

                                                                  脱成長派は優し気な仮面を被ったトランピアンである――上野千鶴子氏の「移民論」と日本特殊性論の左派的転用/北田暁大 - SYNODOS
                                                                • Perlでアニメ顔を検出&解析するImager::AnimeFace - デー

                                                                  というのを作ったので自己紹介します。 2月頃から、コンピュータでアニメ顔を検出&解析する方法をいろいろ試しつつ作っていて、その成果のひとつとして、無理やり出力したライブラリです。 はじめに はじめにざっとライブラリの紹介を書いて、あとのほうでは詳細な処理の話を僕の考えを超交えつつグダグだと書きたいと思います。 Imager::AnimeFaceでできること Imager::AnimeFaceは、画像に含まれるアニメキャラクター的な人物の顔の位置を検出し、さらに目や口など顔を構成する部品位置や大きさの推定、肌や髪の色の抽出を簡単に行うことができるライブラリです。 これらが可能になると、 画像から自動でいい感じのサムネイルを作成できる 動画から自動でいい感じのサムネイルを作成できる 自動的にぐぬぬ画像が作れる 自動的に全員の顔を○○にできる 顔ベースのローカル画像検索 など、最新鋭のソリューシ

                                                                    Perlでアニメ顔を検出&解析するImager::AnimeFace - デー
                                                                  • Deep Learningで「いらすとや風人間画像生成モデル」を作った話(DCGAN、Wasserstein GAN) - ぬいぐるみライフ?

                                                                    フリー素材サイト「いらすとや」に出てくる人間風の画像を自動生成するモデルをDeep Learningで作りました。実装にはGoogle製のライブラリ「TensorFlow」と機械学習アルゴリズムの「DCGAN」「Wasserstein GAN」を用いています。 以下は生成された人間画像のうちそれなりにきれいなものの一例です。頬のところが赤くなっていて何となく本家いらすとやの特徴を捉えられていると思います。 「いらすとや」とは? 実装した手法の概要 DCGAN、Wasserstein GANについて Generator Discriminator GeneratorとDiscriminatorの学習 学習や実装の詳細 Generator、Discriminatorのネットワーク構成やパラメーター 訓練データ その他 学習経過 モデルを検証する 入力にバイアスを掛けていい画像を出やすくする ま

                                                                      Deep Learningで「いらすとや風人間画像生成モデル」を作った話(DCGAN、Wasserstein GAN) - ぬいぐるみライフ?
                                                                    • 出産予定日の死産がつらかったので書く(男性視点)

                                                                      タイトルそのままの内容なので閲覧には注意されたい。一部の人にはつらい記憶を思い出させてしまうかもしれない。女性視点の体験記は数多くある一方で、男性視点のものは少ない。妻が妊娠すると男性も覚悟を決める。しかし、(過去の自分も含めて)何が起こり得るかはぼんやりとしか想像できない。稚拙ながらも自分の体験と後悔を書き残しておけば、その解像度が上がるかもしれない。そう思い投稿する。 分娩室。妻につながれた医療モニタが歪なサインカーブを描いていた。正確にはサイン波の絶対値のような概形でゼロ区間が長い。波形がピークに近づくにつれて妻のうめき声が大きくなる。これが陣痛発作だ。間欠的な小休止を挟みつつ、数分おきに発作が起こる。モニタの値が妻の痛みを表している。全力で妻をサポートしたいなら、助産師の動きを脳裏に焼き付けて、完全に模倣すればよい。一挙手一投足に意味がある。プロの動きを邪魔しないように、分娩室の俯

                                                                        出産予定日の死産がつらかったので書く(男性視点)
                                                                      • WebサービスのA/Bテストや機械学習でよく使う「確率分布」18種を解説 - paiza times

                                                                        主な確率分布の関連図 こんにちは、吉岡(@yoshiokatsuneo)です。 Webサービスを運営していると、利用状況を分析・予測したり、A/Bテストなどで検証したりすることがよくあります。 データを一個一個見ていてもよくわからないので、データ全体や、その背景の傾向などがまとめて見られると便利ですよね。そんなとき、データの様子を表現するためによく使われているのが「確率分布」です。 学校の試験などで使われる偏差値も、得点を正規分布でモデル化して、点数を変換したものです。 今回は、Webサービスなどでよく使われる確率分布18種類を紹介します。 それぞれ、Webサービスでの利用例やPythonでグラフを書く方法も含めて説明していきます。コードは実際にオンライン実行環境paiza.IOで実行してみることができますので、ぜひ試してみてください。 【目次】 正規分布 対数正規分布 離散一様分布 連続

                                                                          WebサービスのA/Bテストや機械学習でよく使う「確率分布」18種を解説 - paiza times
                                                                        • 今起きている革命、「因果革命」とは - Qiita

                                                                          みなさまは"The Causal Revolution" (因果革命)という言葉を聞いたことがあるでしょうか? 私は今月(2021年6月)に初めて知りました。Google Trendsでもデータ不足によりトレンドが表示されません。 つまりまだ全然マイナーな概念で、聞いたことがないほうが自然かと思われますが、これは「来る」と確信したため本記事を投稿しました。この確信の根拠の箇所を記事中で太字で書いた他、最後にもまとめたため、本記事を読む価値がありそうかの判断には先にそちらを読んでもらってもいいかもしれません。しかしながら、因果革命ないし統計的因果推論は学ぶ価値のある分野です。本記事を読まなくても下記に挙げた書籍を未読の方はぜひ一読してみてください。Qiitaでも因果推論についての記事はいくつもあります。しかし、私が感動した点を明示化した記事は見当たらなかったため本記事を投稿しました。 この記

                                                                            今起きている革命、「因果革命」とは - Qiita
                                                                          • 統計屋のためのAWK入門 - あんちべ!

                                                                            はじめに 本稿はAWKという言語を用いて、 ごく簡単にデータ分析用の前処理*1をするための解説記事です。 AWKは短いコマンドを記述するだけで多様なデータ処理を可能にします。 特にデータの抽出に関して恐るべき簡易さを提供します。 具体的には、input.txtというファイルの中から "fail"という文字列を含む行を抽出したければ次のように書くだけです。 awk /fail/ input.txt つまり、スラッシュ記号で文字列を指定するだけで その文字列を含む行を抽出できるのです。 大変簡単ですね! また、awkはLinuxやMacには標準で入っており、 Windowsでもawk.exeを一つ用意するだけなので、 面倒なインストール作業や環境構築は不要で誰でも即座に使えるため、 自分で書いた処理を他人に渡したり*2各サーバに仕込むなども簡単に出来ます。 複雑な処理をする場合はPythonや

                                                                              統計屋のためのAWK入門 - あんちべ!
                                                                            • 統計の基本事項

                                                                              トップページ→研究分野と周辺→システムの評価→ 基本統計量 平均(算術平均)値は、(データ値の総和)÷(データ数)となる。(或るデータの値)-(平均値)を、そのデータの偏差という。偏差の絶対値の大きいデータが多ければ、そのデータ群はばらつきが大きい。データ群のばらつきの大きさを単純に偏差の総和とすると、偏差には正負があるので相殺されてしまう。 そこで、各データの偏差を二乗する(こうすれば必ず正の値になる)。(各データの偏差の二乗の総和)÷(データ数)をそのデータ群の分散と呼び、ばらつきの大きさを表す。また、分散の平方根を標準偏差という。英語では偏差はDeviation、分散はVariance、標準偏差はStandard Deviationとなるので、標準偏差はS.D.と略記される事も多い。 統計の最も基本的な量である基本統計量としては、他に最大値、最小値、範囲(最大値-最小値)、中央値(デ

                                                                              • 「p値や有意性に拘り過ぎるな、p < 0.05かどうかが全てを決める時代はもう終わらせよう」というアメリカ統計学会の声明 - 渋谷駅前で働くデータサイエンティストのブログ

                                                                                以前から同様の指摘は様々な分野から様々な人々が様々な形で出してきていましたが、アメリカ統計学会が以下のような明示的な声明をこの3月7日(現地時間)に発表したということで注目を集めているようです。 AMERICAN STATISTICAL ASSOCIATION RELEASES STATEMENT ON STATISTICAL SIGNIFICANCE AND P-VALUES Provides Principles to Improve the Conduct and Interpretation of Quantitative Science https://www.amstat.org/newsroom/pressreleases/P-ValueStatement.pdf The ASA's statement on p-values: context, process, and p

                                                                                  「p値や有意性に拘り過ぎるな、p < 0.05かどうかが全てを決める時代はもう終わらせよう」というアメリカ統計学会の声明 - 渋谷駅前で働くデータサイエンティストのブログ
                                                                                • 「がんばっても報われない社会が待っている」東大の入学式で語られたこと【全文】

                                                                                  さらに、東大入学者の女性比率が「2割の壁」を超えないことを挙げ、「社会に出れば、もっとあからさまな性差別が横行しています。東京大学もまた、残念ながらその例のひとつです」と指摘。 高校生新聞によると、同大の2019年度一般入試合格者のうち、女子は510人で、全体の16.9%だった。17年度の19.3%、18年度の18.2%と比べて比率は下がっている。 「世の中には、がんばっても報われないひと、がんばろうにもがんばれないひと、がんばりすぎて心と体をこわしたひとたちがいます。がんばる前から、『しょせんおまえなんか』『どうせわたしなんて』とがんばる意欲をくじかれるひとたちもいます」 「あなたたちのがんばりを、どうぞ自分が勝ち抜くためだけに使わないでください。恵まれた環境と恵まれた能力とを、恵まれないひとびとを貶めるためにではなく、そういうひとびとを助けるために使ってください」と訴えた。 上野千鶴子

                                                                                    「がんばっても報われない社会が待っている」東大の入学式で語られたこと【全文】