タグ

ブックマーク / www.anlyznews.com (10)

  • データサイエンティストになるのにRとPythonのどちらを勉強したら良いですか?

    「データサイエンティストになるのにRとPythonのどちらを勉強したら良いですか?」と言う御題が出されて、伝統的な統計解析だとRのライブラリが充実しているが、機械学習だとPythonが充実しており、システム開発ではPythonの一択だが、同僚や共同研究者にあわせないといけないから両方覚えることになると言うような指針が示された上で、それぐらい自分で考えられない人は何者にもなれないと言うような話になっていた*1。 適切な説明だが、RとPythonの違いが気になる人は少なくない。あえてデータ分析の道具として大きな優劣にならない文法面からのRとPythonの違いをもう少し細かく考えてみよう。Pythonはクラス型オブジェクト指向の性質が、Rは関数型の性質が強く出ていることが分かる。つまり、 Pythonはインデントを使ったブロック定義などの可読性をあげるための工夫があるが、Rは関数の最後の評価式が

    データサイエンティストになるのにRとPythonのどちらを勉強したら良いですか?
  • 機械学習をやる前に学んでおくべき最低の数学

    機械学習を勉強する前に学んでおくべき最低の数学の範囲について、あれこれ議論されている*1。この手の議論、なかなか不毛である。ライブラリをブラックボックスとして使う分には、数学の知識はほぼ不要。中身を考えながら使うには、大学の学部の微分積分と線形代数と確率・統計の教科書をまずは頑張れと言う自明な話になるからだ。 1. ライブラリの利用に数学はほぼ要らない 当にライブラリ利用者としては、数学の知識をほとんど要求されない。例えばSVMの分類器を構築するのに、プログラマが指定する必要があるのは、分類先と識別のための特徴量が入った学習データと、データの項目間の関係を説明する文、チューニングするのに使えるオプションが幾つかあるぐらいだ。オプションは経験的に精度が良くなるように選ぶ。これはランダムフォレストなどでも同じになる。 ディープラーニングのライブラリ、TensorFlowだと行列形式の乗算と加

    機械学習をやる前に学んでおくべき最低の数学
  • 公教育支出の男女格差自体が問題なのか?

    『日の女子達は3200億円程の不平等を受けている』と言うNPO法人/国連児童基金の畠山勝太氏の論説が奇妙に思えるが言語化できないという質問をもらった。拝読してみたのだが、確かに捉えどころが難しい。 畠山氏は男女の進路の傾向の差異によって生じる社会格差を是正すべきと言いたいのだが、女子へのアファーマティブ・アクションを肯定するための方便として公教育支出の男女格差を是正すべき問題のように見せかけているので、内的整合性に問題が出てきて論説全体の主張が分かりづらいものとなっている。自分の問題意識を良く整理できておらず、それとは乖離のある方便を信じ込んでしまっているかも知れない。 1. 問題意識は社会における男女格差 「教育は基的に社会の格差を拡大させる」と言う節があって、教育は社会の格差を拡大云々と言う議論があるので、男女格差についてはっきり言及はされていないものの、男女の進路の差が男女格差に

    公教育支出の男女格差自体が問題なのか?
  • 三歩ひいてディープラーニングを見つめる

    ディープラーニングと言う言葉を目にした人は少なくないと思う。人工知能に分類される一つの技術だが、ニューラルネットワークと言ういかにも人工知能といった名称の数理モデルを駆使しているところから、人々の興味関心を強く引いているようだ。これ自体は悪い事では無いが、実態以上に評価しようと画策する人々が出てきており、ディープラーニングが注目された翌年から第3次人工知能ブームが始まったかのような言説を見かける*1に、流行を作りたがる業界病を感じざるをえない。当にブームなのか。報道だけ先行しているのではないのか。騙されないように、最低限の知識は入れておいた方が良さそうだ。 1. 計算機に方法を問わず推論をさせる技術 人工知能は誤解されやすい分野で、そもそも人工知能と言う単語自体が映画やアニメなどの創作物の影響で、往々にして誤解されている。確かに、1950年代に人間の思考パターンを真似る方向で人工知能研究

    三歩ひいてディープラーニングを見つめる
  • 戦略コンサルタントが教育を語るとこんな事になる

    文部科学省の実践的な職業教育を行う新たな高等教育機関の制度化に関する有識者会議で提出された、戦略コンサルタント冨山和彦氏の「我が国の産業構造と労働市場のパラダイムシフトから見る高等教育機関の今後の方向性」が一部で話題になっている。 産業をグローバル(Gの世界)とローカル(Lの世界)に分けて、それぞれに必要な人材が異なるとし、それぞれのタイプの人材に適応した教育を行おうと言うのが趣旨だが、色々な部分で戦略コンサルタントらしい頭の悪さを発揮している。それっぽいが辻褄のあった議論が出来ていないし、現実も見ていない。 1. 労働生産性と言う指標の罠 まずは労働生産性と言う指標の意味を確認しておこう。冨山氏も書いているが、労働生産性=付加価値生産額/投入労働時間という事になる。この付加価値生産額と言うのが曲者だ。端的に言うと付加価値生産額は、売上から原価を引いた粗利益として計算される。だから、付加価

    戦略コンサルタントが教育を語るとこんな事になる
  • 日本の高等教育に必要で簡単に実現できるモノ

    先日のエントリーで戦略コンサルタント冨山和彦氏の大学教育の階層化構想の問題点を指摘したところ、「現状がいい/マシと言いたいのだろうか?」と言うコメントをもらった。答えはYESで、冨山提案よりは現状の方がましだと思う。しかし、現状に改善の余地が無いとは言えない。(1)大学教育が職業教育に適していないと言う不満が産業界から、(2)入学者の質が悪く大学教育が満足に行なえないと言う不満が大学側から出されているのが現状だと思うが、高校卒業試験を行い成績証明書を出せば、これらの問題は解決すると思う。 1. 雇用主から見てスクリーニング機能になる 大学教育が職業教育に適していないと言う不満があるのだが、だったら企業は専門学校からの採用人数を増やせばいい。そんな事はしないのは、(a)大学の方に優秀な人材が行ってしまうからか、(b)専門学校より大学教育の方が望ましいかだ。産業界からの大学批判から、(b)は無

    日本の高等教育に必要で簡単に実現できるモノ
  • 楽天の英語勉強法は4年間でどれぐらいの効果があったのか?

    楽天英語勉強法 TOEIC平均255点アップ』と言う記事が話題になっていた。内容は2010年10月に平均526.1点だった楽天社員のTOEICスコアが英語学習によって、2014年6月に平均781.9点まで上昇したと言うものだ。胡散臭い提灯記事ではないかと、各方面から疑問視されていた。 お気づきの通り、この記事には統計学的に問題がある。企業の従業員は入退社で入れ替わっていくので、母集団が同じとは言えないから、勉強の効果と言うよりは、新入社員の英語力によって平均引き上げになった可能性がある。楽天の新入社員のTOEIC平均点は827と公言される*1一方で、平均勤続年数は3.8年*2となっている。これを加味して、古参従業員の英語力がどれぐらい向上したかフェルミ推定してみよう。 サバイバルな厳しい職場らしいので、平均勤続年数は指数分布に従うとしよう。平均は3.8年。このとき44ヶ月(約3.67年

    楽天の英語勉強法は4年間でどれぐらいの効果があったのか?
  • 大学教員が求める基礎力がつく『数学は言葉』

    マクロ経済学者の荒戸寛樹氏が新入生にお勧めしていた『数学は言葉―math stories』を拝読してみた。英語のサブタイトルが謎*1なのだが、社会科学系の大学教員が新入生に求める基礎力がつくになっていると思う。こう言うのが分かってい無い子が多いよな~と思う事が、色々と説明されているからだ。しっかりと読み込めば、命題や定理といった数学の基的な用語や、論理式や証明手順を理解する事ができる。高校数学の復習とも、その先を見据えた準備とも取れるが、学ぶことは多い。 内容は易しい、そして難しい。矛盾した事を言っていると思うだろうが、x=4, y=6の「,」の意味まで説明されているから懇切丁寧で易しいと思う反面、論理式の応用例として「宇宙人の言語学」と呼ばれて恐れられているε-δ論法*2が出て来て、論理式で連続と一様連続の定義の違いを説明していたりする。一つ一つ読み込んでいけば無理はないはずだが、一

    大学教員が求める基礎力がつく『数学は言葉』
  • 経済学的な裏づけはあるオバマの政策

    「オバマ再選でアメリカ経済はさらに停滞するだろう」と言うブログのエントリーで、オバマ大統領の政策が経済を低迷させると主張している。新自由主義者には理解したく無いのであろうけれども、経済学的にオバマ大統領の政策は、少なくとも一方の立場からは妥当と言えるものも多い。目や耳を塞いで新自由主義を唱える人が見るとも思わないが、幾つかツッコミを入れてみよう。 1. 金融規制 まずは金融政策の部分だが、金融機関の規制は無理があるので、銀行にリスク回避的な行動を取らせるために、救済をしないと宣言すべきだと、ドッド・フランク法案を否定している。銀行員と預金者の利害対立があるので、この議論は単純すぎる。 ミクロ金融理論には二つの代表的な銀行の論文がある。Diamond(1984)*1では銀行員と預金者の間には利害関係があるので、銀行員が暴走しないように自己資比率などの規制が必要だと議論している。Diamon

    経済学的な裏づけはあるオバマの政策
  • 統計学を勉強するときに知っておきたい7つのポイント

    マイクロソフト社が技術分野でもっと熱い専攻の一つとして分析/統計をあげている(Microsoft JobsBlog)。同社以外でも統計学は、今後最も有益なスキルの一つだと考えているようだ(NYT - For Today’s Graduate, Just One Word: Statistics)。しかし、データマイニングの話も一般化しつつあって学習ノウハウなども公開されているが、経験にあわない部分が多い。統計学を初めて勉強するときに知っておいた方が良い7つのポイントをあげてみた。 1. 学習機会やテキストは山のようにあるので利用する 確率・統計の日語テキストは山のようにあり、大学のコースワークを振り返っても、理文問わずにほとんどの学部で確率・統計はあったはずだ。大学院のコースワークでは英語の文献を好む傾向があるが、上級テキストでも日語のものも少なくない。また「マンガでわかる統計学」のよ

    統計学を勉強するときに知っておきたい7つのポイント
  • 1