タグ

ブックマーク / www.anlyznews.com (24)

  • 平均代入法による欠損データ処理はオワコンどころか黒歴史なので

    野村総合研究所の塩崎氏と広瀬氏の記事*1がまた*2データ分析者に困惑を引き起こしている。「データが欠損している場合は、平均値や中央値で埋め合わせる作業を行います。」とあるのだが、欠損データ処理としてはよくない手法として知られている。 平均代入法は、欠損が完全にランダムに生じている(MCAR)とき以外は推定量にバイアスが入ると説明されることが多いが、MCARでも回帰分析などの推定に用いる場合はバイアスが入る。また、単一代入法になるので、標準誤差が過小推定される*3。名前がついているぐらい一般的なのだが、使ってはいけない過去の遺物だ。 推定前の処理としては、欠損データ列がある行を分析から除くリストワイズ法や、分析に用いる欠損データ列がある行を分析から除くペアワイズ法の方がまだよい*4。サンプルサイズの減少を避けたい場合は、単一代入法でも回帰代入などを使う方が望ましい。最近は、機械学習の前処理と

    平均代入法による欠損データ処理はオワコンどころか黒歴史なので
  • 出産適齢期の女性の労働力率と合計特殊出生率には負の相関があるよ

    女子の進学率と収入を低く抑えるのが少子化対策の最適解と言う主張に、女性の労働力率と合計特殊出生率との間に正の相関があると言う反論が加えられていたのだが、どちらも問題があるので指摘したい。 まず、女子の進学と就業を減らすのは少子化対策に有効かも知れないのだが、それが女子の厚生改善もたらすとは限らないので最適解とは言えない。少なくとも自明ではない。 次に、女性の労働力率と合計特殊出生率との間に正の相関があると言うのは、2005年の内閣府男女共同参画会議「少子化男女共同参画に関する専門調査会」の資料の図表1が元ネタではあるのだけれども、 OECD加盟国のデータの中の特定の国が理由の説明なく選ばれている。2005年時点で30か国あるはずだ。そして、OECD原加盟国のトルコがどうも除外されている*1 文化や宗教などの国ごとの固定効果の影響を女性労働力率と合計特殊出生率がそれぞれ独立に受けているかも

    出産適齢期の女性の労働力率と合計特殊出生率には負の相関があるよ
  • ある社会学者の産婦人科医への罵倒に関して

    社会学者の橋迫瑞穂氏(@_keroko)が、妊娠初期では母親の仕事や運動などが原因で流産することはほとんどなく、妊娠10週未満の流産を防ぐ有効な対策はないので、出血などで病院にいってもその後の経過は変わらないと説明している産婦人科医氏(@syutoken_sanka)を、データの問題と個別の事例は別であり非論理的だと罵っていた*1。医学的にも統計解析の意味でも橋迫氏の方が…な主張に思える。 産婦人科医氏の主張は、氏の職務からして当然なのだが、常識的なものだ。国立成育医療研究センターの「出産に際して知っておきたいこと」を見ても、 妊娠12週未満の「早期流産」の場合、主な原因は赤ちゃん側にある自然淘汰で、お母さんの生活が原因で起こるということはありません。薬などの治療法もなく、流産が確定した場合には流産手術(子宮内容除去手術)を考慮します。 と、何も手が無いことが書いてある。他も検索してみたの

    ある社会学者の産婦人科医への罵倒に関して
  • ニュースの社会科学的な裏側: ジェンダー論をやっている社会学者は“被害者”

    社会学者の千田有紀氏の何度目かの炎上騒動の最中なのだが、「市民的公共性」と言う単語を濫用して突っ込みを受ける*1ばかりではなく、自分は権威なのだから素人は学識を疑うなと言う姿勢の過去の発言が槍玉にあがっている*2。 今回の事例だけではなく、他分野から見て根拠をよくつけられていない主張を社会学者がすることは多く、社会学と言う学問への疑問が渦巻く自体になっている。しかし、千田有紀氏の議論に関しては、社会学と言うよりはジェンダー論に内在した問題に思える。 1. ネット界隈で露呈するジェンダー論界隈の主張の脆弱さ ネット界隈ではお気持ち表明と揶揄されているが、ジェンダー論者はその程度の論理しか構成できない。 小宮友根氏は相関と因果の見分けがついていなかった*3し、古谷有希子氏のときは彼女がまだ院生であることを加味しても、周囲の社会学者はあれだけ初歩的な間違い*4を指摘することなく、むしろ擁護してい

    ニュースの社会科学的な裏側: ジェンダー論をやっている社会学者は“被害者”
  • ニュースの社会科学的な裏側: 証明問題が苦手な中高生が読むとよさげな「定理のつくりかた」

    数学書と言えば、定理の説明とその証明の組み合わせが続く如何にもと言う内容のものが典型だが、定理が導き出されるまでの模索について説明されることは少ない。学術史的に動機が説明される事はあるが、数学者がどのような試行錯誤を行なっているのかは、大学院に進学して教員に指導されてみないと中々見えない世界であろう。 『定理のつくりかた』は高校生に数学研究の進め方、考え方を説明した公開講座の内容を膨らませたで、著者の数学研究の方法を中学校で教わる範囲の数学を例に説明してくれる。著者は自分の研究の進め方が普遍的なものとは限らないことを注意喚起していたが、褒める数学者はいても、疑念を挟む数学者はまだいないようなので、少なくともオーソドックスな方法の説明になっていると思う。 学習教材としてみると、証明問題の解き方のになる。問題と言うか命題を理解し、証明をしていく道筋を模索する方法が説明されているので、証明問

    ニュースの社会科学的な裏側: 証明問題が苦手な中高生が読むとよさげな「定理のつくりかた」
  • 米国の黒人女性の結婚相手が深刻に不足

    2023 (63) ► 11月 (1) ► 10月 (4) ► 9月 (10) ► 8月 (6) ► 7月 (6) ► 6月 (8) ► 5月 (5) ► 4月 (2) ► 3月 (6) ► 2月 (9) ► 1月 (6) ► 2022 (88) ► 12月 (3) ► 11月 (3) ► 10月 (7) ► 9月 (5) ► 8月 (9) ► 7月 (8) ► 6月 (9) ► 5月 (8) ► 4月 (8) ► 3月 (10) ► 2月 (11) ► 1月 (7) ► 2021 (64) ► 12月 (5) ► 11月 (6) ► 10月 (9) ► 9月 (4) ► 8月 (7) ► 7月 (10) ► 6月 (2) ► 5月 (3) ► 4月 (3) ► 3月 (6) ► 2月 (5) ► 1月 (4) ► 2020 (117) ► 12月 (4) ► 11月 (8) ► 10

    米国の黒人女性の結婚相手が深刻に不足
    geopolitics
    geopolitics 2018/01/26
    以前見た統計は異人種間は5%位だったな。メモ『ハーバード数学科のデータサイエンティストが明かすビッグデータの残酷な現実』
  • ユダヤ人国会議員「パレスチナ人の母親は皆殺しにすべき」

    ► 2024 (11) ► 3月 (7) ► 2月 (3) ► 1月 (1) ► 2023 (71) ► 12月 (7) ► 11月 (2) ► 10月 (4) ► 9月 (10) ► 8月 (6) ► 7月 (6) ► 6月 (8) ► 5月 (5) ► 4月 (2) ► 3月 (6) ► 2月 (9) ► 1月 (6) ► 2022 (88) ► 12月 (3) ► 11月 (3) ► 10月 (7) ► 9月 (5) ► 8月 (9) ► 7月 (8) ► 6月 (9) ► 5月 (8) ► 4月 (8) ► 3月 (10) ► 2月 (11) ► 1月 (7) ► 2021 (64) ► 12月 (5) ► 11月 (6) ► 10月 (9) ► 9月 (4) ► 8月 (7) ► 7月 (10) ► 6月 (2) ► 5月 (3) ► 4月 (3) ► 3月 (6) ► 2月 (

    ユダヤ人国会議員「パレスチナ人の母親は皆殺しにすべき」
    geopolitics
    geopolitics 2014/07/19
    申命記かヨシュア記に約束の地カナンの話があるので。
  • 英国でTOEICの組織的不正が疑われ、TOEICとTOEFLでVISAが取れなくなる

    ► 2024 (11) ► 3月 (7) ► 2月 (3) ► 1月 (1) ► 2023 (71) ► 12月 (7) ► 11月 (2) ► 10月 (4) ► 9月 (10) ► 8月 (6) ► 7月 (6) ► 6月 (8) ► 5月 (5) ► 4月 (2) ► 3月 (6) ► 2月 (9) ► 1月 (6) ► 2022 (88) ► 12月 (3) ► 11月 (3) ► 10月 (7) ► 9月 (5) ► 8月 (9) ► 7月 (8) ► 6月 (9) ► 5月 (8) ► 4月 (8) ► 3月 (10) ► 2月 (11) ► 1月 (7) ► 2021 (64) ► 12月 (5) ► 11月 (6) ► 10月 (9) ► 9月 (4) ► 8月 (7) ► 7月 (10) ► 6月 (2) ► 5月 (3) ► 4月 (3) ► 3月 (6) ► 2月 (

    英国でTOEICの組織的不正が疑われ、TOEICとTOEFLでVISAが取れなくなる
  • STAP幹細胞騒動に関して素人が心得るべきこと

    理化学研究所発生・再生科学総合研究センターの小保方晴子氏が開発したとされる刺激惹起性多能性獲得(STAP)幹細胞を巡って、騒乱が続いている。最初は、若手女性*1研究者の大発見と言う物珍しさからの報道が続き、次に小保方論文の信憑性が疑われはじめた*2。これは発見自体が間違いであった可能性と、論文の根拠が捏造であった可能性の二つの意味がある。さて、こういう問題に関しては暗黙の作法「(´ー`)フーン」があるのだが、それをわきまえていない人が多いようだ。 1. 研究のサイクル この世には研究のサイクルと言うものがある。大雑把に、研究者は何か発見をし*3、それを論文を書いて専門雑誌に投稿を行い、編集部が研究が雑誌の趣旨と合致しているか判断したあとに、匿名の専門家である査読者が“もっともらしい”かを審査を行い、そこで問題がなければ受理される。こうして掲載された論文が他の研究者の目に止まると、追試を含む

    STAP幹細胞騒動に関して素人が心得るべきこと
  • 時系列データの相関係数はあてにならない

    元官僚の高橋洋一氏が時系列データの相関係数が高い事を論拠にしているが、この論証方法は全くもって厳密ではない。 計量経済学では時系列データの相関係数はあてにならない事は80年代から良く知られており、これに関連した業績でエングルとグレンジャーは、2003年にノーベル経済学賞を受賞している。 高橋氏のトリックを説明したい。世の中には時間とともに変化していくトレンド*1と言うのが多くある。このトレンドがあるデータを二つ比較すると、どちらも時間に対して相関しているため、相関があるように見えてしまう。 例えば戦後、一人あたりの米の消費量は減少し、コンピューターの普及台数は飛躍的に伸びたが、この二つの現象を結びつけて考える人はいない。しかし、米の消費量とコンピューターの普及台数は、高い相関を持つ事になる。 実データの場合は屁理屈をつける事も可能かも知れないので、シミュレーションして確かめてみよう。

    時系列データの相関係数はあてにならない
  • かけ算の順序にこだわる教師と出版社の皆様へ

    東北大学の黒木玄氏が“掛算の順序にこだわる教え方”に関して意見表明をしろとツイッターで呼びかけていた*1ので、微力ながら“掛算の順序にこだわる教え方”への反対意見を表明をしてみたい。 “掛算の順序にこだわる教え方”と言われても理解できない人が多いと思うが、小学校の算数で問題文と数式の構造を強く結びつける教え方だ。例えば1個100円のリンゴが5個ありその総計金額を求める場合、100×5=500と立式するのが正解になり、5×100=500が不正解になる。わけが分からない? ─ 私も良く分からない。 驚くべきことに、最近の小学校では交換法則(可換則)を教えた上で“掛算の順序にこだわる教え方”を続けているそうだ。毎年、秋口になると意味不明なバツを子供がもらっていると話題になる*2。ここ数日は、以下のような怪しい授業ガイドが出回っていた。 xとyと言う変数を使っているので小学6年生に教える内容のよう

    かけ算の順序にこだわる教師と出版社の皆様へ
  • 池田信夫に伝えたい ─ 独占利潤も投資リターン

    経済評論家の池田信夫氏が「製造業はAKBに学べ」で、「資主義のゲームのルールが変わりつつ」あり、「企業は投資リターンより独占レントを目的として行動する時代が来た」と主張している。AKB48に関しては慶応大学の小幡氏が議論するであろうから置いておいて、教科書的なミクロ経済学を誤解していそうな部分を指摘したい。 普通の経済学では賃金は労働生産性で決まり、利潤は資の限界生産性で決まると考えるが、たとえばアップルのすごい利潤率は、とても投資に対するリターンとは考えられない独占レントである。 そもそも定義上、「アップルのすごい利潤率」であっても、「投資に対するリターン」になると言う国語的なツッコミは置いておこう。賃金や利潤に関する説明が、教科書のテキスト部分だけ暗記していて、数式部分を無視している気がする。 「賃金は労働生産性で決まり、利潤は資の限界生産性で決まる」と言うのは、完全競争ならば正

    池田信夫に伝えたい ─ 独占利潤も投資リターン
  • 池田信夫がGDPギャップの定義を勘違い

    私も先日まで誤解していた*1のだが、経済評論家の池田信夫氏がGDPギャップに関して勘違いを披露していたので指摘したい。誰かそっと教えてあげてもいいと思うのだが、誰も指摘していないようだ。 GDPギャップの定義は、(現実のGDP-潜在GDP)÷潜在GDPである事は、漠然と理解されていると思う。問題は潜在GDPで、これは「最適労働・資量」によるGDPではなく、「経済の過去のトレンドからみて平均的な水準で生産要素を投入した時に実現可能なGDP」となっている*2。なお平均稼働率で、平均投入量ではないから、労働力の増減は調整される。 1. 池田信夫氏の勘違い箇所 さて、池田信夫氏のおかしい所を指摘していこう。 動学マクロ経済学では、経済は長期的には潜在GDP(定常状態)に近づくと考え、それと現実のGDPの差をGDPギャップと呼ぶ。 GDPギャップの定義は、既に述べた通り定常状態とは異なるから、この

    池田信夫がGDPギャップの定義を勘違い
  • 岩田論文のグラフを池田信夫が勘違い

    上の岩田論文の図表7は、縦軸が半年間の平均予想インフレ率で、横軸が半期前のマネタリー・ベース平均残高だから、半年に一つ、プロットがされている。2004年3月から2008年2月までの4年間では、8箇所プロットする事になる。 グラフの上方の近似線の周囲の点を数えると、8つあるよ! 「07年9月~08年2月」の点の上二つが、「06年3月~06年8月」と「06年9月~07年2月」を表していると思うが、説明が無かったので誤解したのであろう。なお、3月~8月と9月~翌2月までの半年間で1年を分割しているはずなので、表記に誤りは多いのは否定できないが、マイナーな部分だ。 また、池田氏は「実際の時系列データ」と言いつつ別の図を参照しているが、そこではマネタリーベース増加率と予想インフレ率をプロットしてあり、岩田論文の図表7のマネタリー・ベース平均残高に該当するものがない。だから検証になっていない。 人間だ

    岩田論文のグラフを池田信夫が勘違い
  • 現代マクロ経済学にも通貨供給量はある

    通貨供給量の分析をしたければ、モデルに通貨供給量を加える必要がある。通貨供給量の分析をする必要がなければ、モデルに通貨供給量を加える必要はない。 単にそれだけなのだが、経済評論家の池田信夫氏はそれが理解できないようだ。以下のように言っている(BLOGOS)。 現代の動学マクロ経済学には、通貨供給量という変数は出てこないのだ。インフレ率を決めるのは金利だから、ゼロ金利では量的緩和でデフレも円高も止まらない。 これは間違いだ。ケーガン・モデルやKrugman(1998)やEggertsson and Woodford(2003)やAuerbach and Obstfeld (2005)を見ても、P=M/Y(P:価格,M:通貨供給量 or 家計が保有する通貨量,Y:国民所得)のような定式化はされている*1。 そもそもモデルに通貨供給量が入っていなかったら、財政ファイナンスでインフレになるとは言え

    現代マクロ経済学にも通貨供給量はある
  • 日本国憲法の前文を巡り、安倍総裁の国語能力に関して疑義が発生

    Google政治家と話そうと言うイベントで、「自民党としては、今後どのような分野の政策に、もっとも力を入れて行きたいと思いますか?」と言う質問に対して、安倍総裁が現行憲法を「みっともない憲法」と酷評し、憲法改正に力を入れていく事を示唆したと報道されている(朝日新聞)。偏向報道かと思って動画を確認したのだが、当に言っていた(24:27~)。 動画を見られない人のために、文字おこしも行っておく。 あの、日国憲法の前文にはですね、平和を愛する諸国民の公正と信義に信頼して、われらの安全と生存を保持しようと決意したっと書いてあるんですね。つまり、自分たちの安全を世界に任せますよと、ゆっている。そして、えぇ、専制と隷従、圧迫と偏狭をこの地上から永遠に除去しようと務めている国際社会において、名誉ある地位を占めたいと思う。自分たちが専制と隷従、圧迫と偏狭を無くそうと考えているんじゃないのですよ。国際

    日本国憲法の前文を巡り、安倍総裁の国語能力に関して疑義が発生
    geopolitics
    geopolitics 2012/12/15
    まあ現行憲法自体1950年に死んでいるんだけどね。このあとゾンビ憲法と違憲訴訟で解釈をひねり出す作業が法廷で行われる。今変えるととんでもない方向に行きそう。
  • 幸せのための経済学 — 効率と衡平の考え方

    『幸せのための経済学』は題名はやさしい印象を醸し出しており、記述も平易だが、中身は手堅い経済学における規範的分析の入門書。 専門家が記述し、専門家が査読しており、品質は極めて高い。経済状態の良し悪しをどう評価すべきかを、専門用語や数式を極力使わないと言う意味で一般向けに、丁寧に説明している。中学生向けには難易度は高めと評されているが、特別な専門知識なしに読み進められる。 ある政策が正しいかどうかを考えてみよう。それは貧困対策かも知れ無いし、臓器移植の順番待ちのルールかも知れない。治水などの公共投資でも構わない。何かの基準を置いて是非の判断を行うわけだが、どのような基準を置くべきかが問題になる。これは一見、簡単に思えるが、例えば効率と衡平*1を同時に考え出すと、整合性のある基準を作るのが難しくなる。書で議論するのは、この厚生基準だ。 第1章では経済を、用語定義を交えつつ説明している。第2章

    幸せのための経済学 — 効率と衡平の考え方
  • 世界最強の戦闘機F-22ラプターがドッグファイトでEF2000ユーロファイターにボロ負け

    タイトルが釣りだと思ってきた軍事マニアの皆さん、DVICE曰く真面目なお話だそうです。アラスカの国際合同演習Red Flagの模擬ドッグファイトでF-22がEF2000にボロ負けしたらしい。ドイツ空軍のパイロット曰く、鶏ささみサラダ級*1だそうだ。 F-22の格闘能力が低い理由は次のとおり。まず、ステルス機能が役に立たない。レーダーには映らないのだが、F-22は大型ボディーで発熱が大きいため、EF2000の赤外線センサーに50Km先から映るそうだ。長距離戦闘はともかく、ドッグファイトに持ち込むと、EF2000の格闘能力がF-22を凌駕する。F-22の偏向ノズルも速度低下を招く為に役に立たない模様。ついでに自慢のヘッドマウントディスプレイ(HMD)に技術上の問題があるそうだ。 模擬戦自体はイーブンだったらしいので、無視界の長距離戦闘ではF-22に分があり、近接戦闘に入るとEF2000が有利と

    世界最強の戦闘機F-22ラプターがドッグファイトでEF2000ユーロファイターにボロ負け
  • 日本は労働市場が硬直的だから労働生産性が低い?

    少し前の記事だが、経済評論家の池田信夫氏がTyler Cowenのブログで紹介していたChristopher Phillip Reicherの論文から、日経済の問題は労働市場の硬直性が原因だと主張していた(アゴラ)。 思い込みがあるためか、CowenやReicherの主張と少しづれていて、解釈がおかしいように感じる。雇用規制については議論がまだまだ続くであろうし、池田氏のような主張も多いであろうから、問題点を確認しておこう。 1. Reicher(2011)は一人当たりGDP成長率を分解 Reicher(2011)を紹介すると、1970年~2007年のマクロ・データにHPフィルターとFujita-Ramey分解をかけて、一人当たりGDP(Y/L)成長率に対する労働生産性(Y/H)、一人あたり労働時間(H/E)、有職率(E/LF)、労働参加率(LF/N)の寄与率を計算している。結論は、欧州

    日本は労働市場が硬直的だから労働生産性が低い?
  • “適正価格”は勝ち取るもの

    アダム=スミスの時代から保護貿易論者と自由貿易論者の戦いは続けられており、南北問題や自由貿易協定に関する議論もその延長に近いものだ。しかし、世の中はそう単純なものなのであろうか。 南北問題に話を絞ろう。国際貿易によって途上国生産物の価格が適正では無くなっていると言う批判と、自由化によって適正な価格と需給がもたらされていると言う主張がある。 需給を均衡させる価格が重要なのは間違いない。ゆえに経済学者は基的に、競争均衡価格を信奉する。しかし、自由化によって“適正価格”が得られるとは限らないのもまた真実だ。タンザニアのコーヒー産業の自由化には、その典型的な側面がある。 1. 共同組合(MBOCU)依存の自由化前 黒崎(2010)、山(2009)によると、タンザニアは1961年の独立後、1986年に国際機関の要求する構造調整政策を受け入れ、1993年にコーヒー市場を自由化した。 自由化前のタン

    “適正価格”は勝ち取るもの
    geopolitics
    geopolitics 2012/05/06
    自由化には地元の業者が十分育ってから。