タグ

ブックマーク / www.haya-programming.com (3)

  • ランダムフォレストを使うなら変数選択はしなくてもいいのか? - 静かなる名辞

    はじめに 表題の通りの話をたまに聞きます。「ランダムフォレストは内部で変数選択を行う。なので変数選択は必要ない」という主張です。 しかし個人的には、それはあくまでも 他の手法*1と比べれば変数選択しなかった場合の悪影響が少ない ということであって、ランダムフォレストであっても変数選択した方が良いんじゃ? ということを昔からずっと思っていました。 検証してみます。 思考実験 実際に検証する前に思考実験を行います。 まずパターンA(変数選択なし)とパターンB(変数選択あり)の2通りを考えます。 パターンA 有効な変数:10個 無効な変数:90個 パターンB 有効な変数:10個 のみ(無効な変数なし) ランダムフォレストの弱分類器では、元々の変数の数の平方根くらいの数の変数を使うのが一般的です。そうすると、 パターンAの場合 弱分類器で使う変数は10個。うち有効なもの(の期待値)は1個。 パター

    ランダムフォレストを使うなら変数選択はしなくてもいいのか? - 静かなる名辞
  • TechAcademyがteratailの質問・回答を盗用していた件 - 静かなる名辞

    編集履歴 2019/03/22 朝 投稿。その後数回微調整。 2019/03/22 夜 タイトルと内容を全面的に改稿。 現時点で確証がない部分について表現・内容を修正 情報を追加 2019/03/23 朝 追記 2019/03/25 teratailへの問い合わせ結果を掲載 「ライセンスしていない」とのことです。 それに伴ってタイトルおよび内容を調整 2019/03/25 深夜 teratail運営とTechAcademy運営からそれぞれ公式のアナウンスがありました。 なおteratailがこれまで他メディアに対して、コンテンツ使用に関するライセンス等を行なったことはありません。 今後、仮にユーザー様の投稿を活用した活動を行う場合でも、ユーザー様が認識できる方法で事前にお知らせをいたします。— teratail【テラテイル】 (@teratail) 2019年3月25日 弊社運営のオウンド

    TechAcademyがteratailの質問・回答を盗用していた件 - 静かなる名辞
  • なぜpython使いは単純なfor文より醜悪なリスト内包表記を好むのか - 静かなる名辞

    煽りっぽいタイトルだが、この記事は真剣である。リスト内包表記にはpython哲学の質に関わる問題が潜んでいる。 python使いはリスト内包表記を好む。他の言語の使用者なら「for文で書きゃ良いのに」と思うような処理を、リスト内包表記で書くことを好む。 それはなぜなのか。 # 1~10の値を2乗して合算し、表示する # よくあるpythonコード print( sum([pow(x, 2) for x in range(1, 11)]) ) # こうきゃ良いのにと思う人が世間には多い(と思う) n = 0 for i in range(1, 11): n += pow(i, 2) print(n) # 他の言語の使用者が「ぎゅうぎゅうしててわかりづらいよ」と文句をいうと、python使いは不満げに改行して「これでいいだろ、上等だ」という表情を見せる print( sum([pow(x,

    なぜpython使いは単純なfor文より醜悪なリスト内包表記を好むのか - 静かなる名辞
    kazkun
    kazkun 2021/10/14
    単に思考の流れに近い書き方というのと、王ライナーの気持ちよさではないだろうかと邪推。
  • 1