タグ

ブックマーク / repose.hatenadiary.jp (2)

  • 機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践 (オライリー・ジャパン) 読んだ - 糞糞糞ネット弁慶

    www.amazon.co.jp 訳者よりご恵贈いただきました.8年前に kaggle のアカウントを作ったきりの人間であるため,この文章にさほど価値があるとは思えませんが感想を書きたいと思います. ロジスティック回帰や決定木,ランダムフォレストやニューラルネットワークなどの機械学習アルゴリズムにどのようにデータを入力するか,ただのデータをよりアルゴリズムのパフォーマンスが改善するように加工する作業を「特徴量エンジニアリング」と呼びます. 書はその特徴量エンジニアリングの基礎である 変数の値をそのまま使うのか,二値化するのか,区分に分けて離散化するのか,対数を取るのか,値を一定の区間に揃えるのか テキストをどのように特徴量にするのか,どう処理すべきか,どう重み付けるのか カテゴリ変数をどのように扱うのか,カテゴリの数が増えた時にどう対処するか 変数の数が多い時にどう減らせば良いのか k-

    機械学習のための特徴量エンジニアリング ―その原理とPythonによる実践 (オライリー・ジャパン) 読んだ - 糞糞糞ネット弁慶
  • 放置系ブラック研究室で楽しく生きるにあたって - 糞糞糞ネット弁慶

    (2/6 補足書きました→「放置系ブラック研究室で楽しく生きるにあたって」の補足 - 糞ネット弁慶) 修士論文を提出し,発表を済ませた.また,これをもって大学院及び研究室に関する全ての行事が終了した(「教授が論文書けってうるさいから春休み潰れるわ〜まじないわ〜」などという学生とは違う).というわけなので三年間の研究室生活について振り返ってみる. 放置系ブラック研究室とは そもそも我が研究室は非常に放任主義の放置系ブラック研究室であった.いくつか例を挙げると 論文紹介や輪講などない M2になってから7回程度しかゼミをやった記憶が無い 研究テーマが上から降ってくることがない 教授が卒論・修論のテーマを提出の一ヶ月前まで把握していない 研究しない 論文(書かない|書けない) (研究会|全国大会|諸々)(出ない|出さない|出せない) そもそも何がいつあって締切りがいつとか知らない 学生が学会に何一

    放置系ブラック研究室で楽しく生きるにあたって - 糞糞糞ネット弁慶
    pom2e
    pom2e 2012/04/03
    これはこれで凄い.ブラックといっても普通とは違うし.
  • 1