タグ

2010年8月26日のブックマーク (4件)

  • 共立出版株式会社 新シリーズ・講座 「Rで学ぶデータサイエンス」

    ●刊行の趣旨 データサイエンスは,理論だけではなく,実際のデータを操作・解析・マイニングを行わなければならない。そのためには,基礎理論を理解し,その理論に基づいてツールを用いて実現しなければならない。そのツールとして近年フリーであるRが急速に普及している。Rには,すでに数千のフリーパッケージが公開されている。また,Rに関する訳書・和書は20冊を超えているが,初級レベルのものがほとんどである。また,データサイエンスは,理工系だけではなく,非理工系や多くの専門分野で用いるようになっている。非理数系の人の中には,数理的な基礎が弱く,直接厳密な数理理論からデータサイエンスに入門するのが困難である方がほとんどである。そのような方々にとっては,実践的に入門を行い,数理理論を徐々に理解するのも一つの方法である。数理に強い方,弱い方などに関係なく幅広く,長く利用できるを提供することがシリーズを企画す

    aidiary
    aidiary 2010/08/26
    パターン認識とマシンラーニングほしい
  • JIN'S PAGE

    R、R言語、R環境・・・・・・ Rのダウンロードとインストール リンク集 題名 Chap_01 データ解析・マイニングとR言語 Chap_02 Rでのデータの入出力 Chap_03 Rでのデータの編集と演算 Chap_04 Rと基統計量 Chap_05 Rでの関数オブジェクト Chap_06 Rでのデータの視覚化(1) Chap_07 Rでのデータの視覚化(2) Chap_08 Rでのデータの視覚化(3) Chap_09 GGobiとデータの視覚化(Rgobi) Chap_10 Rと確率分布 Chap_11 Rと推定 Chap_12 Rと検定 Chap_13 Rと分散分析 Chap_14 Rと回帰分析 Chap_15 Rと重回帰分析 Chap_16 Rと一般化線形モデル Chap_17 Rと非線形モデル Chap_18 Rと判別分析 Chap_19 Rと樹木モデル Chap_20 WEK

    aidiary
    aidiary 2010/08/26
    Rを用いた機械学習、自然言語処理など
  • Boostingの並列化 - 射撃しつつ前転 改

    パターン認識と学習の統計学のp.153に「バギングは並列化が可能であるので、並列計算機を用いることによって計算時間を大幅に短縮できるが、ブースティングは逐次的にしか計算できないので、計算時間は生成する弱仮説の数に比例して長くなることになる」と書いてあったので、ブースティングって並列化できないんだなぁ、と思っていたんだけれど、こないだAdaBoostをちょっと真面目に考えてみたら、弱学習器を選べば並列化が可能な場合もあるという事に気づいた。 そもそも、よく読んでみると、パターン認識と学習の統計学には「ブースティングは並列化できない」とは一言も書いていない。これは実は意図的だったりするんじゃないかと思う。「生成する弱仮説の数に比例して計算時間が長くなる」というのはまったくその通りで、データの重み付けを逐次的に変更しながら学習を繰り返すというAdaBoostの仕様上、これはどうしようもない。ただ

    Boostingの並列化 - 射撃しつつ前転 改
  • 読みやすい文章を書くための技法 - RyoAnna

    『坊っちゃん』自筆原稿 読みやすい文章とは、流れるように読める文章だ。難しい言葉はいらない。気のきいた言葉もいらない。文頭から文末まで振り返ることなく読める文章が、最も美しい。 読みやすさの基準は客観的なものだ。読み手には様々な人がいる。老若男女すべての人に対して読みやすい文章を書くのは難しい。ただ、綺麗な文章を書こうとする意識は持ちたい。 文章を書く上で意識すべき技法を紹介する。 常体と敬体 常体とは「だ・である」調の文章であり、敬体とは「です・ます」調の文章を指す。それぞれにメリットとデメリットがある。 常体は、自分の意思を力強く伝える事ができるが、我の強い文章になる。敬体は、優しい印象で共感を得やすいが、まわりくどい文章になる。 常体と敬体を織り交ぜて書く手法もある。まずは自分で試してみて、書きやすい文体を見つければいい。 文章の始まりは短く 最初の一文は短いほうがいい。インパクトが

    読みやすい文章を書くための技法 - RyoAnna