タグ

統計に関するsnowfoxdollのブックマーク (5)

  • 初心者でもほぼ無料でR言語を勉強できるコンテンツ10選 - paiza開発日誌

    Photo by Hermann Kaser こんにちは。谷口がお送りします。 ITエンジニアの方の中には「R言語を学習したい」という方も多くいらっしゃるかと思います。 R言語は、データ分析やデータ処理に特化したオープンソースのプログラミング言語です。システムを開発をする他のプログラムミング言語とは位置付けが異なり、統計解析機能が付いていて、解析処理やその結果をグラフィカルに表示することができます。 そのため、多量のデータ解析が求められるソーシャルゲームの解析や、リサーチ、データマイニング、アソシエーション分析が必要な業務の求人が増えています。 また近年データサイエンティストが注目されていることもあり、今後求人が増えることが予想されます。 そこで今回は、プログラミング未経験~初心者の方が、なるべくコストをかけずにR言語に触れられて、学習に役立てられるコンテンツを10件ご紹介していきます。

    初心者でもほぼ無料でR言語を勉強できるコンテンツ10選 - paiza開発日誌
  • これから統計分析や人工知能を学びたいのですが、おすすめの【サイトや書籍】、【ツール・環境作り】を教えて頂けますでしょうか。…

    これから統計分析や人工知能を学びたいのですが、おすすめの【サイトや書籍】、【ツール・環境作り】を教えて頂けますでしょうか。 PHPMysqlはある程度使えますが、システムを0から開発できるエンジニアレベルではなく改変出来る程度のスキルです。 ですのでこれから覚えていきたいという形なのですが、子育てや仕事で時間が取りにくいため古い知識や覚えてもあまり意味が無いものは省いて効率化を図れたらと思っています。 具体的には例えば下記のような事や、 http://gigazine.net/news/20150116-buzzfeed-headlines-analysis/ 1000種類のキーワードで、SEOで上位表示されているサイト上位1~10位の共通点等を洗い出す作業に使いたいと思っています。 もちろんすぐにとは思っていませんし、楽をするつもりもありませんが、忙しい中で極力最短の道を進むための情報

  • 統計をグラフにあらわそう(種類と特徴)|なるほど統計学園

    統計は、データを集めて集計しただけでは、単なる数字の集まりであり、そこから何が読み取れるか必ずしも明らかではありません。 統計を作成するときは、必ず、「○○について知りたい!」という目的があるはずですから、得られた結果を、その目的に合わせて上手に使うことが重要です。グラフは、結果を視覚的に表す便利な道具であり、グラフをうまく使うことによって、自分の考えていることを相手に的確に伝えることができます。 グラフにはいくつかの種類があり、それぞれ、得手・不得手があります。自分が伝えたい目的に応じて、適切なグラフを使うことにより、説明力もぐっと高まります。ここでは、そういったグラフの種類やそれぞれの用途、注意点について説明します。 グラフの種類 棒グラフ:棒の高さで、量の大小を比較する。 折れ線グラフ:量が増えているか減っているか、変化の方向をみる。 円グラフ:全体の中での構成比をみる。 帯グラフ:

  • テストの選択肢問題で「当てずっぽう」の正解率を上げる秘策 | ライフハッカー・ジャパン

    教師がテストを作成する際は、複数の選択肢から正解を選ぶ問題であれ、〇×式の問題であれ、答えができるだけランダムに並ぶよう気をつけているはずです。とはいえ、BBCが指摘するように、不規則な並びの中にもあるパターンが潜んでいます。そのパターンを把握しておけば、テストで合格できるかもしれません。 ○×問題の場合 ライターのWilliam Poundstone氏がさまざまなテストや試験を分析したところ、不規則さの中に潜むそういったパターンを当てはめれば、正しい答えを導き出せる可能性が高まることがわかりました。例えば、〇×式のテスト問題は、答えがランダムに並んでいると思うかもしれません。しかし、正しい答えをいくつか知っていれば、根拠に基づいた推測を弾き出せる可能性がアップします。同氏が勧めるのは次のようなやり方です。 すべての問題に目を通し、わかる問題は答えを書いておきましょう。わからない問題の答え

    テストの選択肢問題で「当てずっぽう」の正解率を上げる秘策 | ライフハッカー・ジャパン
  • 平均と標準偏差

    ある集団についてのデータがどのように分布しているかを表すものとして、その集団の代表値★(中心の値)を示す平均値及びそのばらつき具合を示す散布度がある。平均には算術平均が、散布度には標準偏差がよく用いられている。 1.度数分布表・ヒストグラム データがどのように分布しているかその実態を把握するには、データをその大きさによりいくつかの階級に区分し、その階級ごとの個数 (度数) をカウントして表にした度数分布表、あるいは、それを棒グラフにして表わしたヒストグラムが適している (表1、図1) 。 例えば、年齢別人口や従業者規模別事業所数など多くの統計表は度数分布表の形で作成され、また、年齢別人口をヒストグラムにした人口ピラミッドは人口構造の分析等によく用いられている。 2.平均値★ 一般に平均値には、単純平均 が多く使われている。平均値は通常μ(ミュー) と表示される。 3.標準偏差

  • 1