タグ

ブックマーク / qiita.com/ynakayama (3)

  • pandas を利用してデータセットの可視化を素早く試行する - Qiita

    今まで pandas + matplotlib を利用したプロッティングとしては pandas + matplotlib による多彩なデータプロッティング や matplotlib (+ pandas) によるデータ可視化の方法 といったものを紹介してきました。 抽出および加工したデータを俯瞰するにあたり、可視化までの流れをあらためて整理して追ってみましょう。 データセットを pandas オブジェクトにする まず pandas の世界にデータセットを持ってくることになりますが、これは主に 2 通りの流れがあります。 csv ファイルなど外部ファイルから pd.read_csv や pd.read_table といった関数を使って読み込む方法 連想配列 (辞書) オブジェクトなどを DataFrame に変換する方法 このうち 1. についてはすでにそのまま使える構造化されたデータが外部の

    pandas を利用してデータセットの可視化を素早く試行する - Qiita
  • データ分析の計画収集加工そして判断まで (前編) - Qiita

    いままで統計の実践的な方法について書いてきましたが、統計学や計量経済学を身につけるとデータ分析で次々と未来を予測できて株などの投資で大儲けできるのでしょうか。いいえ、それならば統計学者や経済学者は研究もそこそこに投資にせっせと精を出し今頃は大金持ちになっているはずです。 ウォール街のランダム・ウォーカーでは、多くのプロのファンドマネージャーが上場株式全体をランダムに買うような投資方法に勝てていないという科学的実証データが書かれています。将来の予測不能性というのはさまざまな要因が複雑に絡むため、未来を予測するのはとても難しいのです。 たとえば医療統計によってある栄養や生活習慣とある病気との相関関係を調べることはできます。ではこれによってあなたがいつ病気で死ぬか正確に予測できるようになるのでしょうか。もちろんそんなわけはありません。データ分析によってあなたがいつ死ぬかということを正確に予測でき

    データ分析の計画収集加工そして判断まで (前編) - Qiita
  • データ分析の計画収集加工そして判断まで (後編) - Qiita

    ようやく前回の続きで今回は後編です。 さてここでみなさんもう一度、原点に立ち返ってみましょう。なぜデータを集めて分析をするのか。それは利益を最大化したいからです。自分が得をするために、判断の根拠となる材料 (データ) を収集し、中身を整理して眺め、行動に結びつけて利益を得ます。 すなわちデータ分析には利益につながる明らかな動機 (目的) が存在し、また分析の結果を行動に結びつけて初めて価値が生まれます。 ゲーム投資 ここで投資の話をしてみましょう。 万人に正しい投資法というのは存在しませんが、たとえば株式においては市場で優位性を得るための前提条件がいくつかあります。 1. 投資は確率のゲームである 2. 市場はおおむね効率的である、しかしわずかな歪みが生じている 3. 資主義は自己増殖するので長期的には市場が拡大し、株価は経済成長率に収束する これは古典的なアイテム課金型ソーシャルゲー

    データ分析の計画収集加工そして判断まで (後編) - Qiita
  • 1