タグ

統計とビッグデータに関するshibacowのブックマーク (2)

  • 初ボーナスが入ったら築5年のワンルームを買いましょう(データマイニングと不動産の話) - それ、僕が図解します。

    どうも、最近の仕事はビッグデータなRick08です。統計の手法を勉強しようと思って、不動産の取引事例のデータを回帰分析してみました。何しろ9万6千件の取引データが無料で公開されているので、データ分析の題材としてはもってこいです。図は東京都都心5区のワンルームマンションについて、築年数と平米単価の関係を散布図にしたものです。 92年-95年築の取引がすごく少ないですね。バブル期だけに建設も少なかったのでしょうか。多項式近似曲線(4次)が黒い線です。これを見ると、ある特徴がわかります。 建築5年〜10年ぐらいの間は値下がり率が5年で5%程度の美味しい期間。その後、平米単価は急降下します。そして、築20年以上になると、平米単価が40万円程度で安定します。 じゃあ、どんな物件を買えばいいのでしょうか。 当然、値下がりしにくいところがいいわけですが、緑の安定期のところのワンルームというと、実際には3

    初ボーナスが入ったら築5年のワンルームを買いましょう(データマイニングと不動産の話) - それ、僕が図解します。
  • 究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.

    ネットで面白いコピペを発見したので貼り付けておきますね。 山岡「こちらが我々の考える究極のデータサイエンティストです。」 京極「なんやて、経済学部出身やないか!ITに統計学、業務、この中で先の二つの技術的素養が必要なデータサイエンティストには理系出身者が定石やで山岡はん。」 山岡「確かに、数学のスキルが要求されるデータサイエンティストには普通の文系出身者は厳しい。しかし、彼の学部時代の専攻は計量経済学。実務では高度なアルゴリズムやビックデータの解析基盤の構築のスキルなんか当は必要ない、経済学の手法が求められているんだ。」 京極「なんやてっ!」 山岡「ビッグデータといっても、小売りの場合大きくて1千万件程度、普通のRDBMSで処理可能だし、非構造化データなんて必要ない。アルゴリズムもSPSSやRなんかのツールに入力して結果を解釈できれば十分なんだ。一方で、政府の統計を駆使して地域の需要を推

    究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.
  • 1