タグ

ブックマーク / eulerdijkstra.hatenadiary.org (4)

  • Rのspdepのパッケージを使って、コンビニのドミナント出店戦略を定量化する - Analyze IT.

    こんにちは、集計野郎マクガイバーです。 コンビニの出店戦略ではセブンイレブンのドミナント戦略が有名で公式ホームページにも記載してあるくらいです。 しかし、その実態に関してはどの程度そうであるのかといったような厳密な検証情報はなく、特定都市における出店数を比較したようなものや、単に四国にセブンイレブンが出店していないという情報を根拠にしたものが多数見られます。 関西ではローソンがドミナントしているのはいうまでもないし、特定の地域を抜き出して一般的な結論を持ち出すのは問題に思われます。 幸いなことに去年集めたものですが、データが手元にあるので、今日はこのドミナント出店戦略を数値化、可視化してみます。 (以後、ですます調ではなくなります。) ロウデータで見る各コンビニの出店戦略 ここでは、ロウデータを地図上にプロットして各コンビニチェーンの出店戦略がどのようになっているかを見てみる。 赤:セブン

    Rのspdepのパッケージを使って、コンビニのドミナント出店戦略を定量化する - Analyze IT.
  • 協調フィルタリングについてまとめてみた。 - Analyze IT.

    A Survey of Collaborative Filtering Techniques(Xiaoyuan Su and Taghi M. Khoshgoftaar, 2009,Advances in Artificial Intelligence) 仕事で協調フィルタリングについて調べる必要が出てきたのだが、あまりよい日語の文献を見つけられなかったため(後にしましま先生の文献を見つけた)やむなく英語の論文を検索したところ、 上記のよいサーベイ論文を見つけた。というわけでこのサーベイ論文に書かれていることに自分なりに調べたことを加えて、自分用にまとめておく。 また、一部の人達の間ではとても有名なしましま先生の論文(ドラフト版)があるので、英語が苦手な人はそちらをご覧になるとよいと思われる。 協調フィルタリングは、一言で言えばユーザとアイテムのマトリックスを用いた顧客への商品のレコメン

    協調フィルタリングについてまとめてみた。 - Analyze IT.
    peketamin
    peketamin 2013/04/08
  • データサイエンティストを超えた!Excelの条件付き書式設ティストに俺はなる!〜VBA行別列別条件付き書式設定自動化マクロ - Analyze IT.

    闇の中答えを探し求めている〜こんにちはVBA界の若頭です。 データ解析しているとExcelのことが愛おしくなって、「お前だけはもう離さない」なんてことになりますよね。 そんな僕らの友達Excelの素晴らしい機能の1つに「条件付き書式設定」があります。 これはExcelのセルの色を指定の範囲内で数値に応じて塗り替える機能です。 (総務省「家計調査」より引用 ) データ解析の基は散布図とヒストグラムなんて言われますが、こいつを使うと複数の変数間の関係を可視化できるので、 業務でデータを解析している人にとっては、必須のツールですね。 最近は統計学とかデータマイニングが流行っていて、数学のわかる人が幅をきかしているみたいですが、これだけ見ておけばよいです。 高度なデータマイニング手法なんておまけみたいなもんです。って最近自分に言い聞かせています。 目指せExcelの条件付き書式設ティストという

    データサイエンティストを超えた!Excelの条件付き書式設ティストに俺はなる!〜VBA行別列別条件付き書式設定自動化マクロ - Analyze IT.
    peketamin
    peketamin 2013/04/01
  • 究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.

    ネットで面白いコピペを発見したので貼り付けておきますね。 山岡「こちらが我々の考える究極のデータサイエンティストです。」 京極「なんやて、経済学部出身やないか!ITに統計学、業務、この中で先の二つの技術的素養が必要なデータサイエンティストには理系出身者が定石やで山岡はん。」 山岡「確かに、数学のスキルが要求されるデータサイエンティストには普通の文系出身者は厳しい。しかし、彼の学部時代の専攻は計量経済学。実務では高度なアルゴリズムやビックデータの解析基盤の構築のスキルなんか当は必要ない、経済学の手法が求められているんだ。」 京極「なんやてっ!」 山岡「ビッグデータといっても、小売りの場合大きくて1千万件程度、普通のRDBMSで処理可能だし、非構造化データなんて必要ない。アルゴリズムもSPSSやRなんかのツールに入力して結果を解釈できれば十分なんだ。一方で、政府の統計を駆使して地域の需要を推

    究極のデータサイエンティストVS至高のデータサイエンティスト - Analyze IT.
    peketamin
    peketamin 2013/03/15
  • 1