『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
2016年3月25日にアップデートしました。 こんにちは。Hayatoです。仕事では大きなデータの処理とかそのクリーニングや解析をしています。 大学時代は熱心に勉学に励まなかったこともあり統計的知識が弱く、いつも平均だけだしてパパっと分析済ませちゃったりしていたのです。 しかし時代はデータサイエンティスト!僕もデータクリーナーじゃなくてデータサイエンティストになりたい!ということでGoogleに入社してからこつこつ統計の勉強をしています。 その過程で、基礎を学ぶのに、統計検定二級がとても効率的だったのでご紹介します。 統計検定2級 統計検定2級ってなに? 総務省が後援している統計検定は、日本で一番有名な統計の技術を測る資格試験です。 1級, 2級, 3級とあり、その真ん中のレベルに当たるのが統計検定です。 想定受験者 プログラマーだけど統計周りの基礎知識がない人。 データサイエンティストと
追記(2017年7月) こちらのスキル要件ですが、2017年版を新たに書きましたので是非そちらをご覧ください。 「データサイエンティストというかデータ分析職に就くためのスキル要件」という話題が某所であったんですが、僕にとって馴染みのあるTokyoR界隈で実際に企業のデータ分析職で活躍している人たちのスキルを眺めてみるに、 みどりぼん程度の統計学の知識 はじパタ程度の機械学習の知識 RかPythonでコードが組める SQLが書ける というのが全員の最大公約数=下限ラインかなぁと。そんなわけで、ちょろっと色々与太話を書いてみます。なお僕の周りの半径5mに限った真実かもしれませんので、皆さん自身がどこかのデータサイエンティスト()募集に応募して蹴られたとしても何の保証もいたしかねますので悪しからず。 統計学の知識は「みどりぼん以上」 データ解析のための統計モデリング入門――一般化線形モデル・階層
当サイトは2017年12月末でサービス終了です。 ■先物 日経平均先物やTOPIX先物などのデータ 4本値+出来高+売買代金 がCSVダウンロードできます。 セッションごとデータ 日中 ・ 夜間 各銘柄ごとの時系列データ 日夜 ・ 4時間足 ・ 1時間足 ・ 30分足 ・ 15分足 ・ 5分足 ■指数 日経平均やマザーズ指数など株価指数のの4本値データ がCSVダウンロードできます。 セッションごと 日足 ・ 前場 ・ 後場 各指数ごとの時系列データ 日足 ・ 前後場 ・ 1時間足 ・ 30分足 ・ 15分足 ・ 5分足 ■個別株 個別株のデータ 4本値+出来高+売買代金 がCSVダウンロードできます。 セッションごとデータ 日足 ・ 前場 ・ 後場 各銘柄ごとの時系列データ 日足 ・ 前後場 ・ 1時間足 ・ 30分足 ・ 15分足 ・ 5分足 ■市場統計 市場ごと・業種ごと の売買代金
ダウンロード こちらから。 http://cran.r-project.org/bin/macosx/ 今だとv.2.15が最新ですね。R-2.15.0.pkgをダウンロードします。 ぽちぽちするだけです。 いざ起動 ターミナルでrと打ちます。 $ r rのシェルが立ち上がりました。 めちゃ簡単ですね。 昔Rを使っていた時のブログ Rについてほとんど書いてなかったけど、統計学、多変量解析あたりの話題。 (馬の名前がやたら出てくるのは、競馬予想のために統計学を勉強していたからです・・・) 母集団 大数の法則 相関係数 偏相関係数 回帰直線を求める 回帰直線を求める(2) 回帰直線を求める(3) 回帰直線を求める(4) 回帰分析 回帰分析(2) 重回帰分析 ダミー変数 勝率の計算 勝率の計算(2) 勝率の計算(3) 勝率の計算(4) 勝率の計算(5) 競馬予想の結論
こんばんは。最近めっぽう暑くて困ってしまいますね。 暑いといえば、こないだの大阪都構想選挙は予想以上にアツい戦いとなりましたね。関係者でもないのに、ハラハラしながら見てしまいました。ところで、開票速報を見ていて、いきなり『多数確実』と表示されてびっくりしたのは、わたしだけではないかと思います。 こんなに接戦な上に、どうして残り19%も未開票なのに、多数確実なんだろう?ヽ(`Д´)ノ と思われた方も多いのでは無いでしょうか?? そこで、今回はいわゆる『当選確実』がどのように出るのかについて、考えてみました。 『当選確実』の統計学 開票速報を行い、投票数の50%を取れば、他の票全てが反対側に回っても結果が覆ることは無いため、『当選確定』と言えます。一方、『当選確実』はこれまでのデータから、他の票数の動きを予想しても『ほぼ間違い無いでしょう』といえる状態です。 統計の世界では、『少ないサンプルか
Photo by Hermann Kaser こんにちは。谷口がお送りします。 ITエンジニアの方の中には「R言語を学習したい」という方も多くいらっしゃるかと思います。 R言語は、データ分析やデータ処理に特化したオープンソースのプログラミング言語です。システムを開発をする他のプログラムミング言語とは位置付けが異なり、統計解析機能が付いていて、解析処理やその結果をグラフィカルに表示することができます。 そのため、多量のデータ解析が求められるソーシャルゲームの解析や、リサーチ、データマイニング、アソシエーション分析が必要な業務の求人が増えています。 また近年データサイエンティストが注目されていることもあり、今後求人が増えることが予想されます。 そこで今回は、プログラミング未経験~初心者の方が、なるべくコストをかけずにR言語に触れられて、学習に役立てられるコンテンツを10件ご紹介していきます。
プロジェクトを開始する前に、市場調査などで統計データを分析し仮説をたてる事は重要ですが、それらの調査対象が世界規模、全国規模になるとコストが掛かりすぎて(特に個人や中小企業の場合)現実的ではありません。 そこで活用したいのが国や団体、民間企業が公開している無料の統計データです。今日はそんなマーケティング担当者ならきっと必見の情報公開を行なっているサイトをご紹介します。 1. 総務省統計局 総務省統計局では様々な統計データが入手可能です。 国税調査 人口推計 労働力調査 小売物価統計調査 土地統計調査 このようなデータはPDF版が一般的ですがExcel形式でダウンロードできるのも魅力ですね。その他にも以下URLより数多くの統計データが入手できます。 また、統計局ではメール配信サービスも行なっています。興味のある方は登録をおすすめします。 www.stat.go.jp 2. 法務省 法務省でも
アナタのデータ分析はただの「現状分析」かもしれない!?明日から使える「データ」への向き合い方と考え方をfreeeのデータマイニングエンジニア坂本さんに教えてもらいました。 データ分析→活用、ホントに出来てる? 昨年辺りから、ビックデータやデータサイエンティストがある種「バズワード化」して久しいですね。 ただ、データというものは決してプロフェッショナルだけが扱うものではありません。様々な業界・業種の人が日々、データと向き合っているもの。Excelが使えるからといって、「データ分析ができている」と勘違い…いや錯覚している人も多いのでは!?ここは基礎から、データの扱い方・考え方についてプロから学んでみましょう。 今回ご寄稿いただいたのは、10万以上の事業所が導入している「全自動のクラウド会計ソフト freee」でデータマイニングエンジニアを務める坂本さん。 明日から使える考え方が詰まっています。
ITエンジニアがデータサイエンティストを目指すには?:ITエンジニアのためのデータサイエンティスト養成講座(1)(1/2 ページ) それぞれの専門分野を生かした「データサイエンスチーム」を結成すればデータ活用への道は短縮できる。そのとき、ITエンジニアはどんな知識があればいい? データサイエンティストとして活動する筆者が必須スキル「だけ」に絞って伝授します。 連載バックナンバー はじめに:分析スキルの課題をどう乗り越えるべき? 昨今では、IT系のメディアのみならず一般雑誌や新聞なども“ビッグデータ”というキーワードを見出しに使っています。この文字を目にしない日がないくらいに多用されていて“バズワード”としてとらえられるケースも少なからずあるようです。 しかし、世界の至る所で――もちろん日本でも、ビッグデータを分析することで新たな知見を見つけて利益を増大した企業や、顧客の購買行動を予測するこ
Technical Data presentation in R コピペで学ぶ Rでテクニカルデータプレゼンテーション 1.基礎統計解析編 グラフィックス・リテラシ-教育: 「図学 I ・図形情報 I ・統計学」科目 修了後のコースウェア 福岡大学工学部図学教室 梶山 喜一郎 ・つまみ食いで,学習しないように願います. ・データの可視化を体系・系統だったスキルにするために順を追って学習する. ・統計ブームに乗っている学習者も先人に感謝の気持ちを.さらに, ・確かなスキルにするために,教科書・解説書を理解し,Rスクリプトで確認. A. はじめに--ここは統計・解析の必要を味わった後で読めばよい まず,統計の手続きを実行する.慣れたら統計的に考えよう. 学校の統計学を復習--買った教科書とノートをまた読むだけ a. 測定と尺度 Measurement and scale b. 記述統計学の
人気の高いオープンソースのツール、RとRubyを使い、生データを処理し、シミュレーションし、仮説を立て、統計的手法を用いて検証する、というデータ解析の基本の理解を促します。基本が学べるだけでなく、自分のメールボックスや自分の心臓の鼓動など身近な題材を対象としており、データサイエンスの醍醐味を味わうことができる一冊です。日本語版ではさまざまな統計分析手法についての入門となる章を追加。この本で使っている統計の基礎も学べる構成になっています。プログラマ視点で書かれた本書は、ビッグデータを活用するためのスキルを身に付ける必要に迫られた多くの開発者にとっても貴重な情報源となるでしょう。 関連ファイル サンプルコード 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すで
ネットで面白いコピペを発見したので貼り付けておきますね。 山岡「こちらが我々の考える究極のデータサイエンティストです。」 京極「なんやて、経済学部出身やないか!ITに統計学、業務、この中で先の二つの技術的素養が必要なデータサイエンティストには理系出身者が定石やで山岡はん。」 山岡「確かに、数学のスキルが要求されるデータサイエンティストには普通の文系出身者は厳しい。しかし、彼の学部時代の専攻は計量経済学。実務では高度なアルゴリズムやビックデータの解析基盤の構築のスキルなんか本当は必要ない、経済学の手法が求められているんだ。」 京極「なんやてっ!」 山岡「ビッグデータといっても、小売りの場合大きくて1千万件程度、普通のRDBMSで処理可能だし、非構造化データなんて必要ない。アルゴリズムもSPSSやRなんかのツールに入力して結果を解釈できれば十分なんだ。一方で、政府の統計を駆使して地域の需要を推
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く