※ブラウザでうまく表示されませんのでDLして御覧ください※ ※以下のリンクからもご覧いただけます※ https://speakerdeck.com/tam07pb915/nagoyar15 ロジスティック回帰や多項ロジスティック回帰などの一般化線形モデルを用いた分析の結果を図示するためのeffectsパッケージの紹介をします。
![なぜ統計学がビジネスの 意思決定において大事なのか?](https://cdn-ak-scissors.b.st-hatena.com/image/square/39b576917f9b762507d0e883ae683e8d45327881/height=288;version=1;width=512/https%3A%2F%2Fcdn.slidesharecdn.com%2Fss_thumbnails%2Fcodescore150123tjoforslideshare-150212000514-conversion-gate02-thumbnail.jpg%3Fwidth%3D640%26height%3D640%26fit%3Dbounds)
※ブラウザでうまく表示されませんのでDLして御覧ください※ ※以下のリンクからもご覧いただけます※ https://speakerdeck.com/tam07pb915/nagoyar15 ロジスティック回帰や多項ロジスティック回帰などの一般化線形モデルを用いた分析の結果を図示するためのeffectsパッケージの紹介をします。
統計の話題で、こういう誤りをよく見るなあ、とか、ここら辺はややこしいなあ、的なものを、エッセイ風に書いてみます。 各トピックの最後に、参考資料を紹介したりします。 色々な話題を扱うので、エントリー全体で、このくらいの知識を持っている層向け、みたいな想定はしていないです。下に行くほど、知っている人向けになる、という感じ。 標本数と標本の大きさ 調べたい集団全体から採り出した個体の数の事を、標本数と書くのをよく見かける。でも正確にはこれは、標本の大きさと言う。この違いは、標本という言葉をどのように捉えるか、に起因するもの。標本を、調べたい集団に属する要素と考えるか、含まれる集合と捉えるか。前者で考えると標本数を使う事になるけれど、抽出した集まりそのものを標本とすれば、標本数とは言えなくなる。で、集合に属する要素の数の事を、集合論では大きさというので、それを踏まえて、標本の大きさと言う。 たとえ
児ポ法周辺の数字 幾つかの俗説を検証し、あるいは二つの数字に関係がないことを示すべく、数字をもとに検討する。正確には、本腰を入れて検証するに値するものを探す過程を公開する。扱いに難儀するような数字がけっこう出回っていたりするため、しばらくは停滞しそうな気がしないでもないので、気長に生暖かく見守っていただければ幸いである。 数値の出典は、警察庁等が公開している国レヴェルの統計各種と各項に特記したもののみである。警察発表の統計のうち、刑法犯に関するもの等の大半は、ウェブサイトの統計のページからも閲覧可能な「~年の犯罪」と題された統計書から数値を得た。その他あるいはウェブに掲載のない古いものについては、早川治「児童ポルノ問題の現状と今後の対策」(警察学論集63巻7号(2010年07月10日))や統計書・新聞記事等の印刷媒体も利用した。印刷媒体の利用は、確認あるいは補充にとどまった場合もある。傍論
ちょっと前の話ですが、Vapnikマン氏*1(@sla)の超絶素晴らしいインタビュー記事が出てました。 データサイエンティストが要らなくなる日が来るかもしれない しかも、あの「ネガティブにデータサイエンティストな日記」のid:dscaさんが、Vapnikマン氏のインタビュー記事に触発されて データサイエンティストが要らない日はもう来ている という素晴らしい記事を書かれていて、これはもう釣られるしかないでしょーといった風情です。そんなわけで全力で釣られたついでに煽り記事書いてみました。いつも通りロクな内容ではないので、念のため(笑)。 そもそも25万人もデータサイエンティストって必要なのか? 日経が「今後データサイエンティストは25万人不足する」とか吹かしてくれたおかげで、今やすっかり「25万人」説が広まってしまったわけですが。 結論から言うと、日本国内ではそんなに要りません。僕の超絶大ざっ
国ごとの色々な個性や歴史、統計データを地図の上に視覚化すると地域ごとにいろいろな変化があって面白いもの。近くの国同士はなんとなく同じような傾向があったり、遠く離れているのに何らかの共通点があったりと見ていて飽きません。
どうも、最近の仕事はビッグデータなRick08です。統計の手法を勉強しようと思って、不動産の取引事例のデータを回帰分析してみました。何しろ9万6千件の取引データが無料で公開されているので、データ分析の題材としてはもってこいです。図は東京都都心5区のワンルームマンションについて、築年数と平米単価の関係を散布図にしたものです。 92年-95年築の取引がすごく少ないですね。バブル期だけに建設も少なかったのでしょうか。多項式近似曲線(4次)が黒い線です。これを見ると、ある特徴がわかります。 建築5年〜10年ぐらいの間は値下がり率が5年で5%程度の美味しい期間。その後、平米単価は急降下します。そして、築20年以上になると、平米単価が40万円程度で安定します。 じゃあ、どんな物件を買えばいいのでしょうか。 当然、値下がりしにくいところがいいわけですが、緑の安定期のところのワンルームというと、実際には3
ネットで面白いコピペを発見したので貼り付けておきますね。 山岡「こちらが我々の考える究極のデータサイエンティストです。」 京極「なんやて、経済学部出身やないか!ITに統計学、業務、この中で先の二つの技術的素養が必要なデータサイエンティストには理系出身者が定石やで山岡はん。」 山岡「確かに、数学のスキルが要求されるデータサイエンティストには普通の文系出身者は厳しい。しかし、彼の学部時代の専攻は計量経済学。実務では高度なアルゴリズムやビックデータの解析基盤の構築のスキルなんか本当は必要ない、経済学の手法が求められているんだ。」 京極「なんやてっ!」 山岡「ビッグデータといっても、小売りの場合大きくて1千万件程度、普通のRDBMSで処理可能だし、非構造化データなんて必要ない。アルゴリズムもSPSSやRなんかのツールに入力して結果を解釈できれば十分なんだ。一方で、政府の統計を駆使して地域の需要を推
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
統計学をその「意味」の視点からこれほどわかりやすく解説した書籍はないのではないか。「統計学が最強の学問である」(参照)という表題は挑戦的だが、実際、後半部の応用分野との関わりの解説に力点を置いて読むならなら適切とも言える。しかしなにより、統計学をわかりやすく解説した入門書としてすぐれている。現代人ならどうしても統計学の基礎知識は必要となるので、そういう点からも必読書と言ってもいい。 本書の内容は、cakesに連載されていたもので、私も連載当初から読んでいた。語り口が豊かでまた逸話も面白く、オンラインの読み物としてもすぐれているのだが、中盤の回帰分析の説明あたりから、これは集中して読んだほうがいいなと思い直し、年末から正月、Kindle PaperWhiteのブラウザー機能に落とし込んで読んだ。ある程度、濃密なコンテンツになると依然、書籍というのは有利なもので、この連載が書籍化されるなら、早
gumiの粟飯原です。 データマイニングやってます。しかしながら最近はあまりデータをいじる時間がなく社内でプレゼンばかりする日々で、社内でも私がなにやってるのかわからないというもっぱらの評判。そこで今回は一応データ解析もやってはいるんだよということを内外に主張するためにもデータマイニングの話をしようと思います。 アプリの基本的な日々の統計データ取得などは別の方々はやられているので、私からはhadoopを使った大規模解析の話や、そこで得られたデータを分析する環境の話をしたいと思います。コードを併記した具体例などは今回載せられないのですが、今後また紹介していければと思います。 大規模データの解析 日々のログ解析やDB解析はcronによる処理で毎朝レポーティングを行っているのですが、新しい情報を過去のアクセスログからまとめてどかんと取得したいと言う時はHadoopによる大規模解析を実行しています
・長さが1分30秒~2分29秒の動画を作り、 ・金曜日または土曜日の朝3~7時台に投稿すれば、 再生数が増える・・・かも? ※ ただし、カテゴリによっては当てはまらないことがあります。 <人並みの基準> ・うp1週間後で、再生95、コメ 6、マイリス 2 ・うp1ヶ月後で、再生160、コメ 6、マイリス 2 ・うp1年後 で、再生277、コメ 11、マイリス 3 ※ これは、かなり以前に調べたものなので、現在は全体的に減少していると思われます。 ~ ファイルのダウンロード ~ ・タグ分析Excelツール http://kie.nu/dnw http://kie.nu/dnI (プラスαデータ収録版) 説明ページ → http://blog.livedoor.jp/zofy_doki_p/archives/cat_50092028.html ・マイリストから再生数・コメ数・マイリス数を記録す
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く