タグ

statisticsに関するhxmasakiのブックマーク (5)

  • Cookpadのコアユーザーを探す · Naoki Orii's blog

    Cookpadには様々な使い方が考えられます。真っ先に思い浮かぶものといったら、 夕飯の献立を考える主婦 子どものお弁当の献立を考えるお母さん お客を家に招いて、おもてなし料理を作る必要がある主婦 冷蔵庫の残り野菜を使いきりたい一人暮らしの学生 などが挙げられます。 どのケースにせよ、Cookpadの検索機能でレシピを探し出し、それを作り、べて満足するというのが一般的な流れでしょうか。つくれぽを投稿せずに、自分のオリジナルレシピを投稿するのでもなく、自分だけの閉じた世界で満足するという実利的な使い方もむろん十分良いですが(むしろ大多数のユーザーがそういう使い方をしているでしょう)、ユーザーをお気に入り登録したりつくれぽを投稿したり、他のCookpadユーザーと交流するのにも独特の楽しさがあると思います。 これを端的に表しているのが、8月下旬にネットで話題になった増加する“クックパッド至上

  • 主要な統計情報まとめ - id:yosuke blog

    国が作成した統計を探したいときは e-stats。 政府統計の総合窓口 GL01010101 主要なものは総務省統計局か、厚生労働省がまとめたものが多い。 統計局ホームページ 厚生労働統計一覧|厚生労働省 統計(METI/経済産業省) また、世の中にどんな統計資料があるかは、国立国会図書館の下記がまとまってる。 統計資料レファレンス・ガイド | 経済・社会・教育 | 国立国会図書館 1. 日の統計 総合的な統計書 日統計年鑑 統計局ホームページ/日統計年鑑(自動的にジャンプします) 日国勢図会 日国勢図会|当財団刊行の統計データブック|公益財団法人矢野恒太記念会 日長期統計総覧 新板 日長期統計総覧 完結昭和国勢総覧 明治大正国勢総覧 地域別 社会生活統計指標 http://www.stat.go.jp/data/ssds/5.htm 類似資料:統計でみる都道府県のすがた、統

    主要な統計情報まとめ - id:yosuke blog
  • Cookpadのつくれぽ数を予測する · Naoki Orii's blog

    機械学習」のコラボレーションをできないかと最近常々考えています。例えば、「地球上に存在する全ての料理を何らかのアルゴリズムに入力し、人間にとって『美味しい』レシピとはどういう特徴を持つかを学習し、今まで人類がべたことのないような斬新なレシピを自動生成する」ことが出来たとしたら素晴らしいとは思いませんか? レシピの自動生成はさすがに難しそうなので、今回は人気になるレシピに共通する特徴は何かという問いに答えることを目標とします。具体的には、Cookpadのレシピが与えられたとして、そのつくれぽ数を予測する問題に挑戦してみます。レシピが人気になるか否かの要因としては、どういう材料を使用するか、レシピがどれだけ健康的か、またどれだけ手軽に調理できるかなど様々な要因が考えられますが、今回特に興味があるのはレシピの名前や紹介文などの文章の言葉遣いがそのレシピの人気度にどのような影響を及ぼすか

  • Rと手作業で覚える最尤法 - 餡子付゛録゛

    OLSより進んだ統計手法で最初に覚えるのは最尤法だと思います。大半の人はツールとして知っていて、あまり中身を意識していない気がするのですが、「尤度」の説明無しで『尤度が最大になるパラメーターを求める方法』と言う説明が横行しているのは、問題があるかも知れません。 最尤法は、ある分布から観測値が取り出されたとして、“そうなる確率”が最も高くなるように分布の具体的な形状を決めるやり方です。“そうなる確率”を尤度と言います。こう書くと易しい事なのか難しい事なのか判別もつかないと思うので、実際に最尤法を解いてみましょう。 まず、何も考えずにトライ&エラーで最尤法を試みるやり方を説明した後に、教科書的な最尤法の解法を説明します。 1. 何も考えずにトライ&エラーで最尤法を試みる ある正規分布から値を3つ取り出したら、11 13 23だったとしましょう。このサンプルが“もっともらしい”正規分布の平均と分

  • 統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~

    googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系のは最近増えてきましたが、統計学自体が基礎から学べるはまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =

    統計学を勉強するときに知っておきたい10ポイント - Issei’s Analysis ~おとうさんの解析日記~
  • 1