タグ

データセットに関するmoa108のブックマーク (4)

  • 機械学習とかに使えそうなデータセット - pixyzehn blog

    photo by Régis Gaidot データセットとかの知見を集めました。 いいデータセットないかと調べる機会があったので、得た知見をまとめてみました。 これについてはすでに良い情報がすでにあったのでそのリンクも紹介します。 奥 健太 - 情報推薦研究ツールボックス grouplensのデータセットは、論文などにも利用されているのを見かけました。 注意点としては ・EachMovieなどは利用できない ・MovieLensやDelicious、Last.fmはdat形式のファイル ・WikiLensはdumpして使うようにされている ・Book-Crossingはcsvsql ・jesterはExcelファイル ということです。 それ以外だと ようこそ - the Datahub 情報学研究データリポジトリ データセット一覧 livedoor グルメの研究用データセットです。 20

    機械学習とかに使えそうなデータセット - pixyzehn blog
  • Selecting Keywords for Content Based Recommendation - CIKM(2010) - Qiita

    Selecting Keywords for Content Based Recommendation - CIKM(2010)機械学習推薦システム 1. Introduction 新しいアイテムの推薦を考えるためにコンテンツベースの推薦を扱う. テレビ番組・映画の推薦をメタデータとあらすじまたはプロットを用いて行う 論文のContributionはメタデータの比較を行ったこと. classicalなアプローチのように最も高い性能をもつキーワードセットを得ようとしたのではなく, 人手で抽出したキーワードと自動で抽出したキーワードを比較し, 提案手法が人手で抽出したものより推薦に適していることを示した. さらにそれ以上キーワードを加えても推薦の精度を高めることが出来ないことも示した. 2. Related Works 3. Content-Based Recommendation 2つのデ

    Selecting Keywords for Content Based Recommendation - CIKM(2010) - Qiita
  • MNIST handwritten digit database, Yann LeCun and Corinna Cortes

    The MNIST database of handwritten digits, available from this page, has a training set of 60,000 examples, and a test set of 10,000 examples. It is a subset of a larger set available from NIST. The digits have been size-normalized and centered in a fixed-size image. It is a good database for people who want to try learning techniques and pattern recognition methods on real-world data while spendin

  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • 1