タグ

データセットに関するni66lingのブックマーク (5)

  • 米Yahoo!が年齢・性別・居住地域など13TB超の巨大データを機械学習用に無償提供開始 - GIGAZINE

    By Bob Mical 人工知能を実現する技術の1つである機械学習は、数多くのデータを解析することで一定の規則やパターンを抽出してアルゴリズムの生成を行います。その学習段階で与えられるデータは数が多いほど学習の精度が高まるとも言えるわけですが、個人はもちろん、研究機関においても質と量をクリアするデータを確保することは難しいもの。そんな機械学習に活用できる巨大データセットの提供開始をアメリカYahoo!が発表したのですが、そのデータは1000億件を超えるという超巨大なものになっているようです。 Yahoo Releases the Largest-ever Machine Learning... | Yahoo Labs http://yahoolabs.tumblr.com/post/137281912191/yahoo-releases-the-largest-ever-machin

    米Yahoo!が年齢・性別・居住地域など13TB超の巨大データを機械学習用に無償提供開始 - GIGAZINE
  • 機械学習のデータセット画像枚数を増やす方法 - Qiita

    画像水増しの意義 ディープラーニングのCNN等のクラス分類の精度を向上させるためには、優れた学習データセットが必要です。精度を担保するためには、以下のような工夫をする必要があります。 十分な画像枚数を用意する。 各タグの画像枚数を揃える タグ付けをより正確に行う 同じ分類のものでも、見た目が異なる場合は細かくタグを分ける これらを行うためには、とにかく枚数が必要です。種類によって枚数に偏りがある場合もあり、すべて手作業で抽出・タグ付けしていると大変です。 そこで、ある程度タグ付けされた画像たちを加工することで、画像の枚数を増やすことを考えます。その手法を幾つか紹介します。なお説明には、高城れにさんを画像処理のサンプルに使うべきとの意見に基づき、高城れにさんを利用します。 水増し手法 OpenCV 3.0 Pythonで実装します。 実際に水増しに使えるソースをこちらに用意しておきます。 G

    機械学習のデータセット画像枚数を増やす方法 - Qiita
  • nico-opendata - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

    nico-opendata niconicoでは、学術分野における技術発展への寄与を目的として、 研究者の方を対象に各種サービスのデータを公開しています。 ニコニコ動画コメント等データセット (株)ドワンゴ及び(有)未来検索ブラジルと国立情報学研究所が協力して研究者に提供しているデータセットです。 ニコニコ動画コメント等のデータが利用可能です。 利用申請フォーム※国立情報学研究所へリンクします ニコニコ大百科データ (株)ドワンゴ及び(有)未来検索ブラジルと国立情報学研究所が協力して研究者に提供しているデータセットです。 ニコニコ大百科のデータが利用可能です。 利用申請フォーム※国立情報学研究所へリンクします Nico-Illustデータセット Comicolorization: Semi-Automatic Manga Colorization Chie Furusawa*、Kazuyu

    nico-opendata - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
  • 情報学研究データリポジトリ データセット一覧

    2024/08/30 現在 民間企業提供データ Yahoo!データセット 国立情報学研究所がLINEヤフー株式会社(旧社名 ヤフー株式会社)から提供を受けて研究者に提供しているデータセットです。 Yahoo!知恵袋データ(第3版) (2024-04-01 更新) 楽天データセット 楽天グループ株式会社が国立情報学研究所を通じて研究者に提供しているデータセットです。 楽天市場の全商品データ,レビューデータ 楽天トラベルの施設データ,レビューデータ 楽天GORAのゴルフ場データ,レビューデータ 楽天レシピレシピ情報,レシピ画像 アノテーション付きデータ ニコニコデータセット 国立情報学研究所が株式会社ドワンゴから提供を受けて研究者に提供しているデータセットです。 ニコニコ動画コメント等データ ニコニコ大百科データ リクルートデータセット 国立情報学研究所が株式会社リクルートから提供を受けて研

  • 統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む

    はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、

    統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
  • 1