タグ

dataに関するruiccのブックマーク (10)

  • 統計、機械学習の勉強で使いやすい生データをダウンロードできるリンク集 - Qiita

    はじめに 統計、機械学習が流行しているので、勉強したいと考えている人が多いと思います。 が、しかし、実際に手を動かすためには、データがないと難しく勉強は困難です。 PRMLとか読んでも、実務で使えそうなイメージは湧きません。 そこで、生データをダウンロードできるリンク集を作ってみました。 見つけ次第増やしていきます。 過去の気象データ検索 by 気象庁 http://www.data.jma.go.jp/obd/stats/etrn/index.php 気象に関する情報のデータベースです。 条件を色々入れると、CSVを生成してくれます。 データ容量制限がありますが、いろいろ使えそうです。 人体寸法データベース by 産総研 https://www.dh.aist.go.jp/database/91-92/ 身体のいろんな場所の寸法に関するデータベースです。 足のサイズとか、顔の大きさとかの

    統計、機械学習の勉強で使いやすい生データをダウンロードできるリンク集 - Qiita
    ruicc
    ruicc 2016/02/26
  • 生活定点1992-2018|博報堂生活総研

    生活定点とは? 1992年から隔年で実施している生活者の意識調査です。同じ質問を繰り返し投げ掛け、その回答の変化を定点観測しています。

    生活定点1992-2018|博報堂生活総研
    ruicc
    ruicc 2014/10/23
  • Peano numbers - HaskellWiki

    Peano numbers are a simple way of representing the natural numbers using only a zero value and a successor function. In Haskell it is easy to create a type of Peano number values, but since unary representation is inefficient, they are more often used to do type arithmetic due to their simplicity.

  • R木 - Wikipedia

    2次元矩形のR木の例 R木(英: R-tree)は、B木に似た木構造のデータ構造であり、多次元情報(例えば、二次元座標データなど)のインデックス付け、すなわち空間インデックスに使われる。それは例えば、「現在位置から2km以内の全ての美術館を探す」といった用途に使われる。 概要[編集] R木は、階層的に入れ子になった相互に重なり合う最小外接矩形 (MBR) で空間を分割する。R木のRは矩形 (Rectangle) を意味する。 R木の各ノードのエントリ数は可変である(事前に定義された上限がある)。葉ノード以外の各エントリには2つのデータが格納される。1つは子ノードへの参照であり、もう1つはその子ノードの全エントリを囲む外接矩形のデータである。 挿入および削除のアルゴリズムはこれらの外接矩形を使い、近い要素が同じ葉ノードに属するようにする(特に、新たな要素を挿入する際に、どの最下層の外接矩形に

    R木 - Wikipedia
    ruicc
    ruicc 2011/08/18
  • vacuum-cairo

    vacuum-cairo: Visualize live Haskell data structures using vacuum, graphviz and cairo Visualize live Haskell data structures using vacuum, graphviz and cairo $ view "hello"http://code.haskell.org/~dons/images/vacuum/hello.png $ view [1..5]http://code.haskell.org/~dons/images/vacuum/list.png $ view (IntMap.fromList $ zip [1..10] [1..])http://code.haskell.org/~dons/images/vacuum/intmap.png

    ruicc
    ruicc 2011/02/16
    Visualize haskell data structures.
  • N-gram コーパス - 日本語ウェブコーパス 2010

    概要 ウェブページに出現する形態素 N-gram と文字 N-gram を頻度とともに収録したコーパスです.各 N-gram コーパスには,頻度 10/100/1000 以上の 1-gram から 7-gram までが収録されています. N-gram コーパスの構築においては,Google N-gram コーパスと同様の前処理を施しています.句点・感嘆符・疑問符を文の区切りとして利用しているので,「モーニング娘。」や「Yahoo!」などの固有名詞については,不適切な文の区切りがおこなわれています.また,文の区切りは削除するようになっているため,コーパス中に句点・感嘆符・疑問符は出現しません. 形態素 N-gram コーパス,文字 N-gram コーパスともに,文境界マーク(<S>,</S>)は採用していますが,未知語トークン(<UNK>)は採用していません.また,文字 N-gram コーパ

  • 本棚 / MySQLデータ

    [[http://hondana.org/ 棚.org]]のMySQLデータを公開してます データマイニングとかにご利用下さい 面白い結果が出れば masui@pitecan.com に教えて下さい [[[ダウンロード]]] 100MBぐらいのテキストファイルなので注意して下さい 右クリックでダウンロードするといいです 弱力なブラウザで開くとクラッシュするかも? [[http://hondana.org/newest.txt]] = 最新版 [[http://hondana.org/20150506.txt]] [[http://hondana.org/20110323.txt]] [[[データ読み込み方法]]] % [[[mysql -u username]]] mysql> [[[create database hondana;]]] % [[[mysql -u username h

  • 英語の接頭語(辞)もまとめてみた

    (関連記事) 英語の接尾語(辞)をまとめてみた 読書猿Classic: between / beyond readers [A][B][C][D][E][F][G][H][I][J][K][L][M][N][O][P][Q][R][S][T][U][V][W][X][Y] A 】[名詞に付けて]「…(の方)へ」「…(の中)に」の意の叙述形容詞・副詞を作る alive(生きている),aback(後方へ) [名詞・形容詞・副詞に付けて] 非,無,欠如(母音の前ではan-) amoral(超道徳的な,道徳観念のない),anarchy(無政府状態,無統制) ab- :「離れて」の意 abnormal(】[しばしばけなして] 例外的な,特異な;〈態度・人などが〉異常な),abuse(乱用する、誤用する)=(道から)逸脱して(ab)用いる(use), abduct(かどわかす、誘拐する), ※m,

    英語の接頭語(辞)もまとめてみた
  • データ構造とアルゴリズムの記事一覧 - いろいろ解析日記

    データ構造 Javaを使うなら必ず覚えておきたいデータ構造 - 配列・リスト・マップ PHPなら覚えるべきデータ構造はひとつだけ? - 配列 Perlで覚えたいデータ構造 - 配列・ハッシュ VBAで覚えておくデータ構造 - 静的配列・動的配列・ディクショナリ JavaScriptで覚えておくとよいデータ構造 - 配列・オブジェクト Bashで覚えておくとよいデータ構造 - 配列 - 何かしらの言語による記述を解析する日記 アルゴリズム Javaを使うなら理解しておきたいアルゴリズム - 抽出・ソート・結合・集計 (リスト&マップ編) Javaを使うなら理解しておきたいアルゴリズム - 抽出・ソート・結合・集計 (リスト&ビーン編) PHPを使うなら理解しておきたいアルゴリズム - 抽出・ソート・結合・集計 VBAを使うなら理解しておきたいアルゴリズム - 抽出・結合・集計 Javascr

    データ構造とアルゴリズムの記事一覧 - いろいろ解析日記
  • public-domain-archive.com

    public-domain-archive.com 2024 著作権. 不許複製 プライバシーポリシー

    ruicc
    ruicc 2010/01/06
    音質が良いものが並ぶのは10年後くらい?
  • 1