タグ

datasetに関するagxのブックマーク (5)

  • Coming Soon

    Future home of something quite cool. If you're the site owner, log in to launch this site If you are a visitor, check back soon.

  • Wikipediaデータ解析ツールWik-IE

    Wik-IEはWikipediaで公開されているデータファイルを解析するJavaで書かれたツールです。 記事やカテゴリ・リダイレクト間の関係や他言語版へのリンクなどの情報を抽出します。 バージョン2.0から実行できる機能や、実行方法が変わりました。 また分散処理版とスタンドアロン版の区別をなくしました。1つのjarファイルでどちらの用途にも利用できます。 Wik-IEとは 要件 機能 使い方 ライセンス Wik-IEとは Wikipediaではその全データが誰でもダウンロード可能な形で公開されています。 そのデータファイルを解析し、記事やカテゴリ・リダイレクト間の関係や他言語版へのリンクなど、様々な情報を抽出するツールがWik-IEです。 Wik-IEはApache Hadoopプラットフォーム上での動作し、分散処理により高速で処理ができます。スタンドアロンでの動作も可能です。 要件 Wi

  • 単語感情極性対応表

    単語感情極性対応表 日語および英語の単語とその感情極性の対応表を、 研究目的の利用に限り公開します。 感情極性とは、その語が一般的に良い印象を持つか(positive) 悪い印象を持つか(negative)を表した二値属性です。 例えば、「良い」、「美しい」などはpositiveな極性、 「悪い」、「汚い」などはnegativeな極性を持ちます。 感情極性値は、語彙ネットワークを利用して自動的に計算されたものです。 もともと二値属性ですが、-1から+1の実数値を割り当てました。 -1に近いほどnegative、+1に近いほどpositiveと考えられます。 リソースとして、日語は「岩波国語辞書(岩波書店)」を、 英語はWordNet-1.7.1を使わせていただきました。 こちらからダウンロードしてください→[日語] [英語] フォーマットは、各行が一単語に対応し、 見出し語:読み:品

  • クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)
  • 実験用イメージデータセットの収集 - lonerの日記

    研究室では、これまでGeneric Object Recognition用のデータセット(多量のアノテーション済の画像ファイル)としてCorel Image Dataを使用していたわけなんですが、商用画像というのと、Corel社が販売を止めてしまったということもあってか、他のデータセットも試してみようと検討中。候補になっているのは、以下。 Caltech101(Caltech256)。その名の通り、California Institute of TechnologyでFei-Fei Li等によって集められたカテゴリ分けされた画像セット。カテゴリを決め、Google Image Search+人力で探した画像。このデータの問題点は、フォアグランド・オブジェクトにだけ、しかも1つのオブジェクトにしかキーワードが付いてない。ライセンスも不明。 The PASCAL Object Recognit

    実験用イメージデータセットの収集 - lonerの日記
  • 1