[B! クラウドソーシング] yuisekiのブックマーク

yuiseki id:yuiseki

クラウドソーシングに関するyuisekiのブックマーク (15)

Insertion, Deletion, or Substitution? Normalizing Text Messages without Pre-categorization nor Supervision - PineApple Inc.
ACL2011 Fei Liu, Fuliang Weng, Bingqing Wang, Yang Liu 口語表現を文語表現に正規化する。アノテーションデータを作らず、自動でwebから収集するらしい。 Edinburgh Twitter corpusには、400万語のout-of-vocabularyがあるらしい。たとえば、"together"は"2gether","togetha","ththr"など。従来手法 Noisy channel model Noisy channel modelを使って、口語的表現から尤もらしい単語を見つける。まず、口語的表現をカテゴライズする。例えば、abbreviation、stylish variation?、prefix-clippingなど。それから、カテゴリごとに学習する。 Hidden Markov Model HMMでアノテーシ
yuiseki 2012/07/24
クラウドソーシング

機械学習
リンク
The Faces of Mechanical Turk - Waxy.org
When you experiment with Amazon’s Mechanical Turk, it feels like magic. You toss 500 questions into the ether, and the answers instantly start rolling in from anonymous workers around the world. It was great for getting work done, but who are these people? I’ve seen the demographics, but that was too abstract for me. Last week, I started a new Turk experiment to answer two questions: what do these
yuiseki 2012/07/24
クラウドソーシング
リンク
Amazon Mechanical Turkの回答者はどんな人達? | 秋元@サイボウズラボ・プログラマー・ブログ
ネットの向こう側に居るだれかに、少額の作業を発注するというアマゾンのサービス、メカニカルターク(AMT)を使った面白い調査があった。この人がAMTへ投げた仕事の依頼は、「自分の顔と、『なんで自分はタークしてる(AMTで回答してる)かを書いた紙を写真に収めてアップロードしてください」というもの。最初5セント(5円)からはじめて、30人の写真を集めるには、最終的に50セント(50円)まで値を上げる必要があったそうだ。以下がその集まった写真。白人が多くて、アジア系は少ない。紙に書かれた回答の動機は、「金のため」、が「暇潰し」の倍あったそうだ。 50円でこんなことするかなあ、と僕などは思うけど、ネットにはいろんな人がいるからね。日本語でこういうことができるサービスが、アマゾンがやっても他社がやってもいいから、できると面白そうだと思った。 via Waxy この記事は移転前の古いURLで公開
yuiseki 2012/07/24
クラウドソーシング
リンク
大規模画像データセットを用いた自動画像アノテーション - cslabの日記
研究用メモ画像認識に関する研究用メモ任意の画像に映ってい映っている物やシーンを自動的に理解するために、画像にタグを自動手に付けていく手法が求められている。自動画像アノテーションの定義は、タグがついていない画像に対して、ふさわしいタグを複数付けていく手法のこと。画像中の特定のもの、たとえば、猫を見つけるなら、「特定物体認識」、何が映っているかを複数見つけるなら、「一般物体認識」と分けて議論される。自動アノテーション処理の流れ１．画像とそれに付随するタグのペアデータベースの構築２．画像とタグの特徴抽出３．画像とタグの関係モデルの構築４．モデルから新規画像へのふさわしいタグ推定が処理の流れ。画像の自動タグつけ用データセットをチェックしておく。自動アノテーション手法のアルゴリズム評価用に用意されたデータセット corel5K 例が載っている。Humanが画像に付けたタグと、
yuiseki 2012/07/24
画像認識

クラウドソーシング
リンク
ニコニコ動画の大規模なデータに対するタグ付けとリンク解析 - 武蔵野日記
ニコニコ動画データ分析研究発表会というのが開催されていたようだ。タイトルや説明文はノイジーなので、動画につけられたタグを使うと割ときれいなデータとして可視化したりできる、という話は、はてなブックマークの関連エントリー機能のときも聞いたような話で、基本的にはインターネットユーザに無料でデータのタグ付けをしてもらっている、という話なんだろうな、と思う。以前紹介したRion Snow の論文 (彼は2005年に Microsoft Research でインターンし、2006年に Powerset (現在は Microsoft に買収済み)、2007年には Google でインターンした人物。ACL という自然言語処理のトップカンファレンスで2006年にベストペーパー受賞)で、今年の Rion Snow のトークは、Amazon Mechanical Turkというシステムを使って、非常に安価
yuiseki 2012/07/24
クラウドソーシング
リンク
シリア騒乱の犠牲者数をリアルリポートするウェブ
yuiseki 2012/05/11
可視化

クラウドソーシング

データマイニング

匿名性
リンク
Amazon.co.jp: ホールシステム・アプローチ―1000人以上でもとことん話し合える方法: 香取一昭, 大川恒: 本
yuiseki 2012/02/02
ブレインストーミング

クラウドソーシング
リンク
ネットを使った大規模共同作業
ネットを使った大規模共同作業 (TEDTalks) Luis von Ahn / 青木靖訳 2011年4月 (CAPTCHAの画像)こんな風にゆがんだ文字を読んでフォーム入力をしたことある人？すっごく煩わしいと思った人は？やっぱりみんなそうですよね。考案したのは私です。(笑) まあ、考案者の１人ですね。これはCAPTCHAと呼ばれています。これの目的は、入力しているのが確かに人間で、何百万回もフォームを送信するように作られたプログラムではないと確認するためです。どうしてこれがうまくいくのかというと、目の見える人であればこんなゆがんだ文字でも問題なく読み取れますが、コンピュータにはまだそれができないからです。例えばチケット販売サイトのチケットマスターがユーザにゆがんだ文字を読ませるのは、一度に何百万枚もチケットを注文するプログラムをダフ屋に作らせないためです。 CAPTCHAはネット
yuiseki 2012/01/29
reCAPTCHAのTED

クラウドソーシング
リンク
dfltweb1.onamae.com – このドメインはお名前.comで取得されています。
このドメインはお名前.com から取得されました。お名前.com は GMOインターネットグループ(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。日本のドメイン登録業者(レジストラ)（「ICANNがレジストラとして認定した企業」一覧（InterNIC提供）内に「Japan」の記載があるもの）を対象。レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2023年10月時点の調査。
yuiseki 2012/01/11
アイデア

クラウドソーシング
リンク
– このドメインはお名前.comで取得されています。
このドメインはお名前.com から取得されました。お名前.com は GMOインターネット(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。日本のドメイン登録業者(レジストラ)（「ICANNがレジストラとして認定した企業」一覧（InterNIC提供）内に「Japan」の記載があるもの）を対象。レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2024年5月時点の調査。
yuiseki 2012/01/11
アイデア

クラウドソーシング
リンク
– このドメインはお名前.comで取得されています。
このドメインはお名前.com から取得されました。お名前.com は GMOインターネット(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。日本のドメイン登録業者(レジストラ)（「ICANNがレジストラとして認定した企業」一覧（InterNIC提供）内に「Japan」の記載があるもの）を対象。レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2024年5月時点の調査。
yuiseki 2012/01/11
アイデア

クラウドソーシング
リンク
– このドメインはお名前.comで取得されています。
このドメインはお名前.com から取得されました。お名前.com は GMOインターネット(株) が運営する国内シェアNo.1のドメイン登録サービスです。 ※表示価格は、全て税込です。 ※サービス品質維持のため、一時的に対象となる料金へ一定割合の「サービス維持調整費」を加算させていただきます。 ※1 「国内シェア」は、ICANN(インターネットのドメイン名などの資源を管理する非営利団体)の公表数値をもとに集計。gTLDが集計の対象。日本のドメイン登録業者(レジストラ)（「ICANNがレジストラとして認定した企業」一覧（InterNIC提供）内に「Japan」の記載があるもの）を対象。レジストラ「GMO Internet Group, Inc. d/b/a Onamae.com」のシェア値を集計。 2024年5月時点の調査。
yuiseki 2012/01/11
アイデア

クラウドソーシング
リンク
個人のアイデアを企業が買うアイデアオークションサイト「Mazer」公開 | RBB TODAY
参加ユーザーが考え、投稿を行い、ベストなアイデアを決定し、そのアイデアをオークションを通して企業が購入するという、アイデアオークションサイト「Mazer（マザー）」が9日に公開された。 Mazerは、「ニッポンをよりよくするためのアイデアをみんなで考えてまぜる。その方法と仕組み」をコンセプトとして開発されたインターネット上のソーシャル・プラットフォーム。Mazerでは、投稿されたアイデアのなかからベスト5に選ばれたアイデアを、企業や団体などがオークションを通して購入できる。毎週月曜日に「お題」が発表され、それに対して直感的に思いつく「ひらめき」（アイデアの種）を募集。水曜日にはクリエイティブ・ディレクターからアイデアを考える上での「まぜる」要素となる「Mazer（マザー）」が発表される。以降は金曜日いっぱいまで、それまでに投稿された「ひらめき」と「Mazer」を組み合わせた「アイデア」を募
yuiseki 2012/01/11
クラウドソーシング
リンク
http://japan.internet.com/column/busnews/20091001/6.html
yuiseki 2011/12/24
クラウドソーシング
リンク
ソーシャル監視ネットの誕生、ネットは千の目を持つ | ScanNetSecurity
yuiseki 2011/07/01
クラウドソーシング
リンク
1