タグ

2010年3月3日のブックマーク (3件)

  • 今度は10万件の画像フィルタリングを Amazon Mechanical Turk に依頼してみた : 管理人@Yoski

    さて大好きな Amazon Mechanical Turk. 所要があり、今度は10万件以上の画像フィルタリングを依頼してみました。のでメモ。 まずは Requester として、依頼画面を作成します。 画像フィルタリングは定番なんですかね。テンプレートが用意されているので、それを選択。 テンプレートの内容を適当に変更します。 サンプルは定番の(?)アダルトコンテンツのフィルタリング依頼という内容になっているので、もちっとやさしいものに。 さて、ここがすばらしいところなんですが、入力フォームのデザインを作成します。 テンプレートのものを修正して、ちょいちょいちょいと。 後で大量のデータを流し込めるよう変数が使えるようになっています。HTMLのソースも編集できるので、かなり自由度高くて使いやすい。 テンプレートができたらデータを CSV ファイルで流し込みます。 サンプルデータがあるので、そ

  • サバンナの水飲み場に潜伏すること270時間、マラリアなどにかかりつつ撮影された渾身の野生動物写真

    写真家のGreg du Toit氏はケニアのサバンナでライオンが水を飲む姿を捉えようと、水飲み場近くに身を隠す基地を建てたり塹壕(ざんごう)を掘ったりして1年間ねばったものの成果を得られず、最後の手段として泥水の中に身を潜めて動物が水を飲みに来るのをじっと待つことにしたそうです。 3ヶ月間水に漬かってシャッターチャンスを待ち続けたすえ撮影された写真はすばらしいものばかりですが、ビルハルツ住血吸虫や鉤虫(コウチュウHookworm)、マラリア(2度感染)など多数の寄生虫症に感染するなど、命がけとも言える仕事だったようです。 詳細は以下から。Photographer captures amazing images of lions at watering hole after submerging himself for three months | Mail Online Greg du T

    サバンナの水飲み場に潜伏すること270時間、マラリアなどにかかりつつ撮影された渾身の野生動物写真
  • Online EM を実際のタスクに適用するとどうなるのだろうか - 武蔵野日記

    今日の機械学習の勉強会では Percy Liang, Dan Klein. Online EM for Unsupervised Models. NAACL-2009. を @tettsyun くんが紹介してくれた。日語による解説は@hillbigくんのオンラインEMアルゴリズムに詳しい。(ohmm(オンラインEMによるHMM学習)をリリースしましたでソースコードも公開されている) ちなみに@tkngさんがChaIMEの高速化とモデルファイルのサイズを縮小するために、このohmmを用いており、大規模データに対してスケールする、ということを示していた、というのがここまでの経緯。 しかし今回きちんと論文を読んでみると、どうも彼らは新しいことを提案したというよりは、自然言語処理のいくつかのタスクでしっかり実験しました、という話のようである。そして、品詞タグ付けと単語分割、文書クラスタリングと機

    Online EM を実際のタスクに適用するとどうなるのだろうか - 武蔵野日記