Image net classification with Deep Convolutional Neural NetworksShingo Horiuchi
はじめに 系列ラベリング問題についてちょっと調べてみたのでメモ。 系列ラベリング(系列分類)問題とは ある系列xの各要素に適切なラベル列yを付与する問題 例えば「This is a pen」という文書の各単語に「This(代名詞) is(動詞) a(冠詞) pen(名詞)」のように品詞ラベルをつける問題(品詞タグ付け) 系列だけでなく木構造などへの適用もされている 構造学習 ラベル、木、グラフ、順序集合など 応用 品詞分類 形態素解析(ラティスのコスト計算なども) チャンキング(基本名詞句(Base NP)同定、固有表現抽出、文節まとめあげなど) 系列セグメンテーション問題 時系列解析や画像認識 など 系列ラベリング問題の特徴 普通の多値分類との違いは、「注目している要素xi以外の情報も使えること」と「クラスの数が膨大になりやすいこと」がある。 注目している要素以外の情報も使える 多値分類
For the last few months, I have had a nearly constant stream of queries asking how TinEye works and, more generally, how to find similar pictures. The truth is, I don't know how the TinEye image search engine works. They don't disclose the specifics of the algorithm(s) that they use. However, based on the type of results it returns, it appears to me to be some variation of a perceptual hash algori
日立製作所(千代田区)は6月1日から、オノデン本店(千代田区外神田1)で「類似画像検索技術による防犯支援」実証プロジェクトを開始した。 同実証実験は、秋葉原で先端技術の実証を行う「秋葉原先端技術実証フィールド推進協議会」が調整事務局として入り、日立製作所主体で実施するもの。実際にオノデン本店1フロア4カ所にカメラを設置。膨大な量の監視カメラの映像から人物の顔を検出し、類似した特徴を持つ顔画像を検索することによって、特定の人物を探し出す「類似検索技術」を実証する。 同技術は、数百万フレームの画像を対象に約1秒以内に検索を完了する「検索の高速性」と、監視カメラは常時稼動しているため膨大な量の画像が蓄積されることから、同システムは映像中に「動き」や「顔」が検知された場合のみデータベースに画像を蓄積するのが特徴。 秋葉原先端技術実証フィールド推進協議会によると「秋葉原の街を代表する電気街で、買い物
覆面していても顔認識できる新しいアルゴリズム 2008年3月26日 サイエンス・テクノロジー コメント: トラックバック (0) Bryan Gardiner Allen Yang氏の顔認識アルゴリズムを使うと、たとえ画像が破損していたり、部分的にさえぎられていても、該当する人物を的確に見つけ出すことが可能だ。Photo: Allen Yang 忍者の覆面はもう意味がない。カリフォルニア大学バークレー校とイリノイ大学アーバナ・シャンペーン校(UIUC)の研究者たちが開発した新しい顔認識アルゴリズムは、たとえ目、鼻、口の部分が不明瞭でも、90%から95%の正確さで個人の顔を認識できるのだ。 「多くのアルゴリズムでは、目、鼻、口といったいわゆる重要な顔の特徴を使って個人を確認している」と、新しいアルゴリズムを開発したバークレー校工学部の研究者Allen Yang氏は述べる。 「しかし、それだと
前回に引き続き、UC San Diego の Serge Belongie 教授らによる研究についての記事を1つ。知る人ぞ知る?Google のサービス"Google Sets"を応用して、画像認識の精度を上げようという取り組みが行われているそうです: ■ Computers With 'Common Sense' (ScienceDaily) 簡単に言うとこんな感じ。上の画像を見て、「右下にある黄色い丸はレモンだ」という人はいないでしょう。レモンのような形・色をしてるけど、「人間」が「テニスコート」の上で「ラケット」で打とうとしているモノだから、これはテニスボールに違いない……というような判断を、コンピュータによる画像認識でも行わせようという発想です。 では「人間」「テニスボール」「テニスコート」が認識できたとして、その文脈で登場し得るものが何か、を判断するために白羽の矢が立ったのが"G
BBC Newsの記事より。人間には読めるがコンピュータに読めない画像の文字列CAPTCHAは、ブログなどへの広告宣伝業者よけとして、あちこちで使われているソリューションである。試算によると、この文字列を解読するのに人間が使用している時間は一日あたり15万時間にも及ぶという。 この人間の処理能力をもっと有効に活用できないかと、カーネギーメロン大学のLuis von AhnはreCAPTCHAという新しいソリューションを考案した。 古書からスキャンしたデータは、かすれや印刷不良などOCRによって読めない文字を多量に含んでおり、古書のデジタル化は人手に頼る部分がどうしてもできてしまう。そこで機械が読めなかった文字列画像をCAPTCHAに利用して、解読時間を有効活用しようという仕組みだ。 そもそも機械が正答を知らない文字列画像を表示するのに、どうやって機械ではなく人間が解読して入力してきたと判別
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く