タグ

pattern_recognitionに関するhiroakiunoのブックマーク (95)

  • Web上の膨大な画像に基づく自動画像補完技術の威力 - A Successful Failure

    画像内に映り込んだ所望のオブジェクトを排除し、違和感の無い画像を生成するシーン補完技術に関しては近年複数の研究成果が発表されている。しかし中でも2007年のSIGGRAPHにて米カーネギメロン大のJames HaysとAlexei A. Efrosが発表した手法*1はブレークスルーとなりうる画期的なものだ。 論より証拠、早速適用例を見てみよう。エントリで利用する画像はPresentationからの引用である。元画像の中から邪魔なオブジェクト等の隠蔽すべき領域を指定すると、その領域が補完された画像が自動的に生成される。 アルゴリズム 効果は抜群だがアイデア自体は単純なものだ。Web上には莫大な数量の画像がアップされており、今や対象となる画像の類似画像を一瞬にして大量に検索することができる。そこで、検索された類似画像で隠蔽領域を完全に置き換えてしまうことで違和感の無い補完画像を生成するのだ。

    Web上の膨大な画像に基づく自動画像補完技術の威力 - A Successful Failure
  • 機械の代わりに人間が学習入門

    7. 年表で見る機械学習 1946 モンテカルロ法 PRML 1958 カルマン・フィルター PRML 1960s 隠れマルコフモデル PRML -1961 ニューラルネットワーク PRML 1977 EM アルゴリズム PRML 1982 SOM (自己組織マップ) PRML 1984 CART (決定木の一手法) PRML 1994 ICA (独立成分分析) PRML 1995 サポートベクトルマシン PRML Mahout 1995 粒子フィルタ PRML 2000 FP-Growth Mahout 2001 アイテムベース協調フィルタリング Mahout 2001 Random Forest Mahout 2003 LDA (Latent Dirichlet Allocation) Mahout • フルサイズの年表は http://d.hatena.ne.jp/n_shuyo/2

    機械の代わりに人間が学習入門
  • 「5年後、言葉の壁は消える」、グーグルが検索技術への取り組みを披露

    グーグルは2010年6月8日、「検索の科学」と題したイベントを開催した。エンジニアリングリサーチ担当の上級副社長アラン・ユースタス氏をはじめ、検索の技術研究や製品開発を担当するエンジニアが登壇。現在までの検索技術の進化と、今後のビジョンを語った。 「かつて、Web検索で得た情報の中身は、古いのが当たり前だった。今では1分前に更新された情報ですら、検索できるようになった」。ユースタス上級副社長は、Web検索技術の進化の一端を、こう説明する(写真1)。 リアルタイム検索に加えて、グーグルがここ数年かけて取り組んできたテーマが、個人ごとに最適な検索を可能にする「パーソナライズド検索」、音声による検索や動画検索などだ。「検索は来、とてもパーソナルなものだ。同じ『膝』という単語でも、医者の場合と患者の女性の場合とでは、求める結果の種類もレベルも違う。医者などに向けて学術論文検索を提供しているのは

    「5年後、言葉の壁は消える」、グーグルが検索技術への取り組みを披露
  • レナ (画像データ) - Wikipedia

    lena_std.tif のRGB別ヒストグラム(対数表示)。ダイナミックレンジが、赤は低い方に広がっておらず、緑は高い方に広がっていない。青に至ってはその両方となっている レナ(LennaまたはLena)は、1973年から2010年代後半までにわたり、画像処理の分野で広く使用されていた標準的なテスト画像である[1]。 この画像は、『プレイボーイ』1972年11月号のセンターフォールドから切り取られたもので、写真家ドワイト・フッカーが撮影したスウェーデン人モデル、レナ・ソーダバーグの写真である。名の綴りは"Lena"であるが、この綴りでは「リーナ」と読まれる恐れがあるとして、「レナ」と発音してもらうためにモデル人の希望で『プレイボーイ』誌では"Lenna"と綴られていた[2]。 「レナ」以前にも、画像処理アルゴリズムの説明に『プレイボーイ』誌の画像が使われたことがある。1961年、ロー

    レナ (画像データ) - Wikipedia
    hiroakiuno
    hiroakiuno 2009/10/22
    >彼らは512×512イメージを望んだため、走査を画像のトップ5.12インチに制限したので、ちょうどモデルの肩で画像が切れてしまったというわけさ」
  • 私のオススメ iPhone アプリ - reQall 編 [iphone]

    au の2年契約が先月終了となったので,やっと iPhone に機種変更しました. というわけで,私が「コレイイ!」と思ったアプリを,これから数回に分けて紹介してみようと思います.まず第1回目は reQall から. reQall (iTunes link) 価格: 無料 Web サイト: http://www.reqall.com/ reQall はオンラインタスク管理サービスである.基は無料で,有料のプロアカウントも用意されている. 他のタスク管理サービス同様,reQall も モバイル・PC 端末からだけではなく e-mail や IM など様々な媒体を通してのタスク管理,同じく様々な媒体を通してのリマインド,地図との連携,他者とのタスク共有機能などが実現されている. だが特筆すべきは,その音声によるインターフェースだろう. 早い話,iPhone に向かって喋れば良いだけなのだ.

    私のオススメ iPhone アプリ - reQall 編 [iphone]
  • 適切なクラスタ数を推定するX-means法 - kaisehのブログ

    K-means法によるクラスタリングでは、あらかじめクラスタ数Kを固定する必要があります。HatenarMapsでもK-means法を使っているのですが、クラスタ数は(特に根拠もなく)200個に決め打ちになっていました。 これに対して、X-means法というK-means法の拡張が提案されていることを知りました。X-means法を使うと、データに応じて最適なクラスタ数を推定できます。 K-means and X-means implementations http://www-2.cs.cmu.edu/~dpelleg/download/xmeans.pdf X-means法の考え方は、K=2で再帰的にK-means法を実行していくというもので、クラスタの分割前と分割後でBIC(ベイズ情報量規準)を比較し、値が改善しなくなるまで分割を続けます。 調べたところ、Javaのデータマイニングツー

    適切なクラスタ数を推定するX-means法 - kaisehのブログ
  • ベイズを学びたい人におすすめのサイト - download_takeshi’s diary

    ベイジアンフィルタとかベイズ理論とかを勉強するにあたって、最初はなんだかよくわからないと思うので、 そんな人にお勧めのサイトを書き残しておきます。 @IT スパム対策の基技術解説(前編)綱引きに蛇口当てゲーム?!楽しく学ぶベイズフィルターの仕組み http://www.atmarkit.co.jp/fsecurity/special/107bayes/bayes01.html いくつかの絵でわかりやすく解説してあります。 自分がしるかぎり、最もわかりやすく親切に解説してる記事です。数学とかさっぱりわからない人はまずここから読み始めるといいでしょう。 茨城大学情報工学科の教授のページから http://jubilo.cis.ibaraki.ac.jp/~isemba/KAKURITU/221.pdf PDFですが、これもわかりやすくまとまってます。 初心者でも理解しやすいし例題がいくつかあ

    ベイズを学びたい人におすすめのサイト - download_takeshi’s diary
  • オープンソースの視線認識エンジン·Opengazer MOONGIFT

    こういった技術がオープンソース化されるのは素晴らしいことだ。コンピュータはキーボードとポインタデバイスを使って操作するのが当たり前になっている。だがこれは今後も続くだろうか。いや、マルチタッチシステムに代表されるようにもっと自由に操作できるようになるはずだ。 目線でポインタデバイスを制御する その一つの可能性として視線はじゅうぶん可能性がある。既に体が不自由な人のためにも利用されているが、Opengazerはそれをオープンソースとして提供している。 今回紹介するオープンソース・ソフトウェアはOpengazer、Linux向けの視線認識エンジンだ。 OpengazerはWebCamを使って顔を映し出す。そしてその視線の動きに応じてポインタデバイスを移動させることができる。画面の範囲は決して狭くなく、それでもきちんと認識して移動するのが凄い。 デモ動画はUbuntu上で動作しているようで、現在

    オープンソースの視線認識エンジン·Opengazer MOONGIFT
  • 村田研究室のページ

    hiroakiuno
    hiroakiuno 2008/12/14
    独立成分分析と主成分分析の違い >最も大きな違いは主成分分析の場合は基底系を直交基底に,独立成分分析は斜行基底に選んでいる点であると言える.
  • アンサンブル学習の解説と具体例 : 研究開発

    集合知と言えるのですが、こういう話ではありません。 集合知プログラミング どちらかというと、こちらの話です。 「みんなの意見」は案外正しい こういうタイトルですが、このでは「みんなの意見が正しくならない」例を数多く挙げ、 「みんなの意見が正しくなる」ことの困難さを述べています。 みんなの意見が正しくなるには、必須条件があります。 ・個体の分散が大きい ・個体はランダムな解を選ぶよりは、良い成績である。 その、良い方の例です。 選択肢として、 O Xがあり、この二つのうち一つが正解であるとします。 各個体が正解だと思う出力をし、全体として、多数決の出力もします。

    アンサンブル学習の解説と具体例 : 研究開発
  • はてなブログ | 無料ブログを作成しよう

    27年ぶりのYUKIライブ 2024/8/11。僕は埼玉の戸田市文化会館で行われた”YUKI concert tour “SUPER SLITS” 2024”に参加した。前にYUKIの歌声を聴いたのは1997/05/27の代々木第一体育館。実に27年の歳月が経ってしまった。 なぜそんなに間が空いたのか。なぜ、それでも参加しようと思ったのか…

    はてなブログ | 無料ブログを作成しよう
    hiroakiuno
    hiroakiuno 2008/10/08
    CCV: 空間的な情報を扱える画像特徴量
  • やる夫はSVMを実装したようです やる夫で学ぶ非線形なSVM

    1. やる夫は SVM を実装したようです & やる夫で学ぶ非線形な SVM Hatena id:repose Twitter id :y_benjo

    やる夫はSVMを実装したようです やる夫で学ぶ非線形なSVM
  • Use Your Illusion - ぼかし画像認証 - Radium Software

    Use Your Illusion: Secure Authentication Usable Anywhere - Usable Security 上の画像,何の画像に見える? 答えはこれ。 何も知らずにこの画像を見せられても,何の画像かはまったく分からないと思う。でも,ひとたび答えを知ってしまえば,なんとなく何の画像かを思い浮かべることができるようになる。 こんな感じで,「知っている人には確実に答えが分かる」「知らない人には絶対に答えが分からない」という条件を作り出すことができれば,それを認証の仕組みに応用することができるかもしれない ― このアイデアを実際に利用した認証メカニズムの一例が "Use Your Illusion" だ。 上のリンク先のサイトでは,携帯端末上での実装を想定したデモを体験することができる(ただし,自前の画像をアップロードする機能は動かなくなっている模様)。

    Use Your Illusion - ぼかし画像認証 - Radium Software
    hiroakiuno
    hiroakiuno 2008/09/02
    >こんな感じで,「知っている人には確実に答えが分かる」「知らない人には絶対に答えが分からない」という条件を作り出すことができれば,それを認証の仕組みに応用することができるかもしれない
  • ところでサポートベクターマシンって何なの? - きしだのHatena

    最近、機械学習とか、そのアルゴリズムのひとつであるサポートベクターマシンとかやってるわけですが、そもそも機械学習ってなんなんでしょか? 機械学習ってのは、なんとなく与えられた点の分類から、新たに与えられた点の分類を推測するのですが、ようするに、点が与えられたときにそこから分類の領域を推測しておいて、新たな点がきたときにはどの領域に入るかを判別するのです。 ニューラルネットワークは、名前にニューロンとかついてて、とてもステキな響きがするのですが、あれは関数のあてはめを行っているのです。そうやって関数をあてはめることで、領域の境界面を求めます。 NN法は、学習とかせず、一番近いデータが同じ分類になるはずという戦略でやってます。 サポートベクターマシンも考え方としてはNN法と同じで、新しい点がやってくると、学習したそれぞれの点までの近さを計算して、一番ちかい分類を求めます。そのため、学習データが

  • グーグル、文書翻訳サービス開設へ--狙いは機械翻訳の改善か

    言葉の壁を取り除こうというGoogleの取り組みに新しい動きがあった。同社は文書翻訳サービスのベータ版の開設に取りかかったようだ。 「Google Translation Center」の情報ページによると、このサービスは文書の翻訳を依頼する人と、代価を受け取って翻訳を提供する人とを結びつけるものだという。Google関連の話題を扱うブログGoogle Blogoscopedがこのサイトをめざとく発見している。 情報ページには「Google Translation Centerは、コンテンツの翻訳を簡単かつ迅速に進める手段を提供する。文書をアップロードして翻訳言語を選択し、当センターに登録されているプロとボランティアの中から翻訳者を選択する。翻訳者が承諾したら、翻訳が完成し次第、翻訳された文書を受け取ることができる」とあった。 Google Translation Centerは仲介の役割

    グーグル、文書翻訳サービス開設へ--狙いは機械翻訳の改善か
  • データから「構造」を発見する:より人間に近づく人工知能 | WIRED VISION

    データから「構造」を発見する:より人間に近づく人工知能 2008年7月31日 サイエンス・テクノロジー コメント: トラックバック (1) Brandon Keim 生物学者のエルンスト・ヘッケルが作成した系統樹(現在は不正確だとされている)。 Image: WikiMedia Commons コンピューターがより人間らしく考えるのに役立つかもしれない、ある新しいパターン認識モデルが登場した。 7月28日(米国時間)刊行の『米国科学アカデミー紀要』(PNAS)に掲載されたこのモデルは、生のデータセットから出現する見込みが最も高いパターンの種類を判断する。 こうした処理は、人間が周囲の世界を理解する際に無意識のうちに使っているものだが、人工的な認識ツールでは一般に難しいとされてきた。 顔認識や系統学などに使われている現行の諸モデルでは、予想されるパターンの型があらかじめ特定されている必要があ

  • 【レポート】Web 2.0 Expo - 究極の携帯UI「音声認識」、Tellmeの新サービスを試してみる (1) 音声認識とGPSを組み合わせたサービスとは | ネット | マイコミジャーナル

    突然だが、いま「音声認識」が米国で密かなブームとなっている。PCの性能向上とともにアプリケーションのダウンサイジングが進み、各社独自のエンジンを搭載したコンシューマ向け音声認識ソフトウェアがブームになったのは今から10年ほど前。キーボードのいらない補助入力システムとして売り出されてはみたものの、思ったより低い認識精度、それを向上させるための面倒なエンロール(学習)作業など、まだまだ未成熟の技術であることを思い知るだけだった。そして10年、いま再び登場した音声認識技術は活躍の舞台を携帯電話へと移し、UIに制約が多い中での補助入力デバイスとして使われ始めている。 ハンズフリーを目指した、Tellmeの音声検索サービス 米カリフォルニア州サンフランシスコで開催されたWeb 2.0 Expo。ここで4月23日(現地時間)に基調講演を行なった米Tellme Networksのコンシューマサービスビジ

  • 顔写真をアップするとその人についていろいろ評価してくれる『FaceStat』 | 100SHIKI

    これはちょっと怖いけど興味深いサービス。 FaceStatで顔写真をアップするとその人がどういう人かを大勢の人が評価してくれてその結果を返してくれるというもの。 何歳ぐらいか?賢そうか?魅力的か?信用できそうか?結婚しているか?などなど・・・。 そうした質問に対するどういった回答が寄せられたかの統計を見る事ができます。Amazonのクラウドソーシングのサービスを使い、小額でもって大勢の人に評価を依頼しているようです。 自分の顔写真をアップして他の人がどう感じるかを調べてみてもいいですが・・・ちょっと怖いかもですね。 でもこうしたカタチのマイクロクラウドソーシングがこれから流行っていくのでしょうかね。いろいろアイディア出そうではあります。

    顔写真をアップするとその人についていろいろ評価してくれる『FaceStat』 | 100SHIKI
  • IDEA * IDEA

    ドットインストール代表のライフハックブログ

    IDEA * IDEA
    hiroakiuno
    hiroakiuno 2007/12/14
    プレゼン資料とかパンフレット作成でもこの技術が使えると便利
  • Amazon.co.jp: パターン認識と機械学習 上 - ベイズ理論による統計的予測: C. M. ビショップ (著), 元田浩 (翻訳), 栗田多喜夫 (翻訳), 樋口知之 (翻訳), 松本裕治 (翻訳), 村田昇 (翻訳): 本

    Amazon.co.jp: パターン認識と機械学習 上 - ベイズ理論による統計的予測: C. M. ビショップ (著), 元田浩 (翻訳), 栗田多喜夫 (翻訳), 樋口知之 (翻訳), 松本裕治 (翻訳), 村田昇 (翻訳): 本