タグ

2009年10月29日のブックマーク (15件)

  • 確率的言語モデルによる自由発話認識に関する研究

    次へ: 目次 目次 確率的言語モデルによる自由発話認識に関する研究 博士(工学) 村上仁一 豊橋技術科学大学 論文要旨 確率的言語モデルによる自由発話認識に関する研究 日文音声入力においては、音声の持つ物理的特性に着目した音声認識装置の 限界を克服するため、日語の文法や意味を用いた自然言語処理を併用するこ との必要性が指摘されている。この場合の言語処理の方法として、多くの言語 モデルがあるが、大きく分類してルールベースの言語モデルと確率ベースの言 語モデルがある。 言語の確率ベースの研究を行なう場合、基的には大量のテキストデー タ量が必要である。英語ではデータベースの重要性が認識されていて古くから Brown corpusやAP corpusなどがあるが、しかし日語ではコンピュータに読 み込める形式で利用できる大量のデータベースが最近まで存在していなかった。 そのため、確率的な言語

    suikyo
    suikyo 2009/10/29
  • 系列ラベリングアルゴリズムの比較 - 松本研研究日誌

    今日の DMLA 勉強会は松先生で Nam Nguyen and Yunsong GuoComparisons of Sequence Labeling Algorithms and ExtensionsICML-2007の紹介。SVM^struct/SVM^multiclass/CRF/HMM/Averaged perceptron/SEARN/M^3Nといったいろいろなアルゴリズムで品詞タグづけ問題を解くという話。提案手法はensemble learningで複数の手法の重み付けによる分類器を作ると、単体で一番成績がよかったSVM^structよりさらによくなりますよ、とのこと。なんか CRF が予想外に悪かった(松先生も首を傾げていた)のだが、なんなんだろうか。 SEARN (Search-based Structured Prediction)というのは元論文は Search

  • 系列ラベリングのための Forward-Backward アルゴリズムの一般化 - Educational NLP blog

    これも、頑張れば、breakthroughになりそうな研究。前向き後ろ向きアルゴリズムというと、隠れマルコフモデル(HMM)のBaum-Welchアルゴリズムが有名だけど、実は、HMMに限らず、前向き後ろ向きアルゴリズムで行っている計算は、系列ラベリングを行う時に質的に必要になってくる。 結局、入力系列と出力系列(ラベルの系列)があるとき、パラメータと、パラメータの良さ評価する関数を作ってやって、これを最大化するようにしてやるわけだ。今、ある入出力ペアとパラメータがあるときに、さぁ、このパラメータがどれだけ良いパラメータなのですか?ということを測りたい。測るのに使えるデータは、出力系列(正解のラベル系列)だけ。 まっとうな方法は、その入力とパラメータを与えた時の全ての出力系列のパターンと比較して、がどれだけ寄与するか(確率で考えれば、出やすいか)を計算することだろう。つまり、を計算してや

    系列ラベリングのための Forward-Backward アルゴリズムの一般化 - Educational NLP blog
    suikyo
    suikyo 2009/10/29
  • OpenCV 2.0 – cv::Mat – Rest Term

    OpenCV C++ matrix class 前回、OpenCV 2.0 – cv::Ptr ではスマートポインタである cv::Ptr について調べました。 今回はOpenCV 2.0のC++インタフェースの中でも重要な役割を持つ cv::Mat クラスについて。 このクラスは従来の IplImage 及び CvMat に取って代わるものになっていますが、 かなり大きいクラスなので何回かに分けて調べていきたいと思います。 cv::Mat はマルチチャンネルとROI(Region Of Interest)をサポートしている二次元行列です。 オブジェクトの生成方法は複数ありますが、ここでは基的な方法から紹介します。 using namespace cv; using namespace std; // create() メソッド (5行5列,各要素が8ビット符号なし整数型 3チャンネル)

    OpenCV 2.0 – cv::Mat – Rest Term
  • コーナー検出法 - Wikipedia

    英語版記事を日語へ機械翻訳したバージョン(Google翻訳)。 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。 翻訳後、{{翻訳告知|en|Corner detection|…}}をノートに追加することもできます。 Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説

  • ゼミログ/第24回/4.Lucas-kanade(玉城絵美)

    &color(foreground[,background]){text}; † //////////////////////////////////////////////////////////////////// // OpticalFlow_LK.pde // // Dec.2004 Fujiyoshi Laboratory, Chubu Univ. // http://www.vision.cs.chubu.ac.jp/ // code by hiroki //////////////////////////////////////////////////////////////////// ↑ &color(foreground[,background]){text}; † size(320, 240) int _fps = 30; // frame rate (default

  • カメラパラメータの推定によるビデオモザイキング

  • KLT: Kanade-Lucas-Tomasi Feature Tracker

    KLT: An Implementation of the Kanade-Lucas-Tomasi Feature Tracker KLT is an implementation, in the C programming language, of a feature tracker for the computer vision community.  The source code is in the public domain, available for both commercial and non-commerical use. The tracker is based on the early work of Lucas and Kanade [1], was developed fully by Tomasi and Kanade [2], and was explain

    suikyo
    suikyo 2009/10/29
    OpenCVより効率的だがAffine変換を考慮しない実装、らしい?
  • 途切れた特徴点追跡の延長に関する研究

  • 【CEATEC】東芝Cellのデモ,今年はリアルタイムに体全体の姿勢を認識

    東芝は,マルチコア型マイクロプロセサ「Cell」を使った画像認識の実演を行った。昨年はカメラで撮影した顔画像から顔の向きや表情をリアルタイムで認識していたが,今年のCEATECでは認識する範囲を体全体に広げた。カメラ画像からのモーション・キャプチャを実現するシステム「Markerless Motion Capture 動作捕獲術 SHADOW」を開発,部品ゾーンの同社ブースで展示した。 今回開発したモーション・キャプチャ・システムは,特殊なマーカーやセンサなどを付けることなく,カメラで撮影した画像だけから人間の手の動きや姿勢を認識できる。具体的には,専用の舞台に立った人物をカメラで撮影し,背景画像との差分から人物領域を推定。そのシルエット形状を事前に蓄積・学習した人物の姿勢のデータベースとマッチングすることで,関節の角度など人物の姿勢を判別する。得られた関節角度などのデータは,3次元コンピ

    【CEATEC】東芝Cellのデモ,今年はリアルタイムに体全体の姿勢を認識
  • cagylogic

    Privacy & Cookies: This site uses cookies. By continuing to use this website, you agree to their use. To find out more, including how to control cookies, see here: Cookie ポリシー

    cagylogic
  • cagylogic

    PTAMの論文と、スライドを読んだのだが、これがまぁびっくりするほど、ちんぷんかんぷん。連鎖的にいろいろな用語をググったりを調べる羽目になった。 忘れないようにメモ。 続きを読む PTAMのアルゴリズムを理解するために必要な用語 →

    cagylogic
  • 第1回 画像認識の基本を知ろう | gihyo.jp

    この連載では、この表で言う画像認識技術を主に扱いますが、どの技術も非常に活発に研究されており、様々な分野で実用化されています。 画像認識・理解の基原理 画像認識の基原理 画像認識は、学習のフェーズと認識のフェーズの2つからなります。学習のフェーズでは、コンピュータに認識させたい対象画像を学習させる処理を行い、認識のフェーズではコンピュータに入力画像が学習した対象かどうかを判定させます。 図5 学習と認識の流れ 学習フェーズ 学習のフェーズでは、まず画像になんらかの処理を施して、ピクセルのデータ列から、より学習に適したデータ列(特徴量データ)へと変換を行います。 次に変換されたデータを、機械学習と呼ばれるアプローチを用いてコンピュータに学習させます。機械学習とは、その名の通り人間が行っているような学習の仕組みをコンピュータに持たせるための技術です。例えば人間は、初めて見る人の顔画像でも、

    第1回 画像認識の基本を知ろう | gihyo.jp
  • HoG vs Haar-like feature ベンチマーク - コンピュータビジョンの日々

    OpenCVのサンプルとしても公開され、すっかり有名になった Haar-like特徴量と AdaBoost分類器を用いた顔認識手法だが、現在最先端の画像処理研究では、HoGという特徴量が注目されている。 HoGは、"Histogram of oriented Gradient"の略で、直訳すると、「方向づけられた勾配のヒストグラム」ということになる。つまり、入力画像の勾配(微分画像)を求め、それを局所領域ごとに勾配方向で区間分割してヒストグラムを取ったものを特徴量としようとする手法である。 これは2005年にNavneet DalalとBill Triggsによって提唱された新しい手法で、Haar-likeよりも分別能力が高そうだということで、盛んに研究されている。 私も今、HoGを使った物体認識処理を試作しているところであるが、データ空間として線形分離しやすいらしく、SVM(サポートベク

    HoG vs Haar-like feature ベンチマーク - コンピュータビジョンの日々
    suikyo
    suikyo 2009/10/29
    『検出率はHoGが良く(高く)、false positive量はHaar-likeの方が良い(少ない)模様(table2)。』『「HoGは、特徴量を増やすと false positive 率は安定のまま検出率が向上する。他方、Haar-likeでは、false positive率が減少した」』
  • 「羽田ハブ」に30年無策のツケ:日経ビジネスオンライン

    「羽田を日のハブ空港に」。前原国交相の発言が論争を巻き起こしている。関係自治体は反発するが、羽田のハブ化は必然。だが、実現には長年タブー視されたがゆえの盲点があった。 「日にはハブ(拠点)空港が存在しない状態。羽田空港の24時間空港化を目指したい」 10月12日に前原誠司・国土交通相が放った突然の一言が論争を巻き起こしている。県内に成田国際空港を抱える森田健作知事は翌13日、地団駄を踏みながら「冗談じゃない」「昨夜は頭にきて眠れなかった」などと過激な言葉遣いで怒りをあらわにした。 片や韓国中国、シンガポールなどの空港に後れを取っていることへ危機感を見せる国交相。一方、成田開港には激しい反対闘争のあった経緯があるため、森田知事は羽田の国際化を最優先課題と位置づける前原発言に異を唱えた。どちらの言い分にもそれなりに理がある。そのため関係者を巻き込んだ論争が当面絶えることはないだろうが、首

    「羽田ハブ」に30年無策のツケ:日経ビジネスオンライン
    suikyo
    suikyo 2009/10/29