タグ

ブックマーク / lm-7.hatenadiary.org (29)

  • 無音声認識の可能性 - A Successful Failure

    音声入力がなかなか普及しない理由として、発話しなければならないと言う点がある。周りに誰もいない環境ならそれでも良いが、周りに他人がいる場合に独り言のように発話するのはなかなか難しい。周りの人に迷惑になることも問題だが、入力内容が周りの人に知れるということも問題である。さらに騒音下だとただでさえ悪い音声認識率がさらに下がると言う問題もある。音声認識の最大の欠点は声を出すことにあったのだ。 奈良先端科学技術大学院大学音情報処理学講座 鹿野研究室で開発された「非可聴つぶやき認識(無音声認識)」はこれらの課題を解決し、音声入力の利便性を大きく向上させる可能性をもつ技術である。非可聴つぶやき認識は、囁き声よりも小さな第三者に聴取不能な声帯の振動を伴わないつぶやき(Non-Audible Murmur:NAM)の体内伝導音を、耳の裏側に装着する身体表接着型マイクロフォンによって認識するものだ(無音声認

    無音声認識の可能性 - A Successful Failure
  • いよいよ実世界にタッチするiPhoneアプリまとめ その2 - A Successful Failure

    エントリでは前回に引き続き、iPhoneアプリケーションのうち、特に実世界とのインタラクションを有するものについて紹介する。カテゴリとしては、拡張現実(Augmented Reality)、コンテキスト・アウェアネス(Context Awareness)、位置依存サービス(Location Dependent Services)などが該当するだろう。前回をご覧になっていない方はまず下記エントリからご確認いただきたい。 いよいよ実世界にタッチするiPhoneアプリまとめ - A Successful Failure AR系アプリはツールキットの充実化などで今後もますます増加するものと考えられるが、エントリは全ての網羅を目的とするものではなく、中でもキラリとアイデアが光るものを中心に取り上げていきたい。 GolfScope:ピンまでの距離を計測 GolfScopeは光学式のゴルフスコープを

    いよいよ実世界にタッチするiPhoneアプリまとめ その2 - A Successful Failure
    yuiseki
    yuiseki 2010/10/10
  • 融けるような視点移動効果を実現する三次元再構築手法 Ambient Point Clouds - A Successful Failure

    いよいよ今年もSIGGRAPHが始まる時期となった。エントリでは、ダルムシュタット工科大学 (TUD) とマイクロソフトの合同チームによる、"Ambient Point Clouds for View Interpolation"と題されたtechnical paperから魔法のような視点補間技術を紹介したい。 まず、デモビデオをご覧いただくのが良いだろう。最初の方は既存手法の説明となっているが、目的は複数の写真をシームレスにつないで、破綻なく別視点に移動できる3次元モデルを再構築することである。02:44あたりから手法の適用結果が示されているので、まずそこを御覧頂きたい。これは、たとえばFlickrから集めてきた写真(当然カメラ位置も不明)から一切人の手を経ず全自動で生成されるのだ。 以下、論文*1に従って手法の概要について説明を行う。エントリで扱う図表は論文からの引用である。例に

    融けるような視点移動効果を実現する三次元再構築手法 Ambient Point Clouds - A Successful Failure
    yuiseki
    yuiseki 2010/07/27
  • 水滴が作り出す多層2.5次元ディスプレイ - A Successful Failure

    今年もSIGGRAPHの開催時期となった。この先、いくつか紹介したいと思うが、まず一番目は水滴をボクセル(voxel)として利用した多層2.5次元ディスプレイについてとりあげたい*1。例によってエントリで用いる図表は論文からの引用である。 (a)動画(b)テキスト (c)ゲーム(d)画像 図1:水滴により構成された各レイヤに静的/動的コンテンツを独立して描画できる2.5次元多層ディスプレイ 【告知】[twitter:@LunarModule7]でつぶやいています。 興味のあるかたはフォローください。 水滴は投射された光の大半を反射し、素晴らしい広視野角のレンズとなることができる。研究グループは、厳密に制御された多支管バルブ機構により生成された水滴の一滴一滴の位置をカメラでリアルタイムにトラッキングし、プロジェクタで一滴一滴に色を投影することで、動画やゲームなど様々なビジュアルコンテンツを

    水滴が作り出す多層2.5次元ディスプレイ - A Successful Failure
    yuiseki
    yuiseki 2010/07/08
  • Appleの強力な特許群はAndroid端末/電子書籍端末の脅威になるかも知れない - A Successful Failure

    Appleは2010年3月2日、台湾のHTCを特許侵害で提訴したと発表した(Apple Sues HTC for Patent Infringement)。HTCはAndroid端末の最大の供給元でありNexus Oneの開発でも知られている。HTCとしては、まったく事前通告のない突然の提訴だったようだ。 Appleは20件の特許侵害を主張しているが、内10件の特許番号が訴状で明らかにされている。請求項を確認してみたところ、その基的で広い権利範囲に驚愕してしまった。通常、特許と言っても、概要は広くても実際に請求項を見てみれば、様々な制限がかかっていて全然怖くない事が多いのだが、挙げられた特許はどれも請求項が比較的シンプルか、ごく当たり前の構成が羅列されているだけであり、極めて強力であると考えられる。事はHTCのAndroid端末だけに限らず、SonyEricssonやSamsung等他

    Appleの強力な特許群はAndroid端末/電子書籍端末の脅威になるかも知れない - A Successful Failure
    yuiseki
    yuiseki 2010/05/17
  • Photoshopを凌駕するリアルタイムの動画像切り貼り処理 - A Successful Failure

    Photoshop等の画像編集アプリケーションを用いた画像処理において、パッチツールを用いた画像の切り貼りは重要な操作である。パッチツールを用いた切り貼り操作では、貼り付けたパッチ画像は周囲にあわせて自動的に調整され、境界面が目立たないようになる。SIGGRAPH2009において、ヘブライ大学の研究グループが、この切り貼り操作を高速で行う手法を提案している。動画に対してもリアルタイムに切り貼り操作を行う事ができる。まずは動画をご覧頂くのが良いだろう。 エントリでは論文*1を参照して、手法の紹介を行う。例によって図表は論文の引用である。 【告知】@LunarModule7でつぶやいています。 興味のあるかたはフォローください。 Mean-Value Seamless Cloning (a) Source patch(b) Laplace membrane(c) Mean-value me

    Photoshopを凌駕するリアルタイムの動画像切り貼り処理 - A Successful Failure
    yuiseki
    yuiseki 2010/04/11
  • 都市景観をスキャンし3Dモデル構築する予想外の方法とは? - A Successful Failure

    建物群から構成される都市景観の3Dモデリングは、様々なアプリケーションにおいて利用されているが、その利用は現時点では限定されており、より積極的な利用を促進するには、3Dモデル構築の省力化、自動化、低コスト化が求められる。最近、ジョージア工科大の研究グループが、都市景観をスキャンし、3Dモデル構築を行うあっと驚く意外な方法を考案している。エントリでは、論文*1に従って、この手法の概要と、それによって将来可能になるであろうユースシーンについて紹介したい。エントリで掲載する図表は論文からの引用である。 【告知】@LunarModule7でつぶやいています。 興味のあるかたはフォローください。 GPSを使って街をスキャンする GPSは30個程度の衛星のうち受信可能な位置にある衛星からの時刻情報、軌道情報などを受信し、衛星からの距離を測定、3次元位置を測位するものだ。4個のGPS衛星からの電波

    都市景観をスキャンし3Dモデル構築する予想外の方法とは? - A Successful Failure
    yuiseki
    yuiseki 2010/03/21
  • Web上の膨大な写真からローマを1日で構築する方法 - A Successful Failure

    前回、『写真に基づく3D空間構築手法の到達点』としてバラバラの写真から3D空間を構築する手法について取り上げた。コメントで言及された人もおられたが、MicrosoftはPhotosynthとして、同様にStructure-from-Motion (SfM)を用いて写真をつなぎ合わせ、インタラクティブにブラウズできるPhotosynthを公開している。 Photosynth Overhead View on Vimeo Photosynth + Bing Maps on Vimeo 現在、研究レベルではWeb上にアップされた不特定多数のユーザによる膨大な写真から街一つを再現するプロジェクトが推進されている。その名も"Building Rome in a Day"(ローマを一日にして成す)だ。下の動画はFlickr検索された画像から生成された3Dモデルを示している。エントリでは、論文*1に基

    Web上の膨大な写真からローマを1日で構築する方法 - A Successful Failure
    yuiseki
    yuiseki 2010/01/25
  • 写真に基づく3D空間構築手法の到達点 - A Successful Failure

    一昔前は実世界の建築物を元にウォークスルー可能な3D空間を構築しようと思ったら、まず各部屋の形状を計測器を用いて計測し、その計測結果に基づいて人手でモデル化し、領域ごとにテクスチャを貼り、照明を設定して……と気の遠くなるような作業が必要だった。3D空間の構築は極めてコストの高い作業だったが、近年では2次元画像(実写写真)に基づいた3D空間の構築手法が長足の進歩を遂げており、以前に比べれば極めて低コストに3D空間を構築する事が可能となっている。 【告知】Twitterはじめました。@LunarModule7です。 興味のあるかたはフォローくださいとしばらく宣伝。 今ではバラバラに撮影した写真から、全自動で3D空間を構築し、内部を自由にウォークスルーできるようになっている。ワシントン大学とMicrosoft Reseachが2009年に発表した研究*1は現時点における集大成とも言えるものとなっ

    写真に基づく3D空間構築手法の到達点 - A Successful Failure
    yuiseki
    yuiseki 2010/01/03
  • Twitterは有料化したから非難されたのではない - A Successful Failure

    Twitterが有料化された際に、多くの非難が寄せられたことは記憶に新しい。 つぶやき販売を始めたtwitterのクレームがすごい - ついったーとHamachiya2 - はてなグループ::ついったー部 全てが有料になった訳ではなく、有料で「有名人からのリプライ」のような、欲しい人にとってはたまらないオプションが買えるようになったみたいだが、『今まで遊べていた部分はそのまま無料で遊べるにも関わらず何故そんなに怒るのか?』と不思議に思う人も多いだろう。実際、ブクマコメントは秀逸な改変とする意見が多いようだ。 しかし、彼らは有料になったから文句を言っているわけでは決してないのだ*1。 彼らが怒った理由を知るためには仮想世界について少し考える必要がある。野島美保著『人はなぜ形のないものを買うのか -仮想世界のビジネスモデル-』は仮想世界におけるマーケティングに関する先駆的な研究成果をまとめた良

    yuiseki
    yuiseki 2009/11/30
  • Adobe Photoshop CS5に実装されるPatchMatchの実力 - A Successful Failure

    動画:Adobe Photoshop CS5の新機能はもはやえげつないレベル… | ◆めっつぉ:スクエニ&ガジェットニュースとしてAdobe Photoshop CS5の新機能が紹介され話題になっている。 概要を知るには動画で見るのが手っ取り早いが、エントリではSIGGRAPH2009で発表された元論文*1を参照して、その詳細を紹介したい。 エントリで紹介する画像は全て元論文からの引用であり、高解像度画像にリンクしている。「失業者が出るレベル」とコメントされているが、高解像度画像によりそのクオリティを確認してもらいたい。 PatchMatchの概要 Adobe Photoshop CS5の新機能は、近似画像ないし近似画像領域を発見するための無作為近隣探索アルゴリズムであるPatchMatchによって実現されている。最近隣探索(nearest-neighbor search)は先行研究で

    yuiseki
    yuiseki 2009/10/14
  • いよいよ実世界にタッチするiPhoneアプリまとめ - A Successful Failure

    携帯電話は常に電源が入ったネットワーク接続デバイスであり、常時ユーザが持ち歩くと言う点において、ウェアラブルコンピューティング(Wearable Computing)で語られてきたユースケースを徐々に実現しつつある。特にiPhoneGPS/コンパス/加速度などの各種センサに加え、アプリケーション開発自由度の高さから、現時点で最も開発アクティビティの高いデバイスであると言える。 エントリではiPhoneアプリケーションのうち、特に実世界とのインタラクションを有するものについて紹介する。地図と連動して単純に現在位置から最寄りの施設やその施設のクーポン、イベント等を検索して提示するようなアプリ、単に音声を録音したり、音声コマンドを認識して動作するアプリは多く存在するが、エントリでは扱わない。ここではiPhoneに搭載されているセンサを一工夫して実世界を認識し新たなサービスを提供するアプリに

    いよいよ実世界にタッチするiPhoneアプリまとめ - A Successful Failure
    yuiseki
    yuiseki 2009/10/12
  • 感染症モデルに基づくゾンビ大量発生時の危機管理指針 - A Successful Failure

    新型インフルエンザが全世界を席巻しているが、エマージングウイルス(emerging virus:新興感染症)の感染爆発(outbreak: アウトブレイク)の危険性は、熱帯雨林の開発に伴う野生生物との接触拡大、交通機関の発達による感染経路の拡大により日に日に増大している。このあたりの話は山内一也東京大学名誉教授による連続講座 人獣共通感染症が大変充実しており興味深い。 エボラ出血熱などの極めて高い致死率を有する感染症が全世界に広がらず人類が滅亡しないのは、その高い致死率にある。他人に感染させる前に宿主が死亡してしまうので、感染が局所的範囲に抑えられるのだ。万が一、発病までに長い潜伏期間をもつ致命的な感染症が流行すると人類の存続が危うくなる。新型インフルエンザがそうならない保証はない。 ゾンビ感染症 ヴードゥーの司祭により生み出されるゾンビ*1は、多くの小説映画の題材となっているが、おおよ

    感染症モデルに基づくゾンビ大量発生時の危機管理指針 - A Successful Failure
    yuiseki
    yuiseki 2009/09/19
  • サマーウォーズ:曜日の求め方とか2056桁の暗号とかの解説 - A Successful Failure

    エントリは現在上映中の映画『サマーウォーズ』のネタバレを含む可能性があるので、未見の人は注意されたい。 主人公の健二が数学オリンピック代表候補であるという設定、最初に健二がShorのアルゴリズムに関する教科書を読んでいるのを見て、サイモン・シンが描き出した迫真のドキュメンタリー『フェルマーの最終定理 』*1ばりの展開が待っているのかと思いきや、まともな数学的要素は皆無で肩すかしをらってしまった。 気を取り直して、エントリでは『サマーウォーズ』における数少ない数学的要素を取り上げたい。なお、無粋なツッコミは無用だという人は読まない方が良いだろう。 誕生日の曜日の求め方 さて、夏希先輩の誕生日、1992年7月19日は何曜日か。劇中で健二はモジュロ演算(mod)を用いて一瞬で日曜日だと回答していたが、その間にどのような演算がなされていたのか見てみよう。 曜日換算を実現するために、ツェラーの

    yuiseki
    yuiseki 2009/09/02
  • 1/1000の圧縮率を目指す次世代動画像圧縮技術の行方 - A Successful Failure

    現在最高の圧縮効率を誇るAVC/H.264は1GbpsのフルHDTVを10Mbps以下に圧縮できる。1/100以上の圧縮率ということになるが、次世代beyond HDTVの8k4kの空間解像度、60〜300fpsの時間解像度、マルチスペクトルの色表現、10〜16bit/pelの画素値深度、複数視点を考えると情報量は16〜200Gbpsとなるため、ビットレートを100Mbpsまで許容したとしても、圧縮率をさらに10倍は引き上げる必要がある(1/1000以上)。 上記の要求に対し、短期的には従来のAVC/H.264で用いられている動き補償予測とDCTを組み合わせたMC+DCTの枠組みを維持し、改良を積み重ねて圧縮率向上を図るアプローチが取られるが、長期的には従来の枠組みに囚われない新たなブレークスルーが必要となる。エントリでは、情報処理6月号の解説*1より、画像圧縮技術のブレークスルーの萌芽

    1/1000の圧縮率を目指す次世代動画像圧縮技術の行方 - A Successful Failure
    yuiseki
    yuiseki 2009/07/15
  • Web上の膨大な画像に基づく自動画像補完技術の威力 - A Successful Failure

    画像内に映り込んだ所望のオブジェクトを排除し、違和感の無い画像を生成するシーン補完技術に関しては近年複数の研究成果が発表されている。しかし中でも2007年のSIGGRAPHにて米カーネギメロン大のJames HaysとAlexei A. Efrosが発表した手法*1はブレークスルーとなりうる画期的なものだ。 論より証拠、早速適用例を見てみよう。エントリで利用する画像はPresentationからの引用である。元画像の中から邪魔なオブジェクト等の隠蔽すべき領域を指定すると、その領域が補完された画像が自動的に生成される。 アルゴリズム 効果は抜群だがアイデア自体は単純なものだ。Web上には莫大な数量の画像がアップされており、今や対象となる画像の類似画像を一瞬にして大量に検索することができる。そこで、検索された類似画像で隠蔽領域を完全に置き換えてしまうことで違和感の無い補完画像を生成するのだ。

    Web上の膨大な画像に基づく自動画像補完技術の威力 - A Successful Failure
    yuiseki
    yuiseki 2009/07/01
  • 顔画像処理技術の研究動向と応用事例 - A Successful Failure

    情報処理に2ヶ月連続で顔画像処理技術のサーベイが掲載されている*1,*2。サーベイ著者らの研究業績紹介にやや偏っている印象があるが、興味深く、有用なサーベイとなっているのでポイントだけ整理してまとめておく。なお、最近話題になったモノを中心に元論文にはない複数の項目を追加している。 顔画像処理技術 顔検出 画像の中から漏れなく誤りなくリアルタイムで顔の位置を検出する技術。動画処理時にはトラッキングも必要。 ViolaとJonesによるHaarタイプの特徴量を用いた高速顔検出手法*3をベースとして多くの改善手法が提案されている。 顔特徴点検出 顔の性別、年齢を含めた属性推定や個人識別を行うために、顔の各器官の特徴点の検出を行う技術。 多種特徴点抽出に対応したCootesらのActive Shape Model(ASM)やActive Appearance Model(AAM)が有名*4。拡張・

    顔画像処理技術の研究動向と応用事例 - A Successful Failure
  • ソーシャルネットワークの未来にむけたW3Cのアクションと方向性 - A Successful Failure

    W3Cは先月Workshop on the Future of Social Networkingにおいてソーシャルネットワークの未来について考察し、レポートを公開した。このワークショップの参加には自らの考えを明らかにするポジションペーパーの提出が必須であり、様々な参加企業・団体の72のポジションペーパーが公開されている。たとえばVodafoneは時空間情報の取扱いからコンテキスト・アウェアネスを指向していることが見て取れる*1。 W3Cではこのようなワークショップを定期的に開催し、有識者を集めて議論を行い、今後のW3Cの活動の方向性を決定している。逆に言えば、W3Cのワークショップの結論をチェックしておけば、これからWebが向かおうとしている方向性を早い段階で知ることが出来る*2。W3Cのこうしたワークショップはポジションペーパーさえ出せば誰でも出席できるので、関心のある人は検討してみて

    ソーシャルネットワークの未来にむけたW3Cのアクションと方向性 - A Successful Failure
    yuiseki
    yuiseki 2009/04/06
  • 世界中でダンスする"Where the Hell is Matt?"のまとめ - A Successful Failure

    "Where the Hell is Matt? (2008)"がホットエントリとなっている。世界中のあらゆる場所で、一人の男性がただただ踊っているだけの映像だが、世界中で共感を呼び、多くの人々に視聴されている。ここでは、この一連のビデオ作品に関して、その作られた経緯や背景などを米Wikipediaから紹介したい。 マット(Matt Hardin)は1976年生まれ32歳*1のアメリカ人のビデオゲーム開発者だが、最近は世界中の様々な場所のランドマークやストリートでダンスを踊るDancing Mattとしてよく知られている。 彼は元々コネティカット州ウェストポートの出身で、Cutting Edge Entertainmentというビデオゲーム店で働いていた。後に彼はコネティカット州ウィルトンのGameWEEK Magazineで編集者を努め、ゲーム開発会社Activisionでソフトウェア開

    世界中でダンスする"Where the Hell is Matt?"のまとめ - A Successful Failure
    yuiseki
    yuiseki 2008/11/23
  • ニコニコ大会議が浮き彫りにしたニコニコ動画の実世界拡張における課題 - A Successful Failure

    7月4日に開催されたニコニコ大会議2008 〜日の夏、ニコニコの夏〜は大盛況だったようだが、ここではリアルタイムで1万人のユーザに対して動画が配信され、普段のニコニコ動画と同じように誰もがコメントを入れられるようになっていた。そこで、実世界への拡張においての課題がクローズアップされている。 ニコニコ大会議おもしろかったけど質疑応答時、質問者を画面に映してその容貌がニコ厨から集中砲火されてる(そして質問者がそれをリアルタイムで見る)の見て気持ち悪くなった。トラウマになるよあれ。「それがネットの面白さだから」で済ませられるならネットなんて早くなくなってしまえと思う。 Twitter/津田大介 友人がニコニコ大会議に行って来たの話 - SPOTWRITE、「ニコニコ現実」のプロトタイプとしての「ニコニコ大会議2008」 - 濱野智史の個人ウェブサイト@hatenaにおいて課題が整理され、ハゲの

    ニコニコ大会議が浮き彫りにしたニコニコ動画の実世界拡張における課題 - A Successful Failure
    yuiseki
    yuiseki 2008/07/07