並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 337件

新着順 人気順

recognitionの検索結果241 - 280 件 / 337件

  • 任天堂、手書き入力技術『デクマ』をDSに導入 | WIRED VISION

    任天堂、手書き入力技術『デクマ』をDSに導入 2005年10月27日 コメント: トラックバック (0) 南 優人/Infostand 2005年10月27日 カナダのザイ社は26日(現地時間)、手書き入力技術の『デクマ』を任天堂にライセンス供与したと発表した。携帯ゲーム機の『ニンテンドーDS』で活用される。デクマはソニーのPDAにも採用され、日本語対応力の評価が高い。一段と手書きを駆使したゲームソフトを実現できそうだ。 デクマは、ソニーの『クリエ』や、NTTドコモの携帯電話『M1000』が採用。漢字入力では、書き順が違っていたり、崩し字でも認識可能というのが売り物だ。これまでは主にPDAやスマートフォン(PDA兼用携帯電話)で利用された技術だが、これをゲーム機に導入する。 DSは、手書きを生かしたソフトの人気が高く、ゲーム機の販売増に貢献している。代表例は『脳を鍛える大人のDSトレーニン

    • Android開発 - 音声認識サンプル

      利用者がスマートフォンに向かって話した内容をダイアログで出力するサンプルです。RecognizerIntentクラスを利用します。 package net.trusted_design.recognizerintentexam; import java.util.ArrayList; import android.app.Activity; import android.app.AlertDialog; import android.content.ActivityNotFoundException; import android.content.DialogInterface; import android.content.Intent; import android.graphics.Color; import android.os.Bundle; import android.sp

      • galatea プロジェクト日本語トップページ - OSDN

        Galatea Project は、擬人化音声対話エージェントのツールキット Galatea Toolkit を開発し、オープンソースで公開提供するプロジェクトです。顔、声、音声合成テキスト、認識文法、対話の流れなどはカスタマイズ可能で、これを用いて容易に人間の顔と表情を持ち、音声で対話する自分独自のエージェントを作成することができます。また、構成要素(音声認識、音声合成、顔画像合成など)を別々に無償で利用することもできます。 Linux および Windows に対応する各種モジュールを公開しています。 使用許諾http://sourceforge.jp/projects/galatea/wiki/License Galatea Projecthttp://hil.t.u-tokyo.ac.jp/~galatea/ システム要件 Linux 版については Ubuntu Linux (32

          galatea プロジェクト日本語トップページ - OSDN
        • LINE Login

          Log in to CLOVA Note

            LINE Login
          • GitHub - davidsandberg/facenet: Face recognition using Tensorflow

            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

              GitHub - davidsandberg/facenet: Face recognition using Tensorflow
            • Emotient - Facial Expression Recognition Software

              Emotient is the leading authority on facial expression recognition and analysis technologies that are enabling a future of emotion aware computing. Emotient API provides software developers an industry leading, real-time expression recognition and analysis solution. Our software is based on expert research and analysis of extensive data sets that describe various real emotional states..

                Emotient - Facial Expression Recognition Software
              • Google Developer Day 2010 Japan : 音声入力 API for Android

                .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                  Google Developer Day 2010 Japan : 音声入力 API for Android
                • 富士フイルム、顔検索技術のラボサイト「顔ラボ」公開--今後はAPIの提供も

                  富士フイルムは1月15日、同社が提供するラボサイト「FUJIFILM Internet Technology Lab」の第2弾サービスとして「顔ラボ」を開設し、独自の顔認識技術を使ったコンテンツの提供を開始した。 富士フイルムでは、自社の先進ソフトウェア技術を公開するため2007年7月にラボサイトを開設し、第1弾サービスとして画像検索エンジン「TRIPIT」を公開している。 顔ラボではまず1月15日より、画像検出技術を利用してアップロードした画像上の顔にエフェクトを入れられる「顔シークレット」を提供する。 顔シークレットではユーザーが画像をアップロードすると、同社の顔検出技術により画像上の顔が検出され、その顔それぞれに目伏せやぼかしといった6種類のエフェクトをかけることができる。ある程度斜め方向や下を向いている顔も検出可能だ。 加工後の画像は印刷することが可能だが、直接画像として保存するこ

                    富士フイルム、顔検索技術のラボサイト「顔ラボ」公開--今後はAPIの提供も
                  • Fawkes

                    Shawn Shan†, PhD Student Emily Wenger†, PhD Student Jiayun Zhang, Visiting Student Huiying Li, PhD Student Haitao Zheng, Professor Ben Y. Zhao, Professor † Project co-leaders and co-first authors Email the Fawkes team Email us to join Fawkes mailing list for news on updates/changes. NEWS 5-12-22: v1.01 release for Macbook M1! 5-1-22: Fawkes hits 840,000 downloads! 4-23-21: v1.0 release for Windows

                    • 音声認識をカスタマイズできるMicrosoftのCustom Speech Serviceの使い方 - Qiita

                      はじめに インターネットを探し回ったのですが、Microsoft Cognitive Serviceの1つであるCustom Speech Serviceの使い方をかみ砕いてブログなどで書いてくれているサイトが日本語では存在しませんでした。 結構よくできたサービスなのに、そんなに人気ないんだっけ? 最近本気でこのサービスを検証する機会があり、理解を深めることができたので、使い方を共有しようと思います。 Custom Speech Serviceの概要 MicrosoftのAIサービス的な位置づけのCognitive Serviceの中の一つであるCustom Speech Serviceは、音声の言葉をテキストに変えてくれるサービスです。別のCognitive Serviceである普通の音声認識サービス(Bing Speech API)は世の中一般的な用語しか取り込まれておらず、特定の商品

                        音声認識をカスタマイズできるMicrosoftのCustom Speech Serviceの使い方 - Qiita
                      • 8maki.jp

                        This domain may be for sale!

                        • Cognitive Science Society : Home

                          Welcome to the Cognitive Science Society website The Cognitive Science Society, Inc. brings together researchers from many fields who hold a common goal: understanding the nature of the human mind. The Society promotes scientific interchange among researchers in disciplines comprising the field of Cognitive Science, including Artificial Intelligence, Linguistics, Anthropology, Psychology, Neurosci

                          • 声でメール本文を作成するiPhoneアプリ

                            アドバンスト・メディアは、音声でメールが作成できるiPhone向けアプリ「音声認識メール Ver0.9」の配信を開始した。App Storeからダウンロードでき、当初はβ版として無料で提供される。2009年夏のiPhone OS 3.0のリリース以降は有料アプリとして提供される見込み。 今回配信が開始された「音声認識メール」は、音声でメール本文を作成できるアプリ。同アプリで提供されるのは文章作成機能で、作成した文章はアプリの「メールに転送」ボタンでiPhoneのメール機能に転送し、メールを送信する。同社の音声認識技術「AmiVoice」を搭載しており、日本語の自然な発話とスピードで文章を作成可能。ユーザーの音声の特徴を自動認識で学習するほか、キー入力で認識結果を修正することで、認識精度を向上させられる。人名や地名など固有名詞はユーザー辞書に登録でき、アドレス帳の人名も自動的に音声認識辞書に

                            • 顔やオブジェクトの分析に。画像分析API まとめ | NTT Communications Developer Portal

                              昨今は内部・外部ストレージ、クラウドストレージも格安サービスが増え利用が手軽になり、気軽に大容量データを扱えるようになりました。 サイト内でも画像を手軽にアップロードしたりするサービスは、必須条件といっても過言では無いくらい要求が高まっていますが、それに伴ってデータを整理、分類して、次のサービスアップに繋げることが肝心となっています。 そこで今回は、画像解析を行ってくれるAPIをまとめました。 ※ なお、API仕様や利用料金などは、2016-05-26現在のデータとなっています。 AlchemyVision (IBM Watson) IBM Watsonの画像解析APIです。年齢範囲、男女、テキストなどを取得できます。 複数の人数にも対応していて、かなりの精度で解析が可能です。 しかし、あまりフレーム内に顔が接近していると判別が難しい様子で、これからの精度アップが期待されるところでしょう。

                                顔やオブジェクトの分析に。画像分析API まとめ | NTT Communications Developer Portal
                              • http://www.face-code.com/

                                • Otter Voice Meeting Notes

                                  Otter.ai uses artificial intelligence to empower users with real-time transcription meeting notes that are shareable, searchable, accessible and secure.

                                    Otter Voice Meeting Notes
                                  • 自動監視・認識 防犯カメラに道 産総研がソフト開発 映像から異常行動を即時検出 :ニュース - CNET Japan

                                    産業技術総合研究所(産総研)は16日、市販のノートパソコンレベルの処理能力でも、カメラ映像から異常行動を即時に検出できるソフトウエアを開発したと発表した。防犯意識の高まりに伴い、ビルなどへの監視カメラの設置数が増えているものの、即時検出には人がモニターを確認するしか方法がなかった。今回のソフト開発により、自動監視・認識機能を持つ防犯カメラの普及が期待される。 産総研では、2005年に静止画像を認識する高次局所自己相関特徴抽出法(HLAC)を用いた適応学習型認識方式を、動画に対応させた立体HLAC(CHLAC)を開発した。同様の機能を持った他の方式に比べ、高い認識性能を備えていたが、今回はさらに約10倍速い認識速度を実現し、即時検出を可能にした。 新ソフトを搭載したシステムによる実験では、ロッカーを通常に開閉するシーンを学習させることで、ロッカーのこじ開けなど通常から外れる動作を的確に検

                                    • Expired

                                      Expired:掲載期限切れです この記事は,Associated Press との契約の掲載期限(30日間)を過ぎましたので本サーバから削除しました。 このページは20秒後にNews トップページに自動的に切り替わります。

                                      • ボイスドメインサービスのサイトではありません。

                                        ドメインサービスを開始しました。 このサービスはドメインをご希望のお客様にあらかじめリザーブ(予約)をしてドメインを提供するサービスです。ボイスドメインとは違います。

                                        • 日立が高速音声検索技術,2000時間の録音から3秒でキーワードを含む音声を検索

                                          日立製作所は2008年10月6日,大規模な録音データの中から任意のキーワードを含む音声を高い精度で高速に検索する技術を開発したと発表した(発表資料)。2000時間の録音の中から3秒でキーワードを含む音声を検索することが可能という。「音声付き映像コンテンツの検索」や,「コールセンターにおいて顧客の生の声を迅速に検索し商品やサービスの向上に役立てる」など様々な分野に応用できると期待する。技術の詳細は,2008年10月8日から10月10日までオーストラリアのケアンズで開催される国際学会「IEEE Signal Processing Society 2008 International Workshop on Multimedia Signal Processing」で発表する。 開発した技術は,「録音データを音素(音声の基本単位)記号処理を用いて高速に検索したうえで,音声特徴量(いわゆる音韻を特

                                            日立が高速音声検索技術,2000時間の録音から3秒でキーワードを含む音声を検索
                                          • ML Kit  |  Google for Developers

                                            Stay organized with collections Save and categorize content based on your preferences. ML Kit brings Google’s machine learning expertise to mobile developers in a powerful and easy-to-use package. Make your iOS and Android apps more engaging, personalized, and helpful with solutions that are optimized to run on device.

                                              ML Kit  |  Google for Developers
                                            • Download Speech SDK 5.1 from Official Microsoft Download Center

                                              Internet Explorer was retired on June 15, 2022IE 11 is no longer accessible. You can reload Internet Explorer sites with IE mode in Microsoft Edge.

                                              • これは笑える音声認識(動画) | WIRED VISION

                                                これは笑える音声認識(動画) 2007年7月12日 IT コメント: トラックバック (1) Charlie Sorrel これは、うまく作られたパロディーかもしれないし、あるいは本物かもしれない。いずれにせよ、これを見る前には、手に持ったカップをテーブルにおいた方がいい。さもないと、コーヒーを吹いてさんざんな目に遭うだろう。 このビデオは、『Windows Vista』のユーザーが、Vistaの新しい音声認識技術を使って『Perl』スクリプトを書こうとする様子を撮影したものだ。とにかく笑える。 Vistaの高度な音声認識技術[Fake Steve(たぶん、職場では見ない方がいい)] WIRED NEWS 原文(English)

                                                • Accelerated Shape Detection in Images

                                                  This specification was published by the Web Platform Incubator Community Group. It is not a W3C Standard nor is it on the W3C Standards Track. Please note that under the W3C Community Contributor License Agreement (CLA) there is a limited opt-out and other conditions apply. Learn more about W3C Community and Business Groups. 1. Introduction Photos and images constitute the largest chunk of the Web

                                                  • 駅名をiPhoneにつぶやくと乗換検索できる無料アプリ「コエタン!」

                                                    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

                                                      駅名をiPhoneにつぶやくと乗換検索できる無料アプリ「コエタン!」
                                                    • クラウド型音声認識を評価。精度が良いのはどれ? | Tech Blog | CRESCO Tech Blog

                                                      この記事は 『CRESCO Advent Calendar 2017』 1日目の記事です。 AIに対する過度な期待値を下げつつ、AIの精度向上に励んでいるウエサマこと井上 (祐)です。 本記事では、クラウド型音声認識サービスの認識精度について記述します。 音声認識の評価手法としてSWITCHBOARDデータセットを用いた、評価が代表的な手法となります。 このSWITCHBOARDデータセットは、電話にて交わされた2,400を超える英語による会話が含まれており、このデータセットに対する音声認識の誤り率5.5%が現在(2017/11月時点)の最高到達点となります。 逆に言うとほぼ95%は正解という事ですので、こう考えると人の聞き間違いの方が多いかもしれません。 (参考:”マイクロソフトの音声認識システム、「人と同等」レベルに到達“(ZDNet Japan 2017/8/24)) さて、このSW

                                                      • Google: we plan to open up our Goggles platform

                                                        Augmented reality is being hailed the next big thing on mobile devices, for everything from gaming to checking out house prices; point a smartphone running Yelp at a city street and the Monocle feature gives you reviews and ratings for the businesses there. Google Goggles can do much the same thing but Goggles product manager Shailesh Nalawadi isn't that interested in AR: "We don't really see ours

                                                          Google: we plan to open up our Goggles platform
                                                        • pictriev, face search engine

                                                          Find look-alike celebrities on the web using the face recognition. Results can vary on the resolution or quality of the photo. For the best result, please upload a photo of a frontal face, desirably with the gap between the eyes more than 80 pixels wide. Result is displayed for each face detected. Image files of format jpg(jpeg) with size less than 200K bytes is accepted only.

                                                          • Prof. Takio Kurita (Top Page)

                                                            [2020年4月1日] 広島大学に新設された先進理工系科学研究科を担当します. [2018年4月1日] 広島大学に新設された情報科学部を担当します. [2017年2月3日] 国際会議FCV2017でBest Poster Presentation Awardを受賞しました. [2015年2月13日] 産業技術総合研究所の由井誠さんをお招きして、広島大学統計科学研究拠点セミナーを開催します。 [2015/01/29] 国際会議FCV2015で Best Paper Award を受賞しました。 [2014年10月29日] 筑波大学の日野先生をお招きして、広島大学統計科学研究拠点セミナーを開催します。 [2014年10月10日] 広島画像情報学セミナーを開催します。 [2014年10月] 博士課程後期の学生1名が入学しました。また、総合科学部の3年生が1名栗田研究室に加わりました。 [2014

                                                            • ピートゥピーエー、雑音の中で音声を認識する新技術を開発--会話ロボットへの採用見込む

                                                              ピートゥピーエーは4月9日、雑音の多い環境でも高精度の音声認識を行える「韻律解析システム(PA:Prosody Analyzer)」技術を開発したと発表した。コミュニケーション用ロボットなど、雑音の中で人間と会話するシステムへの採用を見込む。 同社のPA技術では、音声の波形特性をもとに、入り混じる複数の音声から特定の1つを認識できる。また拾い上げる音量を制御し、怒鳴るような大きい声や、ささやくような小さい声を聞き分ける。物が落ちたりぶつかったりして生じる音や、口から発する舌打ちなどの音は排除する。 これに加えデータベースに収めた会話シナリオを参照し、音声を判定する仕組みを開発し、認識精度を高めたという。 ピートゥピーエーは今後、同技術を使い、オープンソースの音声認識ソフト「Julius」をもとにした自動応答システムなどの性能を向上させる。また汎用音声会話プラットフォームとして発表予定の「V

                                                                ピートゥピーエー、雑音の中で音声を認識する新技術を開発--会話ロボットへの採用見込む
                                                              • Badges

                                                                Ask questions, find answers and collaborate at work with Stack Overflow for Teams. Explore Teams Collectives™ on Stack Overflow Find centralized, trusted content and collaborate around the technologies you use most. Learn more about Collectives

                                                                  Badges
                                                                • "In their own words": political videos meet Google speech-to-text technology

                                                                  Hey—we've moved. Visit The Keyword for all the latest news and stories from Google

                                                                    "In their own words": political videos meet Google speech-to-text technology
                                                                  • Smart Search and Product Discovery | ViSenze

                                                                    AI Commerce Multi-Search and Discovery Leverage the power of multimodal AI to serve uniquely personalized search and instantly relevant product recommendations that drive conversions and revenue. REQUEST A DEMO Multi-Search One Search, Multiple Experiences Keyword-based search limits customers, leading to lost sales. Customers want a smarter search that ‘gets’ them. Introducing Multi-Search! Your

                                                                      Smart Search and Product Discovery | ViSenze
                                                                    • Google Code Archive - Long-term storage for Google Code Project Hosting.

                                                                      Code Archive Skip to content Google About Google Privacy Terms

                                                                      • http://beta.bignumbr.com/all

                                                                        • KAOTAS - お店でのワクワクと楽しさを、顔パスで。

                                                                          お店でのワクワクと楽しさを、顔パスで。KAOTAS。カオタス。KAOTASはあなたとお店の新しい関係をつくります。 来店状況に応じた特典や、あなたにあったおすすめ、 それに嬉しくなる「!!」もあるかも。

                                                                            KAOTAS - お店でのワクワクと楽しさを、顔パスで。
                                                                          • Core Image Kernel パッチで自前のエフェクトを作る

                                                                            Quartz Composer には、様々な画像に対するエフェクトがありますが「こんなエフェクトあったらいいのに」なんてことがあるかもしれません。そんな夢を叶えてくれるのが Core Image Kernel パッチです。これを使えば、自前のパッチを作ることが可能です。 Core Image Kernel パッチを配置して Inspector で Settings を見ると、なにやらプログラムらしきものが書かれています。これは、OpenGL Shading Language と呼ばれる言語です。C 言語に似た文法を持っていますので、C 言語の経験のある方なら若干の知識だけでプログラミング可能です。OpenGL のオフィシャルページに PDF があります。ただし、Core Image Kernel パッチでは、OpenGL Shading Language の全ての機能が使えるわけではありま

                                                                            • デジタルゲームにおけるユーザー情報環境の構築と人工知能、そして学術研究、社会への還元へ

                                                                              三宅陽一郎MiyakeYouichiro @miyayou 現実の認識は見ているものから意味あるものを選択する無意識が働いているが、ゲーム画面では、逆に見えているものに全て意味を見出そうとする心理が働く。あれ程くっきりと事物が見える空間で物の密度を上げれば、初心者ほど疲れやすくなる。ゲーマーであるほど何を見て何を見ないかを選択して疲れない 2010-08-03 00:49:32 三宅陽一郎MiyakeYouichiro @miyayou ゲームは、その解像度と事物の密度が上げて来たが、ゲーム的に意味のある密度を比例して上げて来た訳ではない。逆にゲームプレイとは関係しない部分のメッセージの比重を上げて来た。ゲーマーならそれを無視していいか瞬時で判断できるが、初心者はあらゆるものに意味を見出そうとしてくたくたになる。 2010-08-03 00:52:01

                                                                                デジタルゲームにおけるユーザー情報環境の構築と人工知能、そして学術研究、社会への還元へ
                                                                              • SpeechRecognition - Web APIs | MDN

                                                                                SpeechRecognition also inherits properties from its parent interface, EventTarget. SpeechRecognition.grammars Returns and sets a collection of SpeechGrammar objects that represent the grammars that will be understood by the current SpeechRecognition. SpeechRecognition.lang Returns and sets the language of the current SpeechRecognition. If not specified, this defaults to the HTML lang attribute val

                                                                                  SpeechRecognition - Web APIs | MDN
                                                                                • INTEL コード & ダウンロード

                                                                                  Using Intel.com Search You can easily search the entire Intel.com site in several ways. Brand Name: Core i9 Document Number: 123456 Code Name: Emerald Rapids Special Operators: “Ice Lake”, Ice AND Lake, Ice OR Lake, Ice* Quick Links You can also try the quick links below to see results for most popular searches. Product Information Support Drivers & Software

                                                                                    INTEL コード & ダウンロード