並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 193 件 / 193件

新着順 人気順

recognitionの検索結果161 - 193 件 / 193件

  • Character Recognition System Using Deep Learning | SOFNEC

    Character Recognition System Using Deep Learning JAPANESE About Our Character Recognition System Singlecharacters and character strings that include letters, numbers, symbols,punctuation and logo marks with back ground images are binarized and recognizedby using deep learning. Thesystem uses NLP to extract the meaning from characterstrings. The system can be integrated with AI chatbots. Processing

    • 【APIレビュー】DeepAI Facial Expression Recognition | APIblog

        【APIレビュー】DeepAI Facial Expression Recognition | APIblog
      • Recognition March / John Philip Sousa (1880)

        こんにちは!あぽ(@apocryphally1)です。POPSの歴史をたどっていくMuseum of POP Musicのコーナーへようこそ!録音技術が確立した19世紀末ころからの音楽をコレクションしています。100年ほど前の大衆音楽からJazzやBluesが発展していくポピュラー音楽の黎明期を発掘してきますよ。 *掲載している曲の一部には差別を助長するようなタイトルの曲があります。歴史を辿る面では避けては通れないデリケートな問題ですが、当時のものをそのまま記載しています。当然ながら本ブログには差別を助長するような意図は全くないという点、ご理解いただければ幸いです。 Recognition March / John Philip Sousa Recognition Marchは1873年に作った「Salutation」を改訂した曲です。Salutationの記事にもあるように、当時新しく着

          Recognition March / John Philip Sousa (1880)
        • Construction and Evaluation of a New Speech Corpus of Japanese Super-elderly Speech Recognition |情報処理学会・学会誌「情報処理」

          Construction and Evaluation of a New Speech Corpus of Japanese Super-elderly Speech Recognition 2022年度研究会推薦博士論文速報 [音声言語情報処理研究会] 福田 芽衣子 (徳島大学 研究員) 邦訳:日本人超高齢者音声認識のための音声コーパス構築 ■キーワード 超高齢者音声コーパス(EARS)/音声認識/加齢による音響特徴量の変化 【背景】加齢による音響特徴量の変化により音声認識率が低下する 【問題】超高齢者のための音声認識モデル学習用データがない 【貢献】超高齢者音声コーパス(EARS)を収集・分析し,改善を確認した スマホやPCなどの普及によって,音声認識などの音声情報処理技術が広く普及してきている.特に近年では,深層学習(ディープラーニング)の登場によって,音声情報処理の精度が飛躍的に向

            Construction and Evaluation of a New Speech Corpus of Japanese Super-elderly Speech Recognition |情報処理学会・学会誌「情報処理」
          • movie chapter recognition oss github - Google 検索

            Recognizing actors in a movie clip or image, using OpenCV, DeepLearning and Python. - divya21raj/Actor-Recognition-In-Movies.

            • Catherine Churchman 🇺🇦 on Twitter: "Andy Bore'em finally receives badge of recognition from Twitter for his endless parrotting of CCP propaganda. Just… https://t.co/lEAuJ5UZnA"

              Andy Bore'em finally receives badge of recognition from Twitter for his endless parrotting of CCP propaganda. Just… https://t.co/lEAuJ5UZnA

                Catherine Churchman 🇺🇦 on Twitter: "Andy Bore'em finally receives badge of recognition from Twitter for his endless parrotting of CCP propaganda. Just… https://t.co/lEAuJ5UZnA"
              • .NET 標準で音声認識を試す(System.Speech.Recognition) - Qiita

                はじめに こんにちは、のんびりエンジニアのたっつーです。 ブログを運営しているのでよろしければ見てください。 対象物呼び出しと、それに対しての指示を同時に認識するようなサンプルを書いてみました。 非常に簡単に実装できるのでぜひ試してみてください。 実行結果 PCにマイクを接続する 「田中さん」「佐藤さん」「佐々木さん」と声をかけると、「☆呼ばれました」が表示されます 「佐藤さん静かにして」と声をかけると「☆静かにしよう!」が表示されます 使い方 プロジェクトの参照設定で、アセンブリ から System.Speech を追加してください。 Program.cs VoiceCommand をインスタンス化して Open() メソッドを呼び出します。 using System; using System.Collections.Generic; using System.Linq; using

                  .NET 標準で音声認識を試す(System.Speech.Recognition) - Qiita
                • OpenCVとdlibを使って顔認識(face recognition)してみる【後編】|Tech Press | テックプレス

                  OpenCVとdlibを使って顔認識(face recognition)してみる【前編】 いきなりの実装に入る前に、簡単に理論のおさらいと基本的な実装方法をおさえておきます。 その後に、ウェブカメラを使って顔を検出し、... 今回、ウェブカメラを使ってリアルタイムに判定するのと、入出管理するために名前と時間をcsvに書き出すようなコードを書いてみます。 2段階のフェーズに分けて実装していきます。 1つ目がウェブカメラを使ってリアルタイム判定 2つ目がcsvへの書き出し リアルタイム判定の実装 前回のコードも利用していくので、適宜コピペして対応していってください。 まず、手動で画像ファイルを読み込んでいたのを自動化します。printで画像のファイル名一覧が表示されているか確認します。 import cv2 import numpy as np import face_recognition

                    OpenCVとdlibを使って顔認識(face recognition)してみる【後編】|Tech Press | テックプレス
                  • 論文まとめ:Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition - Qiita

                    論文まとめ:Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action RecognitionMachineLearningDeepLearningGraphConvolutionalNetworksPoseEstimationActionClassifier はじめに AAAI2018より以下の論文 [1] S. Yan, et. al."Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition" のまとめ 公式らしきコード: https://github.com/yysijie/st-gcn arXiv: https://arxiv.org/abs/1801.07455 既にyukihiro d

                      論文まとめ:Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition - Qiita
                    • Web Speech API Speech Recognition で数値の認識を統一する - Qiita

                      概要 https://qiita.com/hmmrjn/items/4b77a86030ed0071f548 こちらの記事などを参考に音声認識アプリケーションを作っていました。 「10キロ」「20キロ」など数値を入力する際に、数字と漢数字が混ざって扱いづらいのでどうにかしたい。 再現手順 以下のデモサイトにアクセス https://www.google.com/intl/ja/chrome/demos/speech.html 日本語を選択して、「10キロ、20キロ、30キロ、…」としゃべっていく。 テキスト化された内容を確認すると数字と漢数字が混じっている 60 と 70 が割と怪しい 六十キロ 七十キロ まとめてしゃべると補正するようだが単体だとダメ 解決方法 SpeechGrammar を設定してあげる https://developer.mozilla.org/ja/docs/Web

                        Web Speech API Speech Recognition で数値の認識を統一する - Qiita
                      • Ragıp Soylu on Twitter: "BREAKING — EU will sanction Russia over its recognition of independence of Ukrainian regions: Von der Leyen"

                        BREAKING — EU will sanction Russia over its recognition of independence of Ukrainian regions: Von der Leyen

                          Ragıp Soylu on Twitter: "BREAKING — EU will sanction Russia over its recognition of independence of Ukrainian regions: Von der Leyen"
                        • iOS 14で追加された音声認識機能(Sound Recognition)がちょっと怖いらしい 「絶対オンにしないな」「不気味すぎるよ」 - 記事詳細|Infoseekニュース

                          iOS 14で追加された音声認識機能(Sound Recognition)がちょっと怖いらしい 「絶対オンにしないな」「不気味すぎるよ」 ガジェット通信 / 2020年6月28日 15時0分 障がいのある人をサポートする機能としてiPhoneに搭載されているのがアクセシビリティ(Accessibility)と呼ばれる機能です。 https://twitter.com/viticci/status/1275412834655109121 6月22日に発表されたiOS 14には、耳に障がいのある人をサポートするための音声認識機能(Sound Recognition)が追加されています。赤ちゃんの泣き声、火災報知器が鳴る音、水が流れる音などを認識すると通知してくれるという機能です。 https://twitter.com/MKBHD/status/1276182624923521026 耳に障が

                            iOS 14で追加された音声認識機能(Sound Recognition)がちょっと怖いらしい 「絶対オンにしないな」「不気味すぎるよ」 - 記事詳細|Infoseekニュース
                          • 【論文5分まとめ】AdaFace: Quality Adaptive Margin for Face Recognition

                            この記事は、論文の内容を5分くらいで読めるようにまとめた記事です。そのため、前提となる知識や関連研究に関する説明は大幅に省略しています。 基本的には筆者の備忘録ですが、面白そうと思ったら是非ご自身でも読んでみてください。 概要 顔認識の4つのデータセットでSoTAを更新したAdaFaceは、訓練サンプルの品質を反映できる適応的なマージン損失関数を提案している。 顔認識は、監視カメラなどの映像に映った顔が誰であるかを特定するタスクである。監視カメラなどの低解像度の画像などが訓練サンプルに含まれており、そのようなサンプルは訓練中にハードサンプルとなる。一方で、サングラスやマスクを使用している顔画像、あるいは特殊なアングルから撮影された顔画像もハードサンプルとなりうる。しかし、高解像度のハードサンプルと、低解像度のハードサンプルは、その難しさの質が異なっている。 下図に示すように、低品質(低解像

                              【論文5分まとめ】AdaFace: Quality Adaptive Margin for Face Recognition
                            • Northern Lights Development Board - AI Demonstration Kit for Object Recognition-Based Motor Control

                              The Future Electronics Northern Lights demonstration platform combines machine learning with vision and digital signal controller technologies to provide an ...

                                Northern Lights Development Board - AI Demonstration Kit for Object Recognition-Based Motor Control
                              • Speech Recognition API と Yandex Translation API を使って 音声自動翻訳アプリを作成 - Qiita

                                Speech Recognition API と Yandex Translation API を使って 音声自動翻訳アプリを作成JavaScriptHTML5translationSpeechRecognition はじめに たまたま音声認識APIがあることを知って簡単に動かせた → 翻訳にかけれたら便利だなと思ったので簡単に使える翻訳APIを調べて組み合わせてみた。 使用するAPIについて SpeechRecognition HTML5に備わってるAPI (Mozilla作) 音ブラウザで音声を認識してくれる 参考:Speech Recognition API でブラウザ音声認識を試す YandexTranslation Yandexがロシア版Googleみたいなもので、そのYandexが出してる翻訳API APIの使用には無料登録が必要 使い方が簡単そうだったの試しに使ってみた 参考

                                  Speech Recognition API と Yandex Translation API を使って 音声自動翻訳アプリを作成 - Qiita
                                • Tsinghua Professor Lao Dongyan: The hidden worries of facial recognition technology

                                  Tsinghua Professor Lao Dongyan: The hidden worries of facial recognition technology

                                    Tsinghua Professor Lao Dongyan: The hidden worries of facial recognition technology
                                  • Automotive Sound Recognition (SWS)

                                    Cameras, Light Detection and Ranging (LiDAR), and radar can’t see around corners. And, they cannot see emergency vehicles that are far away but fast approaching. The best line-of-sight sensors in the world are limited by the fact that they can’t see threats that are hidden from view. With the addition of obstructed view scenarios into the safety standards of Euro NCAP and other international testi

                                      Automotive Sound Recognition (SWS)
                                    • DX認定制度(DX Recognition Program)

                                      出典:日経クロステック、2021年2月24日 (記事は執筆時の情報に基づいており、現在では異なる場合があります) デジタル技術を活用したビジネス変革に向けた準備を整えた事業者を、経済産業省が「DX(デジタルトランスフォーメーション)認定事業者」として認定し公表する制度。2020年5月に始めた。DXに必要な取り組みを認定基準として示すことで、事業者がDXに踏み出す契機とする狙い。認定を得ることで、事業者はDXに取り組む姿勢をアピールできる。 情報処理推進機構(IPA)が事業者の申請を受け付けて審査する。企業のほか個人事業者や公益法人など全ての事業者が申請できる。審査期間は約3カ月。認定の有効期間は2年間で、更新の際は再申請が必要だ。 審査の観点は4点あり、具体的には「ビジョン・ビジネスモデル」「戦略」「成果と重要な成果指標」「ガバナンスシステム」だ。各観点の認定基準として、デジタル技術の普及

                                        DX認定制度(DX Recognition Program)
                                      • 【AI Shift Advent Calendar 2022】音声認識に関する論文紹介 “Robust Speech Recognition via Large-ScaleWeak Supervision” | 株式会社AI Shift

                                        TOPTECH BLOG【AI Shift Advent Calendar 2022】音声認識に関する論文紹介 “Robust Speech Recognition via Large-ScaleWeak Supervision” 【AI Shift Advent Calendar 2022】音声認識に関する論文紹介 “Robust Speech Recognition via Large-ScaleWeak Supervision” こんにちは!AIチームの東です。 本記事はAI Shift Advent Calendar 2022の8日目の記事です。 本記事では、OpenAIが公開した汎用的な音声認識モデルWhisper[1]の概要と、その内部動作について紹介していきます。 Whisperとは 背景 音声認識に深層学習が取り入れられて以降、その認識精度は飛躍的に向上しました。最近ではW

                                          【AI Shift Advent Calendar 2022】音声認識に関する論文紹介 “Robust Speech Recognition via Large-ScaleWeak Supervision” | 株式会社AI Shift
                                        • そのおっさん、米国公認管理会計士(USCMA)のテキストで収益の認識 Revenue Recognition を学習する①

                                          IFRSと米国会計基準の歩み寄りの現況確認 米国会計基準には、従来、収益の認識について、概念基準としての「財務会計概念基準書」(SFAC: Statement of Financial Accounting Concepts)の No.5 や No.6 という基礎概念しか存在していませんでした。 どちらかというと欧州主導によるIFRSの勢力拡大に伴い、これを米国会計基準とできるだけ差異が出ないように同じような会計処理を行おうとする、いわゆる「コンバージェンス」(convergence:収斂、収束)を目的とした、FASB(Financial Accounting Standards Board:米国財務会計基準審議会)とIASB(The International Accounting Standards Board:国際会計基準審議会)の共同プロジェクトから、新しい収益の認識基準が公表され

                                            そのおっさん、米国公認管理会計士(USCMA)のテキストで収益の認識 Revenue Recognition を学習する①
                                          • Kaggle Kuzushiji Recognition Competition発表の感想

                                            2019年12月11日のKaggle Days TokyoでのKuzushiji Recognitionコンペの発表に関する感想です。

                                              Kaggle Kuzushiji Recognition Competition発表の感想
                                            • 機械学習初心者がface_recognitionライブラリを使ってつまずいたところ - Qiita

                                              顔画像認識アプリを作成するにあたって、つまずいたところをメモとして書き留めます。 スクレイピングで集めてきた画像から顔だけ切り取りをしたいけど、OpenCVだと正常に切り取れない!(耳だけ切り取られた画像が出力されたなど)ということがあったので、face_recognitionライブラリを使って顔だけ切り取りを行いました。 その際にエラーが発生し原因が分からず、悩んでしまったのでメモします。 (著作権に引っ掛かってしまいそうなので、画像の添付は省略させていただきます) 使用環境 * google colaboratory * face-recognition-1.3.0 顔の特徴量が見つけられない場合、発生するエラー 例えば横向きの画像を以下のコードで切り取りを行おうとすると #face_recognitionはpip install する必要あり #!pip install face_r

                                                機械学習初心者がface_recognitionライブラリを使ってつまずいたところ - Qiita
                                              • 論文 -Neural Architectures for Named Entity Recognition- - fukuの犬小屋

                                                用語解説 Named Entity Recognition (NER): 固有表現抽出 人名・地名などの固有名詞や日付・容量などの数値表現を抽出するNLPタスク。 これまで精度の高いNERを実現するには大量のラベル付きデータが必要とされてきました。 しかし、言語や分野ごとにコーパスを作成するのはコストがかかります。 特に専門分野のコーパスの作成には専門知識が求められるため、よりコストが高くつくことが問題でした。 詳しい説明は以下の記事を参考にしてください。 PyTorch DL for NLP -Bi-LSTM CRF- Long Short-Term Memory (LSTM) RNNの一種です。 RNNの課題だった長い系列データの利用が可能になりました。 詳しい経緯は以下の解説記事を参考にしてください。 PyTorch DL for NLP -LSTM- 論文概要 これまでのNERの手

                                                • そのおっさん、米国公認管理会計士(USCMA)のテキストで収益の認識 Revenue Recognition を学習する②

                                                  収益認識のための5ステップ (再掲) 収益の認識のためには、必ず次の5ステップを踏む必要があります。厳密には、収益計上のため、計上タイミングを決める「認識」と、計上金額を決める「測定」行為が必要なのでした。 Identify the contract with the customer(顧客との契約の識別) Identify the separate performance obligations in the contract(契約における履行義務の識別) Determine the transaction price(取引価格の算定) Allocate the transaction price to the separate performance obligations(履行義務への取引価格の配分) Recognize revenue when or as the entity s

                                                    そのおっさん、米国公認管理会計士(USCMA)のテキストで収益の認識 Revenue Recognition を学習する②
                                                  • User Activity Recognition | 機能統合 | Unity Asset Store

                                                    このアセットはアセットストアでの取り扱いが終了しました。アセットを新規に購入あるいは無償取得することはできません。取り扱い終了前にアセットをダウンロード済みのユーザーは、ローカルに保存されている場合に限りインポートすることができます。 多くの場合、パブリッシャーがアセットのサポートをすることができなくなった、あるいはサポートをする意志がなくなった場合にアセットの取り扱いが終了します。他のアセットを探すか、このアセットのパブリッシャーに直接連絡をすることをお勧めします。

                                                      User Activity Recognition | 機能統合 | Unity Asset Store
                                                    • face_recognition による顔のクラスタリングを行う Python プログラム(Dlib,ageitgey/face_recognition,Python を使用)(Windows 上)

                                                      【サイト内の関連ページ】 説明資料: Dlib の機能概要 [PDF], [パワーポイント] 顔情報処理の Python プログラム(Dlib,face_recognition を使用) について: 別ページ »にまとめ Windows で動く人工知能関係 Pythonアプリケーション,オープンソースソフトウエア): 別ページ »にまとめている. 【用語説明】 Dlib Dlibは,数多くの機能を持つ C++ ライブラリ.機能には,機械学習,数値計算,グラフィカルモデル推論,画像処理,スレッド,通信,GUI,データ圧縮・一貫性,テスト,さまざまなユーティリティなどがある.Python API もある. 【関連する外部ページ】 ageitgey/face_recognition のページ: https://github.com/ageitgey/face_recognition 前準備 Gi

                                                      • Speech Recognition : Speech To Text Part1 - Common Voice dataset - Qiita

                                                        目標 深層学習による音声認識についてまとめました。 Part1 では、音声認識のための準備を行います。 以下の順で紹介します。 Common Voice データセットのダウンロード Sentence Piece モデルの作成 音声データの前処理 CNTK が提供するビルトインリーダーが読み込むファイルの作成 導入 Common Voice データセットのダウンロード Common Voice [1] データセットは、ウェブブラウザ Firefox で有名な Mozilla が支援している音声認識ソフトウェアのためのデータセットです。 Common Voice 上記のページにアクセスして、今回使用する日本語の音声データとテキストデータをダウンロードします。ダウンロードする際、メールアドレスの入力が要求されます。 今回のディレクトリ構成は以下のようにしました。 CTCR MGCC STTT |

                                                          Speech Recognition : Speech To Text Part1 - Common Voice dataset - Qiita
                                                        • python venvの仮想環境で構築する顔認証(face_recognition)windows環境 - Qiita

                                                          ■ 概要 ・Windows11。 ・pythonの仮想環境venvで構築。 ・モジュールは、opencv-python、face_recognition、configを使用。 ・外部カメラ使用(USB WEBカメラ) ・物体検知で、ディレクトリ(image_jp)内にある画像と一致したら、パスワードを入力する。 ■ 完成画面 ■ ディレクトリ構成 ./app/以下 ■仮想環境の作成と、モジュールのインストール ・仮想環境 作成 $ python -m venv venv ・仮想環境を起動して、入る。 $ /venv/SCripts\activate.bat ・モジュールのインストール $ pip install opencv-python $ pip install face_recognition $ pip install config ■ ソースコード ・main_001.py im

                                                            python venvの仮想環境で構築する顔認証(face_recognition)windows環境 - Qiita
                                                          • Strange News - AI, Facial Recognition & Sheeple

                                                            #HazelFiverCheck out my Strange videos Playlisthttps://youtube.com/playlist?list=PLEfUXab0bkehtxpimf8-V6TErreaahx5d---I made this video with the free video c...

                                                              Strange News - AI, Facial Recognition & Sheeple
                                                            • OpenVINOで推論してみた2 age-gender-recognition - Qiita

                                                              年齢の誤差が6.99年で性別判定の精度は95.8%とさすがの高性能ですね!! Inputs Image, name: input, shape: 1, 3, 62, 62 in 1, C, H, W format, where: C - number of channels H - image height W - image width Expected color order is BGR. 今回の入力は人の顔画像になります。書いてあることは前回とさほど変わらないので省略します。 ただ、OpenVINOのモデルは入力の名称がgithubに書いてあるものと違うことが多々あるので実装の時に確認しようと思います。 Outputs Name: age_conv3, shape: 1, 1, 1, 1 - Estimated age divided by 100. Name: prob, sha

                                                                OpenVINOで推論してみた2 age-gender-recognition - Qiita
                                                              • Text Image Enhancement in Scenery Images for Degraded Character Recognition using DCT

                                                                本論文では,ディジタルカメラで撮影した画像中に存在する文字情報の抽出,認識,翻訳等の処理を行うシステムの構築を目指して,画像の高品質化によって認識性能を向上する手法を提案する.提案手法では,ディジタルカメラで撮影した文字列を含む画像に対し,JPEG圧縮によるノイズの削減とDCTの高周波成分復元による拡大,2値化処理を行い,市販の文字認識ソフトウエアを用いて文字認識を行った.画像の拡大では,拡大に伴うモスキートノイズやブロックノイズの影響が少ない拡大手法を提案する.文書画像をディジタルカメラで撮影した画像と看板やプレートに書かれた文字を撮影した画像に対して実験を行った.本報告では,画像の高品質化処理を目的としているため,文字の切り出しは手作業で行っている.これらの対象画像に対し,拡大処理を施さずに2値化処理を行った文字画像や共1次内挿法で拡大した画像と比べ,従来の文字認識技術を用いて文字認識

                                                                • Association for Computing Machinery on Twitter: "Face masks cover up a significant portion of what facial recognition needs to identify and detect people -- essenti… https://t.co/EdeTO5yuw2"

                                                                  Face masks cover up a significant portion of what facial recognition needs to identify and detect people -- essenti… https://t.co/EdeTO5yuw2

                                                                    Association for Computing Machinery on Twitter: "Face masks cover up a significant portion of what facial recognition needs to identify and detect people -- essenti… https://t.co/EdeTO5yuw2"
                                                                  • Python – 顔認識ライブラリ Face Recognition で顔認証を行う方法 | pystyle

                                                                    概要 dlib を使った Python の顔認識ライブラリ Face Recognition を使って、顔認証を行う方法について紹介します。 顔認証は、予め保存されている個人の顔のデータと認証中の顔の画像とを照合し、その人物が誰であるかを識別する技術です。 スマートフォンのロック解除や入退室管理など、セキュリティが求められる分野で広く使われています。 環境 コード全体は pystyle/perform-face-recognition-with-python にあります。 このコードは、以下の環境で実行しました。 Ubuntu 18.04 ライブラリ Face Recognition: 1.2.3 GPU の実行環境 GPU: GeForce GTX 1080 CUDA: 9.0 CuDNN: 7 CPU の実行環境 CPU: Intel(R) Core(TM) i7-6700K CPU

                                                                      Python – 顔認識ライブラリ Face Recognition で顔認証を行う方法 | pystyle