並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 204件

新着順 人気順

recognitionの検索結果161 - 200 件 / 204件

  • Speech-to-Text: Automatic Speech Recognition  |  Google Cloud

    Discover why leading businesses choose Google Cloud Whether your business is early in its journey or well on its way to digital transformation, Google Cloud can help you solve your toughest challenges.

      Speech-to-Text: Automatic Speech Recognition  |  Google Cloud
    • Pythonで人物画像から顔だけ切り出して保存したい ~face_recognitionで顔検出してトリミング~ - Qiita

      import os from pathlib import Path import subprocess import sys import cv2 import face_recognition from IPython.display import display from IPython.display import Image cwd = Path().resolve() def exec_cmd(cmd): """ コマンド実行 """ # cmd文字列の前後にスペースが入っていたら削除 -> スペースで分割しlist化 cmd_split = cmd.strip().split() # stdoutの設定で標準出力を取得 cp = subprocess.run(cmd_split, stdout=subprocess.PIPE) # cp = subprocess.check_

        Pythonで人物画像から顔だけ切り出して保存したい ~face_recognitionで顔検出してトリミング~ - Qiita
      • Emotion Recognitionをやってみる - Qiita

        AzureのFaceAPIを使い感情センシングをしてみる Azureのライセンス登録を実施してFaceAPIの使用登録をする ライセンスグループの設定 FaceAPIの登録から Endpointとkeyを取得する EndpointはRegionのよって変わるの keyは個別で取得 で、python環境で実施するときには、下記のSDKをインストール https://github.com/Microsoft/Cognitive-Face-Python インストール方法はページを参考に サンプルプログラムを実行する でサンプルプログラムを実行すると #%% import cognitive_face as CF KEY = 'xxxxxxxxxxxxxxxxxxxxxxx' # Replace with a valid Subscription Key here. CF.Key.set(KEY)

          Emotion Recognitionをやってみる - Qiita
        • そのおっさん、米国公認管理会計士(USCMA)のテキストで収益の認識 Revenue Recognition を学習する③

          収益認識のための5ステップ (再掲) 収益の認識のためには、必ず次の5ステップを踏む必要があります。厳密には、収益計上のためには、計上タイミングを決める「認識」と、計上金額を決める「測定」行為が必要なのでした。 Identify the contract with the customer(顧客との契約の識別) Identify the separate performance obligations in the contract(契約における履行義務の識別) Determine the transaction price(取引価格の算定) Allocate the transaction price to the separate performance obligations(履行義務への取引価格の配分) Recognize revenue when or as the entity

            そのおっさん、米国公認管理会計士(USCMA)のテキストで収益の認識 Revenue Recognition を学習する③
          • 英語「recognition 」の意味・使い方・読み方 | Weblio英和辞書

            音節rec・og・ni・tion 発音記号・読み方/rèkəgníʃən(米国英語), ˌrekʌˈgnɪʃʌn(英国英語)/

            • Whisper-based Real-time Speech Recognition:コードプラグイン - UE マーケットプレイス

              説明レビュー質問Demo video: Link Documentation: Link Free Demo project (exe): Link This plugin allows you to recognize speech in 99 languages, just by adding one component to your blueprint, without relying on any separate servers or subscriptions. The machine learning model used in this plugin is based on OpenAI's Whisper, but has been optimized to run on the ONNX Runtime for best performance and to mini

                Whisper-based Real-time Speech Recognition:コードプラグイン - UE マーケットプレイス
              • CNN10 - A Controversial Facial Recognition Database | February 11, 2020 英英辞典(Collins Cobuild Advanced Dictionary) - 英語のブログ

                CNN10 - A Controversial Facial Recognition Database | February 11, 2020 英英辞典(Collins Cobuild Advanced Dictionary) 今日、英英辞典(Collins Cobuild Advanced Dictionary Collins Cobuild (編集))で引いた単語数、50語。 tightanalyticalphilosopherpacketFritzWolfemarinemicro-organismnation-stateproceedingmerrilyberryhawthornplebsummed updraintribunalwell-integratedapplaudadageAchilles heellast-minutspedmanipulateprosecutionroc

                • 【Python】speech recognitionメモ - Qiita

                  import speech_recognition as sr r = sr.Recognizer() with sr.AudioFile('test.wav') as source: audio = r.record(source) text = r.recognize_google(audio, language='ja-JP') print(text) WAV ファイルを用意する必要あり Windows 標準のサウンドレコーダを使用する場合、拡張子の変更が必要 設定は簡単 わりとちゃんと使える

                    【Python】speech recognitionメモ - Qiita
                  • Multiview Transformer for Video Recognitionを読んだまとめ

                    はじめに こんにちは。ZENKIGENのデータサイエンスチームに所属しております、脇山拓也と申します。 弊社は自己PR動画を解析するAI「harutaka EF」や、企業と候補者の面接を解析し、面接品質の向上をサポートするAI「harutaka IA」などのサービスを提供しており、動画データの利活用を目指しております。 その中で、DSチームでは採用/職場領域の、画像(動画)・音声・テキストデータを使い、モデル開発やデータ分析といった業務をしております。 今回は画像領域(コンピュータビジョン領域)で話題となっているVisionTransformerの派生系モデル(以下MTV)を提案している論文について紹介します。 このモデルは、viewと呼ばれる動画特徴量(video representation)を異なるサイズで並列処理することで、短時間での細かな動きや長時間かけて変化する動きを捉えやすく

                      Multiview Transformer for Video Recognitionを読んだまとめ
                    • face_recognition用顔画像のエンコーディングデータを事前に作っておく – FRONT

                      face_recognitionで顔認識するアプリでは起動時にいちいち顔画像をエンコーディングしますが、これが結構時間がかかります。 事前にエンコーディングデータを作っておいて、ハードコードしておくなりすれば、ぞの分起動が速くなります。 例えば、37人の顔画像を登録した場合、ラズパイ3 Model B+でエンコードしながらの起動には5分20秒かかりましたが、ハードコードした起動は18秒でした(ラズパイ4ならもっと速くなるはず)。 データ作成用Webサービスアプリを作ってみました。 こんな感じ。 JSON形式で結果を表示します。 保存するなりクリップボードにコピーするなりして使います。 こんなデータです、サンプル nameとdataを使ってこんなデータを作ります。 これがヤットさんのお顔(128次元のリストデータ) yatto_face_encoding=[ -0.1223393902182

                      • Character Recognition System Using Deep Learning | SOFNEC

                        Character Recognition System Using Deep Learning JAPANESE About Our Character Recognition System Singlecharacters and character strings that include letters, numbers, symbols,punctuation and logo marks with back ground images are binarized and recognizedby using deep learning. Thesystem uses NLP to extract the meaning from characterstrings. The system can be integrated with AI chatbots. Processing

                        • 【APIレビュー】DeepAI Facial Expression Recognition | APIblog

                            【APIレビュー】DeepAI Facial Expression Recognition | APIblog
                          • Recognition March / John Philip Sousa (1880)

                            こんにちは!あぽ(@apocryphally1)です。POPSの歴史をたどっていくMuseum of POP Musicのコーナーへようこそ!録音技術が確立した19世紀末ころからの音楽をコレクションしています。100年ほど前の大衆音楽からJazzやBluesが発展していくポピュラー音楽の黎明期を発掘してきますよ。 *掲載している曲の一部には差別を助長するようなタイトルの曲があります。歴史を辿る面では避けては通れないデリケートな問題ですが、当時のものをそのまま記載しています。当然ながら本ブログには差別を助長するような意図は全くないという点、ご理解いただければ幸いです。 Recognition March / John Philip Sousa Recognition Marchは1873年に作った「Salutation」を改訂した曲です。Salutationの記事にもあるように、当時新しく着

                              Recognition March / John Philip Sousa (1880)
                            • Construction and Evaluation of a New Speech Corpus of Japanese Super-elderly Speech Recognition |情報処理学会・学会誌「情報処理」

                              Construction and Evaluation of a New Speech Corpus of Japanese Super-elderly Speech Recognition 2022年度研究会推薦博士論文速報 [音声言語情報処理研究会] 福田 芽衣子 (徳島大学 研究員) 邦訳:日本人超高齢者音声認識のための音声コーパス構築 ■キーワード 超高齢者音声コーパス(EARS)/音声認識/加齢による音響特徴量の変化 【背景】加齢による音響特徴量の変化により音声認識率が低下する 【問題】超高齢者のための音声認識モデル学習用データがない 【貢献】超高齢者音声コーパス(EARS)を収集・分析し,改善を確認した スマホやPCなどの普及によって,音声認識などの音声情報処理技術が広く普及してきている.特に近年では,深層学習(ディープラーニング)の登場によって,音声情報処理の精度が飛躍的に向

                                Construction and Evaluation of a New Speech Corpus of Japanese Super-elderly Speech Recognition |情報処理学会・学会誌「情報処理」
                              • movie chapter recognition oss github - Google 検索

                                Recognizing actors in a movie clip or image, using OpenCV, DeepLearning and Python. - divya21raj/Actor-Recognition-In-Movies.

                                • Catherine Churchman 🇺🇦 on Twitter: "Andy Bore'em finally receives badge of recognition from Twitter for his endless parrotting of CCP propaganda. Just… https://t.co/lEAuJ5UZnA"

                                  Andy Bore'em finally receives badge of recognition from Twitter for his endless parrotting of CCP propaganda. Just… https://t.co/lEAuJ5UZnA

                                    Catherine Churchman 🇺🇦 on Twitter: "Andy Bore'em finally receives badge of recognition from Twitter for his endless parrotting of CCP propaganda. Just… https://t.co/lEAuJ5UZnA"
                                  • .NET 標準で音声認識を試す(System.Speech.Recognition) - Qiita

                                    はじめに こんにちは、のんびりエンジニアのたっつーです。 ブログを運営しているのでよろしければ見てください。 対象物呼び出しと、それに対しての指示を同時に認識するようなサンプルを書いてみました。 非常に簡単に実装できるのでぜひ試してみてください。 実行結果 PCにマイクを接続する 「田中さん」「佐藤さん」「佐々木さん」と声をかけると、「☆呼ばれました」が表示されます 「佐藤さん静かにして」と声をかけると「☆静かにしよう!」が表示されます 使い方 プロジェクトの参照設定で、アセンブリ から System.Speech を追加してください。 Program.cs VoiceCommand をインスタンス化して Open() メソッドを呼び出します。 using System; using System.Collections.Generic; using System.Linq; using

                                      .NET 標準で音声認識を試す(System.Speech.Recognition) - Qiita
                                    • OpenCVとdlibを使って顔認識(face recognition)してみる【後編】|Tech Press | テックプレス

                                      OpenCVとdlibを使って顔認識(face recognition)してみる【前編】 いきなりの実装に入る前に、簡単に理論のおさらいと基本的な実装方法をおさえておきます。 その後に、ウェブカメラを使って顔を検出し、... 今回、ウェブカメラを使ってリアルタイムに判定するのと、入出管理するために名前と時間をcsvに書き出すようなコードを書いてみます。 2段階のフェーズに分けて実装していきます。 1つ目がウェブカメラを使ってリアルタイム判定 2つ目がcsvへの書き出し リアルタイム判定の実装 前回のコードも利用していくので、適宜コピペして対応していってください。 まず、手動で画像ファイルを読み込んでいたのを自動化します。printで画像のファイル名一覧が表示されているか確認します。 import cv2 import numpy as np import face_recognition

                                        OpenCVとdlibを使って顔認識(face recognition)してみる【後編】|Tech Press | テックプレス
                                      • 論文まとめ:Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition - Qiita

                                        論文まとめ:Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action RecognitionMachineLearningDeepLearningGraphConvolutionalNetworksPoseEstimationActionClassifier はじめに AAAI2018より以下の論文 [1] S. Yan, et. al."Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition" のまとめ 公式らしきコード: https://github.com/yysijie/st-gcn arXiv: https://arxiv.org/abs/1801.07455 既にyukihiro d

                                          論文まとめ:Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition - Qiita
                                        • Web Speech API Speech Recognition で数値の認識を統一する - Qiita

                                          概要 https://qiita.com/hmmrjn/items/4b77a86030ed0071f548 こちらの記事などを参考に音声認識アプリケーションを作っていました。 「10キロ」「20キロ」など数値を入力する際に、数字と漢数字が混ざって扱いづらいのでどうにかしたい。 再現手順 以下のデモサイトにアクセス https://www.google.com/intl/ja/chrome/demos/speech.html 日本語を選択して、「10キロ、20キロ、30キロ、…」としゃべっていく。 テキスト化された内容を確認すると数字と漢数字が混じっている 60 と 70 が割と怪しい 六十キロ 七十キロ まとめてしゃべると補正するようだが単体だとダメ 解決方法 SpeechGrammar を設定してあげる https://developer.mozilla.org/ja/docs/Web

                                            Web Speech API Speech Recognition で数値の認識を統一する - Qiita
                                          • Ragıp Soylu on Twitter: "BREAKING — EU will sanction Russia over its recognition of independence of Ukrainian regions: Von der Leyen"

                                            BREAKING — EU will sanction Russia over its recognition of independence of Ukrainian regions: Von der Leyen

                                              Ragıp Soylu on Twitter: "BREAKING — EU will sanction Russia over its recognition of independence of Ukrainian regions: Von der Leyen"
                                            • iOS 14で追加された音声認識機能(Sound Recognition)がちょっと怖いらしい 「絶対オンにしないな」「不気味すぎるよ」 - 記事詳細|Infoseekニュース

                                              iOS 14で追加された音声認識機能(Sound Recognition)がちょっと怖いらしい 「絶対オンにしないな」「不気味すぎるよ」 ガジェット通信 / 2020年6月28日 15時0分 障がいのある人をサポートする機能としてiPhoneに搭載されているのがアクセシビリティ(Accessibility)と呼ばれる機能です。 https://twitter.com/viticci/status/1275412834655109121 6月22日に発表されたiOS 14には、耳に障がいのある人をサポートするための音声認識機能(Sound Recognition)が追加されています。赤ちゃんの泣き声、火災報知器が鳴る音、水が流れる音などを認識すると通知してくれるという機能です。 https://twitter.com/MKBHD/status/1276182624923521026 耳に障が

                                                iOS 14で追加された音声認識機能(Sound Recognition)がちょっと怖いらしい 「絶対オンにしないな」「不気味すぎるよ」 - 記事詳細|Infoseekニュース
                                              • 再生(recall)と再認(recognition) - 世界一わかりやすい心理学

                                                想起の過程 記憶の実験をする場合の主要な測定法として、再生を調べる方法と再認を調べる方法がある。 再生(recall) 再生とは、覚える際に見た材料がどのようなものであったのかを、直接答えさせる方法である。 つまり、再生とは記銘した刺激を被験者自身が思い出して(再現する方法である。 再認(recognition) 再認とは、覚える際に見た材料とそうではない新しい材料を後に混ぜて被験者に示し、以前に見たものと新しいものとの区別をさせる方法である。つまり、学習した項目と学習しなかった項目を提示し、どの項目を以前学習したか被験者に指摘させる方法である。 学校で行われる試験でもこの2つの方法は用いられており、 たとえば、問題文中の空欄にあてはまる単語を、直接記入するのは再生法、選択肢の中から選ぶのは再認法によるものである。一般に再生を求めた場合のほうが再認の場合よりも難しいことが知られている。 想

                                                • Sergej Sumlenny on Twitter: "German FM urges Russia to denounce recognition of LDNR and return to Minsk. So stupid. @ABaerbock doesn't understan… https://t.co/fGzBVWSDx4"

                                                  German FM urges Russia to denounce recognition of LDNR and return to Minsk. So stupid. @ABaerbock doesn't understan… https://t.co/fGzBVWSDx4

                                                    Sergej Sumlenny on Twitter: "German FM urges Russia to denounce recognition of LDNR and return to Minsk. So stupid. @ABaerbock doesn't understan… https://t.co/fGzBVWSDx4"
                                                  • Northern Lights Development Board - AI Demonstration Kit for Object Recognition-Based Motor Control

                                                    The Future Electronics Northern Lights demonstration platform combines machine learning with vision and digital signal controller technologies to provide an ...

                                                      Northern Lights Development Board - AI Demonstration Kit for Object Recognition-Based Motor Control
                                                    • Speech Recognition API と Yandex Translation API を使って 音声自動翻訳アプリを作成 - Qiita

                                                      Speech Recognition API と Yandex Translation API を使って 音声自動翻訳アプリを作成JavaScriptHTML5translationSpeechRecognition はじめに たまたま音声認識APIがあることを知って簡単に動かせた → 翻訳にかけれたら便利だなと思ったので簡単に使える翻訳APIを調べて組み合わせてみた。 使用するAPIについて SpeechRecognition HTML5に備わってるAPI (Mozilla作) 音ブラウザで音声を認識してくれる 参考:Speech Recognition API でブラウザ音声認識を試す YandexTranslation Yandexがロシア版Googleみたいなもので、そのYandexが出してる翻訳API APIの使用には無料登録が必要 使い方が簡単そうだったの試しに使ってみた 参考

                                                        Speech Recognition API と Yandex Translation API を使って 音声自動翻訳アプリを作成 - Qiita
                                                      • Tsinghua Professor Lao Dongyan: The hidden worries of facial recognition technology

                                                        Tsinghua Professor Lao Dongyan: The hidden worries of facial recognition technology

                                                          Tsinghua Professor Lao Dongyan: The hidden worries of facial recognition technology
                                                        • 【AI Shift Advent Calendar 2022】音声認識に関する論文紹介 “Robust Speech Recognition via Large-ScaleWeak Supervision” | 株式会社AI Shift

                                                          TOPTECH BLOG【AI Shift Advent Calendar 2022】音声認識に関する論文紹介 “Robust Speech Recognition via Large-ScaleWeak Supervision” 【AI Shift Advent Calendar 2022】音声認識に関する論文紹介 “Robust Speech Recognition via Large-ScaleWeak Supervision” こんにちは!AIチームの東です。 本記事はAI Shift Advent Calendar 2022の8日目の記事です。 本記事では、OpenAIが公開した汎用的な音声認識モデルWhisper[1]の概要と、その内部動作について紹介していきます。 Whisperとは 背景 音声認識に深層学習が取り入れられて以降、その認識精度は飛躍的に向上しました。最近ではW

                                                            【AI Shift Advent Calendar 2022】音声認識に関する論文紹介 “Robust Speech Recognition via Large-ScaleWeak Supervision” | 株式会社AI Shift
                                                          • Automotive Sound Recognition (SWS)

                                                            Cameras, Light Detection and Ranging (LiDAR), and radar can’t see around corners. And, they cannot see emergency vehicles that are far away but fast approaching. The best line-of-sight sensors in the world are limited by the fact that they can’t see threats that are hidden from view. With the addition of obstructed view scenarios into the safety standards of Euro NCAP and other international testi

                                                              Automotive Sound Recognition (SWS)
                                                            • DX認定制度(DX Recognition Program)

                                                              出典:日経クロステック、2021年2月24日 (記事は執筆時の情報に基づいており、現在では異なる場合があります) デジタル技術を活用したビジネス変革に向けた準備を整えた事業者を、経済産業省が「DX(デジタルトランスフォーメーション)認定事業者」として認定し公表する制度。2020年5月に始めた。DXに必要な取り組みを認定基準として示すことで、事業者がDXに踏み出す契機とする狙い。認定を得ることで、事業者はDXに取り組む姿勢をアピールできる。 情報処理推進機構(IPA)が事業者の申請を受け付けて審査する。企業のほか個人事業者や公益法人など全ての事業者が申請できる。審査期間は約3カ月。認定の有効期間は2年間で、更新の際は再申請が必要だ。 審査の観点は4点あり、具体的には「ビジョン・ビジネスモデル」「戦略」「成果と重要な成果指標」「ガバナンスシステム」だ。各観点の認定基準として、デジタル技術の普及

                                                                DX認定制度(DX Recognition Program)
                                                              • そのおっさん、米国公認管理会計士(USCMA)のテキストで収益の認識 Revenue Recognition を学習する①

                                                                IFRSと米国会計基準の歩み寄りの現況確認 米国会計基準には、従来、収益の認識について、概念基準としての「財務会計概念基準書」(SFAC: Statement of Financial Accounting Concepts)の No.5 や No.6 という基礎概念しか存在していませんでした。 どちらかというと欧州主導によるIFRSの勢力拡大に伴い、これを米国会計基準とできるだけ差異が出ないように同じような会計処理を行おうとする、いわゆる「コンバージェンス」(convergence:収斂、収束)を目的とした、FASB(Financial Accounting Standards Board:米国財務会計基準審議会)とIASB(The International Accounting Standards Board:国際会計基準審議会)の共同プロジェクトから、新しい収益の認識基準が公表され

                                                                  そのおっさん、米国公認管理会計士(USCMA)のテキストで収益の認識 Revenue Recognition を学習する①
                                                                • Kaggle Kuzushiji Recognition Competition発表の感想

                                                                  2019年12月11日のKaggle Days TokyoでのKuzushiji Recognitionコンペの発表に関する感想です。

                                                                    Kaggle Kuzushiji Recognition Competition発表の感想
                                                                  • 機械学習初心者がface_recognitionライブラリを使ってつまずいたところ - Qiita

                                                                    顔画像認識アプリを作成するにあたって、つまずいたところをメモとして書き留めます。 スクレイピングで集めてきた画像から顔だけ切り取りをしたいけど、OpenCVだと正常に切り取れない!(耳だけ切り取られた画像が出力されたなど)ということがあったので、face_recognitionライブラリを使って顔だけ切り取りを行いました。 その際にエラーが発生し原因が分からず、悩んでしまったのでメモします。 (著作権に引っ掛かってしまいそうなので、画像の添付は省略させていただきます) 使用環境 * google colaboratory * face-recognition-1.3.0 顔の特徴量が見つけられない場合、発生するエラー 例えば横向きの画像を以下のコードで切り取りを行おうとすると #face_recognitionはpip install する必要あり #!pip install face_r

                                                                      機械学習初心者がface_recognitionライブラリを使ってつまずいたところ - Qiita
                                                                    • 論文 -Neural Architectures for Named Entity Recognition- - fukuの犬小屋

                                                                      用語解説 Named Entity Recognition (NER): 固有表現抽出 人名・地名などの固有名詞や日付・容量などの数値表現を抽出するNLPタスク。 これまで精度の高いNERを実現するには大量のラベル付きデータが必要とされてきました。 しかし、言語や分野ごとにコーパスを作成するのはコストがかかります。 特に専門分野のコーパスの作成には専門知識が求められるため、よりコストが高くつくことが問題でした。 詳しい説明は以下の記事を参考にしてください。 PyTorch DL for NLP -Bi-LSTM CRF- Long Short-Term Memory (LSTM) RNNの一種です。 RNNの課題だった長い系列データの利用が可能になりました。 詳しい経緯は以下の解説記事を参考にしてください。 PyTorch DL for NLP -LSTM- 論文概要 これまでのNERの手

                                                                      • User Activity Recognition | 機能統合 | Unity Asset Store

                                                                        このアセットはアセットストアでの取り扱いが終了しました。アセットを新規に購入あるいは無償取得することはできません。取り扱い終了前にアセットをダウンロード済みのユーザーは、ローカルに保存されている場合に限りインポートすることができます。 多くの場合、パブリッシャーがアセットのサポートをすることができなくなった、あるいはサポートをする意志がなくなった場合にアセットの取り扱いが終了します。他のアセットを探すか、このアセットのパブリッシャーに直接連絡をすることをお勧めします。

                                                                          User Activity Recognition | 機能統合 | Unity Asset Store
                                                                        • そのおっさん、米国公認管理会計士(USCMA)のテキストで収益の認識 Revenue Recognition を学習する②

                                                                          収益認識のための5ステップ (再掲) 収益の認識のためには、必ず次の5ステップを踏む必要があります。厳密には、収益計上のため、計上タイミングを決める「認識」と、計上金額を決める「測定」行為が必要なのでした。 Identify the contract with the customer(顧客との契約の識別) Identify the separate performance obligations in the contract(契約における履行義務の識別) Determine the transaction price(取引価格の算定) Allocate the transaction price to the separate performance obligations(履行義務への取引価格の配分) Recognize revenue when or as the entity s

                                                                            そのおっさん、米国公認管理会計士(USCMA)のテキストで収益の認識 Revenue Recognition を学習する②
                                                                          • face_recognition による顔のクラスタリングを行う Python プログラム(Dlib,ageitgey/face_recognition,Python を使用)(Windows 上)

                                                                            【サイト内の関連ページ】 説明資料: Dlib の機能概要 [PDF], [パワーポイント] 顔情報処理の Python プログラム(Dlib,face_recognition を使用) について: 別ページ »にまとめ Windows で動く人工知能関係 Pythonアプリケーション,オープンソースソフトウエア): 別ページ »にまとめている. 【用語説明】 Dlib Dlibは,数多くの機能を持つ C++ ライブラリ.機能には,機械学習,数値計算,グラフィカルモデル推論,画像処理,スレッド,通信,GUI,データ圧縮・一貫性,テスト,さまざまなユーティリティなどがある.Python API もある. 【関連する外部ページ】 ageitgey/face_recognition のページ: https://github.com/ageitgey/face_recognition 前準備 Gi

                                                                            • Speech Recognition : Speech To Text Part1 - Common Voice dataset - Qiita

                                                                              目標 深層学習による音声認識についてまとめました。 Part1 では、音声認識のための準備を行います。 以下の順で紹介します。 Common Voice データセットのダウンロード Sentence Piece モデルの作成 音声データの前処理 CNTK が提供するビルトインリーダーが読み込むファイルの作成 導入 Common Voice データセットのダウンロード Common Voice [1] データセットは、ウェブブラウザ Firefox で有名な Mozilla が支援している音声認識ソフトウェアのためのデータセットです。 Common Voice 上記のページにアクセスして、今回使用する日本語の音声データとテキストデータをダウンロードします。ダウンロードする際、メールアドレスの入力が要求されます。 今回のディレクトリ構成は以下のようにしました。 CTCR MGCC STTT |

                                                                                Speech Recognition : Speech To Text Part1 - Common Voice dataset - Qiita
                                                                              • python venvの仮想環境で構築する顔認証(face_recognition)windows環境 - Qiita

                                                                                ■ 概要 ・Windows11。 ・pythonの仮想環境venvで構築。 ・モジュールは、opencv-python、face_recognition、configを使用。 ・外部カメラ使用(USB WEBカメラ) ・物体検知で、ディレクトリ(image_jp)内にある画像と一致したら、パスワードを入力する。 ■ 完成画面 ■ ディレクトリ構成 ./app/以下 ■仮想環境の作成と、モジュールのインストール ・仮想環境 作成 $ python -m venv venv ・仮想環境を起動して、入る。 $ /venv/SCripts\activate.bat ・モジュールのインストール $ pip install opencv-python $ pip install face_recognition $ pip install config ■ ソースコード ・main_001.py im

                                                                                  python venvの仮想環境で構築する顔認証(face_recognition)windows環境 - Qiita
                                                                                • Python - 顔認識ライブラリ Face Recognition で顔認証を行う方法 - pystyle

                                                                                  Warning: Undefined variable $position in /home/pystyles/pystyle.info/public_html/wp/wp-content/themes/lionblog/functions.php on line 4897

                                                                                    Python - 顔認識ライブラリ Face Recognition で顔認証を行う方法 - pystyle