並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 339件

新着順 人気順

recognitionの検索結果81 - 120 件 / 339件

  • 認証のグニャグニャ文字は時代遅れ? GoogleがCAPTCHAを使わなくなったわけ

    認証のグニャグニャ文字は時代遅れ? GoogleがCAPTCHAを使わなくなったわけ:Mostly Harmless(1/2 ページ) Webサイトの認証などで、人間かAIかの判定に使われている「CAPTCHA」と呼ばれる“グニャグニャ文字”。これをGoogleが使わなくなった理由とは。 少し前、朝日新聞の記事が目につきました。 ネットのグニャグニャ文字認証、AIが楽々突破 「あれ? これ、前にもあったな」と思って調べてみると、このVicariousがCAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart:コンピュータと人を区別するための完全自動化チューリングテスト)を解読したという記事は2013年に出ていました。CAPTCHAというのがこの“グニャグニャ文字”の名前で、主にWeb

      認証のグニャグニャ文字は時代遅れ? GoogleがCAPTCHAを使わなくなったわけ
    • 「米国は訴訟社会」というフィクション

      『手ごわい頭脳―アメリカン弁護士の思考法』という本を買ってきて読んでいるのですが、なかなか面白いです。全体の感想はいずれ改めて書くことにして、1つ面白いと感じた指摘を。 米国というと、「弁護士が多い」「バカな訴えが通ってしまう」などといった訴訟社会のイメージがありますが、著者のコリン・P・A・ジョーンズ弁護士は必ずしもそれが正しくないことを解説しています。例えば、「弁護士が多い」という点については、確かにその通りだとはしつつも まず、日本と比較する場合だが、実は「弁護士」という用語を用いることには大きな語弊がある。何故なら、アメリカの弁護士が手がけている業務の範囲は、日本の弁護士のそれよりもはるかに広いからだ。 アメリカで「ローヤー」(Lawyer)の資格を持っている人々がやっている仕事をざっと並べると次のようになる。日本でいうところの弁護士に加えて、検察官と裁判官(いわゆる法曹三者)も含

      • ディープラーニングで交通量調査の映像解析精度を上げるのに苦労した - Qiita

        サマリー ・映像解析による交通量調査の手法について ・解析結果の映像サンプルはこちら:https://youtu.be/kgjG6_hejE8 ・映像によっては誤認識しやすいエリアがある ・マスク機能について 映像解析による交通量調査の手法について ここではディープラーニングによる映像解析精度を上げるためには「解析しないこと」が早道だよ、という話をします。ディープラーニングそのもののチューニングによる解決ではなく、実装方法の工夫による回避なので、ディープラーニングの勉強にはならないかも。 あ、トップ画像ですが「small_truck」として軽貨物が判別できているのがちょっと自慢。ピンクの枠です。 ・やっぱり映像解析は簡単ではない 前の記事でも書いてますが、SSDにしてもMask R-CNNにしてもYOLO V3にしても物体検出は「静止画」に対して行います。動画をinputに選択できたとして

          ディープラーニングで交通量調査の映像解析精度を上げるのに苦労した - Qiita
        • PHPでOpenCVなしのピュアPHPで顔認識するクラスライブラリ「Face_Detector」:phpspot開発日誌

          PHPでOpenCVなしのピュアPHPで顔認識するクラスライブラリ「Face_Detector」 2009年06月23日- Face detection in pure PHP (without OpenCV) - Maurice Bloggue PHPでOpenCVなしのピュアPHPで顔認識するクラスライブラリ「Face_Detector」が公開されています。 次のようなコードで、顔認識した画像を出力できるみたい。 $detector = new Face_Detector('detection.dat'); $detector->face_detect('maurice_svay_150.jpg'); $detector->toJpeg(); どの程度の速度が出て、どれぐらい使えるものか分かりませんが、エクステンション無しで使えるのは凄いですね。 関連エントリ PHPで顔検出するPHP

          • OSSなWeb会議アプリ(SkyWay Conf)に文字起こし機能を実装してみた - Qiita

            SkyWay ConferenceはSkyWayを利用したのブラウザ上で動作するWeb会議デモアプリです。OSSとして公開されています。 今回はSkyWay Confを改造して文字起こし機能をつけてみました! Web会議アプリに文字起こし機能がついてると、出先でイヤホンを忘れてもなんとかなるかもしれません。 議事録も自動で出来て素晴らしいですね。 左上の窓で文字起こし関連の操作が出来て、画面中央下部に書き起こされた文字が表示されるようにしました。 できたもの まずデモアプリはこちら。Chromeで開いてください! 文字起こし機能つきSkyWay Confのデモページ https://shinyoshiaki.github.io/skyway-conf ソースコードなど 文字起こし機能つきSkyWay Confのソースコード https://github.com/shinyoshiaki/s

              OSSなWeb会議アプリ(SkyWay Conf)に文字起こし機能を実装してみた - Qiita
            • YouTube動画を音声解析して自動的にキャプションをつける機能がすごい(多言語翻訳可)*二十歳街道まっしぐら(FC2ブログ時代)

              「YouTube」の一部の動画に自動キャプション機能がつきました。 日本語のものはまだできないようですが、英語音声の動画だと対応しているようです。 音声から自動的にキャプションを作ることができ、さらに多言語翻訳に対応しています。 英語動画の内容もこれがあればすんなり分かるようになるかも! 以下にどのような機能か紹介します。 YouTube動画にこのようなキャプションを自動的にいれられるということです。 動画の右下からこの機能は使えます。 キャプションの選択は現在は英語しかありません。 音声文字変換すると、音声を解析して自動的にキャプションが埋め込まれます。 また、翻訳機能を使うことでそれらを多言語翻訳できます。 音声解析→英語キャプション→日本語翻訳した例です。 ↓ (上記画像が抜けてましたので修正しました 2009/11/22/ 17:54) 教育チャンネルから対応していくということでし

              • TechCrunch | Startup and Technology News

                When Alex Ewing was a kid growing up in Purcell, Oklahoma, he knew how close he was to home based on which billboards he could see out the car window.…

                  TechCrunch | Startup and Technology News
                • TechCrunch | Startup and Technology News

                  Unlike Light’s older phones, the Light III sports a larger OLED display and an NFC chip to make way for future payment tools, as well as a camera.

                    TechCrunch | Startup and Technology News
                  • Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog

                    こんにちは ハタ です。 最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います 音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります 構築していく上で色々試行錯誤したのでそれが紹介できればなと思っています どんなものを作ったか 前提知識: 配信基盤 前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージ まとめ We are hiring! どんなものを作ったか 今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行う シス

                      Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
                    • Google Audio Indexing

                      Suggestions: Make sure all words are spelled correctly. Try different keywords. Try more general keywords. Try removing quotes, if you included them.

                      • Viewdle - Home

                        Viewdle is a facial recognition powered digital media platform for easily indexing, searching & monetizing video assetsViewdle is a facial recognition powered digital media platform for easily indexing, searching & monetizing video assets

                        • わかりやすいパターン認識

                          第1章 パターン認識とは 1.1 パターン認識系の構成 1.2 特徴ベクトルと特徴空間 [1] 特徴ベクトル [2] 特徴ベクトルの多様性 1.3 プロトタイプと最近傍決定則 [1] プロトタイプ [2] 特徴空間の分割

                          • テクノロジー:リコメンデーションの専門企業・株式会社ALBERT(アルベルト)

                            データ分析から導き出されたインサイト無しにAI(人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって本当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

                              テクノロジー:リコメンデーションの専門企業・株式会社ALBERT(アルベルト)
                            • 特集: NHKスペシャル「サイボーグ技術が人類を変える」補遺 - SCI(サイ)

                              • ポッドキャスト内の言葉を拾う検索エンジン | WIRED VISION

                                ポッドキャスト内の言葉を拾う検索エンジン 2005年12月 2日 コメント: トラックバック (0) Kim Zetter 2005年12月02日 ブログを検索できる『テクノラティ』と同じように、ポッドキャストを探せる検索エンジンが新たに2つ登場した。ポッドキャストをキーワードで検索し、欲しい音声ファイルを正確に探し出せるのだ。 『ポッドジンガー』(Podzinger)と『ブリンクス』(Blinx)の新バージョンは、音声をテキストに変換してインデックス化することにより、キーワードによる音声コンテンツの高速検索を行なう。従来の検索エンジンは、音声ファイルの概要を説明した見出しや紹介文など、ポッドキャストのメタデータに含まれるキーワードだけを検索対象にしていたので、これは大きな前進と言える。 ポッドジンガー(12月中旬までベータ版)では、ポッドキャストの中で検索ワードが出てくる部分に直接ジャン

                                • Engadget | Technology News & Reviews

                                  Hands-on with the new iPad Pro M4: Absurdly thin and light, but the screen steals the show

                                    Engadget | Technology News & Reviews
                                  • ThatsMyFace - Malicious Content Detection

                                    We use DETECTiOn ML and facial recognition ai to flag visual markers of CSEM, NCII, DISINFORMATION AND VIOLENCE AND WHO’S IN IT.

                                      ThatsMyFace - Malicious Content Detection
                                    • Deep Visual-Semantic Alignments for Generating Image Descriptions

                                      Deep Visual-Semantic Alignments for Generating Image Descriptions We present a model that generates natural language descriptions of images and their regions. Our approach leverages datasets of images and their sentence descriptions to learn about the inter-modal correspondences between language and visual data. Our alignment model is based on a novel combination of Convolutional Neural Networks o

                                      • #信じられないかもしれませんが青と緑に見えてるところは同じ色です

                                        #信じられないかもしれませんが青と緑に見えてるところは同じ色です

                                          #信じられないかもしれませんが青と緑に見えてるところは同じ色です
                                        • 注目を集める「インチキ画像発見用ソフト」--潜在需要は膨大?

                                          ダートマス大学のHany Farid教授は、決してJosef Stalinのファンではないが、ソ連時代に作られたStalinの修正写真が「一級品」であることは認めている。 「あれは見事な仕事だ。私はオリジナルの写真を何枚か見たことがある」とFaridは述べ、さらに、ソ連の人々は写真に写った犠牲者の姿を消すのにエアブラシを使ったりはしなかったと付け加えた。彼らのやり方は、ネガの上に新たに背景を描くというものだった。 Faridのフォトレタッチへの関心は、歴史的な写真だけにとどまらない。コンピュータ科学と応用数学を専門とする同氏は、ダートマス大学のImage Science Groupを運営している。同グループは、デジタル写真の修正/ごまかしを見破るソフトウェアの開発を目的とした米国内の重要な研究センターの1つとして頭角を現している。 同グループが開発したソフトウェアの一部は、FBIや、Reu

                                            注目を集める「インチキ画像発見用ソフト」--潜在需要は膨大?
                                          • 写っている人の顔を自動認識してタグ付け、画像検索「Riya」ベータ公開

                                            Windows SQL Server 2005サポート終了の4月12日が迫る、報告済み脆弱性の深刻度も高く、早急な移行を

                                            • orbe.us | ReKognition - Welcome to Rekognition.com

                                              ReKognition.com provides an all-in-one image processing cloud API, including facial recognition, scene recogntion and object recognition, great choice for face.com API replacementReKognition API Integrated visual recognition solution based in Cloud

                                              • 日本語にも対応した手書き文字認識エンジン·Zinnia MOONGIFT

                                                Windows MobileやZaurusなどのPDAで良く見かけるのが手書き文字認識エンジンだ。バーチャルキーボードやPDAの小さなキーボードで入力するよりも素早く入力ができるのが便利だ。 モデルの認識中 OCRも同様だが、入力された内容を読み取ってデジタルなデータに変換するというのは難しい技術だ。だがその部分だけオープンソース化すれば、みんなが手軽に利用できるようになる。 今回紹介するオープンソース・ソフトウェアはZinnia、手書き文字認識エンジンだ。 Zinniaはエンジンのみの提供で、認識の基準になるモデルなどは提供されていない。そしてそのエンジンは機械学習機能(アルゴリズムはSVM)が実装されており、利用していくうちに精度を高めることができる。 Python用テストスクリプト APIを公開しており、それを使うことでC/C++/Perl/Ruby/Pythonなどでもエンジンを利

                                                  日本語にも対応した手書き文字認識エンジン·Zinnia MOONGIFT
                                                • Labellio

                                                  Please make sure that this URL is an image (PNG or JPEG) and not a web page

                                                    Labellio
                                                  • John Resig - OCR and Neural Nets in JavaScript

                                                    A pretty amazing piece of JavaScript dropped yesterday and it’s going to take a little bit to digest it all. It’s a GreaseMonkey script, written by ‘Shaun Friedle‘, that automatically solves captchas provided by the site Megaupload. There’s a demo online if you wish to give it a spin. Now, the captchas provided by the site aren’t very “hard” to solve (in fact, they’re downright bad – some examples

                                                    • きまぐれ日記: Zinnia: 機械学習ベースのポータブルなオンライン手書き文字認識エンジン

                                                      オンライン手書き文字認識エンジンZinniaを公開しました。 http://zinnia.sourceforge.net/index-ja.html Zinniaは機械学習アルゴリズム SVM を用いたポータブルで汎用的な オンライン手書き文字認識エンジンです。Zinniaは組み込みの容易さと汎用性を高めるために、 文字のレンダリング機能は持っていません。Zinniaは文字のストローク情報を座標の連続として受け取り、 確からしい順にスコア付きでN文字の認識結果を返すだけに機能を限定しています。 また、認識エンジンは完全に機械学習ベースであるために、文字のみならずユーザの任意のマウス・ペンストロークに対して任意の文字列をマッピングするような認識エンジンを小コスト作成することができます。 2年前に、Ajax手書き文字認識と言うものを作ったのですが、その認識エンジンをスクラッチからポータブルでつ

                                                      • DeepLearningによるアイドル顔識別を支える技術 / 2017-08-04 builderscon tokyo

                                                        https://builderscon.io/tokyo/2017/session/e4d2daaf-cd24-4668-8a7c-496d9e585552

                                                          DeepLearningによるアイドル顔識別を支える技術 / 2017-08-04 builderscon tokyo
                                                        • ゲームの「初見殺し」は徹底的に排除すべきか

                                                          ニカイドウレンジ @R_Nikaido 個人的には「初見殺し」というものは徹底して無くすべきだと考えてる。ゲームってやつは、何かしらを「認識」して、それに対する「対応」を行うものだと考えているんだけど、初見殺しとは、その「認識」 ができないものを指すわけなのよ。つまり初見殺しはゲームとして成立していない、と考えるよ。 2011-04-27 17:40:47 ニカイドウレンジ @R_Nikaido (続き)昔は「覚えゲー」「パターン構築ゲー」と呼ばれるゲームは多くあったけど、今はそのようなゲームは廃れた。ごく一部のシューティングやアクションにあるだけだ。それも玄人向けの狭い作品。それらを好む人間は一種の変態であり、感覚が狂っている人間だから対象外とする。(失礼) 2011-04-27 17:43:57 ニカイドウレンジ @R_Nikaido (続き)いや、考え方を変えるべきかもしれない。初見

                                                            ゲームの「初見殺し」は徹底的に排除すべきか
                                                          • 自殺を防ぐためのSiriの進化 - WirelessWire News(ワイヤレスワイヤーニュース)

                                                            ▼National Suicide Prevention Lifeline iPhone 4S登場時、音声アシスタントのSiriにさまざまな質問をして変わった答えを引き出して楽しむ人が多かったが、中には「自殺するつもりだ(I'm going to kill myself)」を試した人もいる。答えは「メンタルヘルスのクリニックを4つ見つけました。そのうち3つは近所にあります」だった。 最近のSiriはさらに進化を遂げて、利用者が自殺を匂わせる問いかけをすると全米自殺予防ライフライン(National Suicide Prevention Lifeline)に電話をしてみてはどうかと答え、1-800-273-TALKに電話するボタンを表示する。この示唆に従わなかった場合には、利用者のロケーションの最寄りの自殺予防センターのリストが表示される。 全米自殺予防ライフラインは、2011年にはフェイ

                                                            • 【コラム】OS X ハッキング! 第203回 OpenCV iSightで顔を認識? (MYCOMジャーナル)

                                                              Core 2 Duo搭載の二代目MacBookが発売になりました。初代が5月16日発売ですから、ほぼ半年ぶりのモデルチェンジです。ユーザとしては、半年で25%のスピードアップは微妙に悔しくもありますが……機会があれば、ユーザならではの視点で二代目を検証してみたいと思います。 さて、今回は「OpenCV」について。既報のとおり、画像の変形や認識などイメージング処理を目的としたクロスプラットフォーム指向のライブラリだが、OS Xユーザ要注目の機能もいくつか備えている。活用次第では、いろいろな力を発揮しそうなのだ。 OpenCVの特徴、そして導入の下準備 OpenCVの開発はクロスプラットフォーム指向で行われ、特定のハードウェアに依存しない。Intelが関与しているプロジェクトなだけに、メインターゲットはやはり"Wintel"ということになるが、POSIX互換機能を備えるUNIX系OSでも動作す

                                                              • http://www.sr.se/p1/src/sing/

                                                                • 日本認知科学会

                                                                  大会・シンポジウムのご案内 日本認知科学会第41回大会 2024年10月12日(土)~14日(月・祝) 会場:東京大学本郷キャンパス

                                                                  • Polar Rose - We sort the web of photos!

                                                                    Visual search for the people! With Polar Rose you can name the people you see in online photos and use our visual search engine to easily find more.

                                                                    • 脳内の地図を描きかえること、世界を描きかえること - チェコ好きの日記

                                                                      突然ですが、今、紙とペンを取り出すことはできますか。アナログな紙とペンでなくとも、ある程度自由に「図」が描けるものであったら、なんでもいいんですけど。 紙とペンの用意ができたらですね、それで地図を描いてください。あなたの自宅から、最寄り駅までの地図を、できるだけ詳しく。スマホでGoogleの地図とか見ないでくださいね。自分の脳みその中身だけをもとに地図を描いてください。ちょっと時間をとりましょう。 どうでしょう、描けましたか。 完成した方は、Googleマップ解禁です。自分が描いた地図と、実際の地図を見比べてみてください。どこがどうちがいますか。方角、縮尺、そもそもの認識の歪み、いろいろあると思いますが、実際の地図と同じように描けた方というのは、少数派なんじゃないかなと思います。 ……っていう授業を大学のときに受けたんですけど、私はたしかそのとき、こんなかんじの地図を描いちゃったんですよね

                                                                        脳内の地図を描きかえること、世界を描きかえること - チェコ好きの日記
                                                                      • ゲーム機のデバイスKinectの驚く応用、買い物客の行動を追跡:日経ビジネスオンライン

                                                                        気になる記事をスクラップできます。保存した記事は、マイページでスマホ、タブレットからでもご確認頂けます。※会員限定 無料会員登録 詳細 | ログイン 谷島(宣之=日経BPビジョナリー経営所):『素敵な総合造形計画』は優れたモノやコトが持つグランドデザイン(総合造形計画)を、情報システムのデザインワークを長年手がけてきた桑原さんと読み解く企画です(連載主旨については第1回「わくわくしながら、しっかり稼ごう」を参照)。今回の題材は何でしょうか。 桑原(里恵=札幌スパークル):コンシューマー向けのIT製品を使って思いがけない付加価値を生み出している例を通して、技術を生かす発想について考えたいと思います。 最初は、マイクロソフトのKinectを使って小売店の買い物客を追跡し、陳列の効果や買い物客の動線を分析するアプリケーションを選んでみました(関連記事「KinectアプリShopper Track

                                                                          ゲーム機のデバイスKinectの驚く応用、買い物客の行動を追跡:日経ビジネスオンライン
                                                                        • GitHub - ggerganov/whisper.cpp: Port of OpenAI's Whisper model in C/C++

                                                                          Stable: v1.5.4 / Roadmap | F.A.Q. High-performance inference of OpenAI's Whisper automatic speech recognition (ASR) model: Plain C/C++ implementation without dependencies Apple Silicon first-class citizen - optimized via ARM NEON, Accelerate framework, Metal and Core ML AVX intrinsics support for x86 architectures VSX intrinsics support for POWER architectures Mixed F16 / F32 precision 4-bit and 5

                                                                            GitHub - ggerganov/whisper.cpp: Port of OpenAI's Whisper model in C/C++
                                                                          • 332パターン認識 - 過去を知れば未来が分かる

                                                                            世の中には、既に分かっている過去のデータがあります。このデータを利用しない手はありません。過去のデータを利用すれば、もし分からない未来のデータが出現した場合、過去のパターンから有効な知識として活用させることができます。 今回、ご紹介するのはそんな過去を知れば未来が見えてくる手法です。概して『パターン認識』と呼ばれる手法とその類です。 「パターン認識」、難しい言葉に聞こえるかもしれませんが、我々は常にパターン認識をしております。 例えば、ある人の顔を見たときに瞬時に記憶の中から誰なのか識別してますし、初めて見る場合でも似たような人物を探しどんな人間なのか当てはめたりすることもできます。 楽しいときはどんな表情をするか、苦しいときはどんな表情をするかという「パターンクラス」を私たちは持っています。初めて会う人の表情でさえ、感情をよみとる能力を持ち合わせています。それがパターン認識です。

                                                                            • PDF や写真のファイルをテキストに変換する - パソコン - Google ドライブ ヘルプ

                                                                              ビジネス向けの Google Workspace の高度な機能をご希望ですか? Google Workspace をぜひお試しください。 Google ドライブでは、画像ファイルをテキストに変換できます。 ステップ 1: ファイルを準備する おすすめの方法: 形式: PDF(マルチページ ドキュメント)または写真ファイル(.jpeg、.png、.gif)を変換できます ファイルサイズ: ファイルは 2 MB 以下にします。 解像度: テキストの高さは 10 ピクセル以上にします。 向き: ドキュメントは正しい向きにします。画像の向きが正しくない場合は、回転させてから Google ドライブにアップロードします。 言語: Google ドライブはドキュメントの言語を検出します。対応する言語の説明の詳細 フォントと文字セット: Arial や Times New Roman などの一般的なフォ

                                                                              • IDEA * IDEA

                                                                                ドットインストール代表のライフハックブログ

                                                                                  IDEA * IDEA
                                                                                • マウスジェスチャーAjax

                                                                                  Try it! This app uses javascript and XMLHttpRequest. Your browser must have these enabled to try this out. I didn't put in code that would check for incompability, sorry. See limitations section below for other shortcomings. Known to work with FireFox 1.5beta and IE 6.0. Recording Move the mouse into the record area. To start recording, press and keep a mouse button clicked. While keeping the mous