並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 338件

新着順 人気順

recognitionの検索結果41 - 80 件 / 338件

  • Detexify LaTeX handwritten symbol recognition

    Did this help? Hosting Detexify costs money and if it helps you may consider helping to pay the hosting bill. Want a Mac app? Lucky you. The Mac app is finally stable enough. See how it works on Vimeo. Download the latest version here. Restriction: In addition to the LaTeX command the unlicensed version will copy a reminder to purchase a license to the clipboard when you select a symbol. You can p

    • とくさん|MYCOPING on Twitter: "この研究面白い。賢い人が専門領域外について語る時にたしかに良く起こっている現象かも。 「認知能力が優れている人ほど、情報を合理化して都合の良いように解釈する能力も高くなり、ひいては自分の意見に合わせて巧みにデータを歪めてしまう」 https://t.co/KZfklkSNar"

      この研究面白い。賢い人が専門領域外について語る時にたしかに良く起こっている現象かも。 「認知能力が優れている人ほど、情報を合理化して都合の良いように解釈する能力も高くなり、ひいては自分の意見に合わせて巧みにデータを歪めてしまう」 https://t.co/KZfklkSNar

        とくさん|MYCOPING on Twitter: "この研究面白い。賢い人が専門領域外について語る時にたしかに良く起こっている現象かも。 「認知能力が優れている人ほど、情報を合理化して都合の良いように解釈する能力も高くなり、ひいては自分の意見に合わせて巧みにデータを歪めてしまう」 https://t.co/KZfklkSNar"
      • 『パターン認識と機械学習の学習 普及版』(PDF)

        『パターン認識と機械学習の学習 普及版』 PDF main.pdf (last update : 2020/01/09) 暗黒通信団へのリンク 作品紹介:パターン認識と機械学習の学習普及版 ライセンス クリエイティブ・コモンズ 表示 3.0 非移植 TeXソース https://github.com/herumi/prml/ 著者 光成滋生@herumi(herumi@nifty.com)

        • グーグルも注目する写真検索の「Riya」、来週一般公開へ - CNET Japan

          文:Michael Kanellos(CNET News.com) 編集校正:坂和敏、尾本香里(編集部)2006年03月14日 15時43分 カリフォルニア州カールズバッド発--FBIや警察当局は、何年も前から顔認識技術を利用してきた。しかし、Riyaが来週から提供するサービスによって、この技術が一般ユーザーでも使えるようになる。 スタンフォード大学で顔認識技術を研究し博士号を取得したメンバーらが立ち上げたRiyaは、すでにウェブサイトを立ち上げている。このサイトでは、「文脈認識(技術)」を使ってデジタル・フォトアルバムのなかから、よく似た写真を検索できるようになると、共同創業者のMunjal Shah氏は、当地で開催中の「PC Forum」で講演した。Riyaのサービスでは、たとえば義理の母親の写真を数枚サンプルとして同社のウェブサイトにアップロードすると、Riyaの検索エンジンがユーザ

            グーグルも注目する写真検索の「Riya」、来週一般公開へ - CNET Japan
          • 「承認欲求」をめぐる混乱はなぜ生じたのか?:「承認」概念の三つの起源 - 長椅子と本棚2

            「承認」の起源という問題 以前に、日本のインターネットでよく言及される「承認欲求」という言葉がかなり多義的に用いられているということを、実際の使用例を見ながら論じました。 ホッテントリで振り返る、「承認欲求」論の歴史(06~08年) - 長椅子と本棚 上の記事では実際のネットスラングとしての使用例だけをまとめましたが、「承認」という言葉はネットでの用法にとどまらない背景を背負っています。そこで、今回は少し切り口を変えて、「承認」という概念の出自から、この概念がなぜこんなにも混乱した仕方で用いられているのかを考えてみます。 さて、「承認」という言葉の出自はどこに求められるでしょうか。現代の日本で最もよく知られているのはA. マズローが用いたesteemという概念でしょう。「承認」についてまとまった連載記事を最近投稿していた「シロクマの屑籠」のid:p_shirokuma氏は、次のように書いて

              「承認欲求」をめぐる混乱はなぜ生じたのか?:「承認」概念の三つの起源 - 長椅子と本棚2
            • データから「構造」を発見する:より人間に近づく人工知能 | WIRED VISION

              データから「構造」を発見する:より人間に近づく人工知能 2008年7月31日 サイエンス・テクノロジー コメント: トラックバック (1) Brandon Keim 生物学者のエルンスト・ヘッケルが作成した系統樹(現在は不正確だとされている)。 Image: WikiMedia Commons コンピューターがより人間らしく考えるのに役立つかもしれない、ある新しいパターン認識モデルが登場した。 7月28日(米国時間)刊行の『米国科学アカデミー紀要』(PNAS)に掲載されたこのモデルは、生のデータセットから出現する見込みが最も高いパターンの種類を判断する。 こうした処理は、人間が周囲の世界を理解する際に無意識のうちに使っているものだが、人工的な認識ツールでは一般に難しいとされてきた。 顔認識や系統学などに使われている現行の諸モデルでは、予想されるパターンの型があらかじめ特定されている必要があ

              • Web Equation

                • ねみんぐ! - あなたの画像を命名します。-

                  「ねみんぐ!」は~画像を投稿すると命名してくれる タイトル通りですがー、「ねみんぐ!」を名刺デザインの画像にしてみる……おしゃれな?後藤よしのりのウェブサイトです。 内容については誤字脱字などありますので注意して下さい。(何卒寛容にお受け取りくださいませ諸君。) また、「名刺デザインをおしゃれにすること」に没頭している後藤よしのりなので、その記録を残したい。 インターネットで巡り合ったらしい高校生同士で立ち上げたのが「ねみんぐ!」で画像をアップロードすると命名してくれる。 あの彼らは遠隔地に住むのですが、プログラミングコンテストで意気投合したよう。 この「ねみんぐ!」ですが---あなたの画像を命名します--- 後藤よしのりが単刀直入に言えば~諸君が画像を投稿すると命名してくれるというサービスです。 推定金額をつけてくれるのも気が利いている、ねみんぐ!なのです。 諸君はバカバカしいとお思いで

                  • TechCrunch | Startup and Technology News

                    The Station is a weekly newsletter dedicated to all things transportation. Sign up here — just click The Station — to receive the full edition of the newsletter every weekend in your inbox. Sub

                      TechCrunch | Startup and Technology News
                    • OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO

                      こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。 個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…?と思っていたのですが… ですが… … … … おお!?(上記はGitHubにあるWER: Word Error Rateのグラフです) これは!? これは結構良さげな数値を出している!?(たぶん) ってことで元音声屋さんとしては、これは試すしかない!ということで動かしてみました!(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け 今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試

                        OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
                      • 無料なのにココまでできる! 音声認識アプリを使ったテキストおこし(基本編) | ライフハッカー・ジャパン

                        モバイルバッテリーとは呼べない。「ほぼポタ電」なコレ1台で有事の時もアウトドアも大活躍!【AmazonスマイルSALE】

                        • forever flawless amsterdam

                          News, competitions and exclusive offers direct to your inbox

                          • ディープラーニングで五十嵐響子と椎名法子を見分けられるか試してみた - Qiita

                            五十嵐響子(いがらしきょうこ) 鳥取県出身で、Cute属性のユニットである「ピンクチェックスクール」に所属しています。 その楽曲「ラブレター」のMVがニコニコ動画で再生数100万回を超えました。 以降、苗字を省略して単に「響子」と呼称します。 椎名法子(しいなのりこ) 大阪府出身で、同じくCute属性のユニット「メロウイエロー」に所属しています。 ドーナツが大好きで、常時ドーナツを持ち歩いています。 こちらも以降、単に「法子」と呼称します。 方法 使用したのは公式イラストのみで、二次創作イラストは使っていません。 ネックとなるのが画像数の少なさで、この二人の公式イラストは数十枚しかありません。 また、アニメ版の登場シーンも僅かなため、畳み込み層の学習に必要な画像数が得られません。 そこで、学習済みのVGG16モデルを用いて特徴を抽出して最後の判定結果を出力する段だけ この二人の判定に挿げ替

                              ディープラーニングで五十嵐響子と椎名法子を見分けられるか試してみた - Qiita
                            • 会話が見える! 世界最速の「リアルタイム字幕」にびっくり

                              会話が見える! 世界最速の「リアルタイム字幕」にびっくり:水曜インタビュー劇場(瞬時公演)(1/5 ページ) 2月某日、幕張メッセ(千葉市)。記事のネタを探すために、記者はとあるセミナーを聴講していたところ、大きなモニターに釘付けとなった。 モニターには、登壇者の発言がリアルタイムで文字になって映し出されていたのだ。「ITmedia ビジネスオンラインって最高ね」と発言すると、瞬時に「ITmedia ビジネスオンラインって最高ね」と表示される。それだけではない。日本語の横で、英語のスペルも次々に並んでいたのだ。 よーく見ると、ところどころで“おかしな日本語”も登場する。例えば、「ITmedia ビジネスオンラインって再考ね」といった感じで。しかし、しばらくすると、正しい日本語に変わっていくのだ。 気になる、気になる。どうやってリアルタイムに文字を起こしているのか。最新のテクノロジーを駆使し

                                会話が見える! 世界最速の「リアルタイム字幕」にびっくり
                              • 物体認識モデルYOLOv3を軽く凌駕するYOLOv4の紹介 - ほろ酔い開発日誌

                                はじめに 先月、YOLOv4が公開されました。位置づけとしては、物体認識のポピュラーなモデルの1つであるYOLO系統の最新版となります。結果がすごいのはぱっと見分かりましたし、内容も既存の手法をサーベイ・実験頑張って、精度上げていったんだなあくらいのさら読みはしていましたが、もう少しちゃんと読んでおこうと思い、読んでみたので紹介します。 私自身は物体認識の研究者というわけではないですが、なんだかんだ物体認識周りの記事をいくつか書いているので興味のある方は以下もご参照下さい。 note.com note.com [DL輪読会]Objects as Points from Deep Learning JP www.slideshare.net さて、このYOLOv4ですが、元々のYOLOの作者であるJoseph Redmon氏は著者ではありません。Jeseph Redmon氏は研究の軍事利用や

                                  物体認識モデルYOLOv3を軽く凌駕するYOLOv4の紹介 - ほろ酔い開発日誌
                                • 口ずさんで楽曲を検索できるウェブサイト「Midomi」が登場

                                  あるメロディを口ずさんでいるが、その曲のタイトルを知らなかったり思い出せずにいらいらしたことはないだろうか?そんな人のために、10秒以内に知りたい曲のタイトルを教えてくれるという新しいウェブサイト「Midomi」が登場した。 米国時間1月26日にベータ版の運用を開始したMidomiでは、ユーザーが歌ったり、口ずさんだり、口笛を吹いて楽曲を検索できる。検索結果には、商用で提供されている楽曲のほか、他のユーザーが録音した楽曲も含まれている。ユーザーは、検索結果のうち自分の音声とマッチする部分のみを聞くこともできる。 このほかにも、楽曲のタイトルやアーティスト名を使った検索も利用できる。同システムはスペルミスをしても認識する。 Midomiを開発および提供するMelodisは、200万以上のデジタル楽曲のライセンスを取得しており、ユーザーはこれを購入できる。また、ユーザーから集めた曲も1万200

                                    口ずさんで楽曲を検索できるウェブサイト「Midomi」が登場
                                  • Shapecatcher: Draw the Unicode character you want!

                                    You need to find a specific Unicode character? With Shapecatcher.com you can search through a database of characters by simply drawing your character into a box. It can find the most similar character shapes for your drawing.

                                    • 大規模画像認識とその周辺

                                      2. Contents }  大規模画像データで出来ることの例 }  一般物体認識の紹介 }  大規模化の流れと最近の手法について }  大規模一般物体認識コンペティション }  他分野との融合的領域など 3. 大規模画像データの時代 }  Webサービスへの画像投稿は日常の一部 }  Flickr: 60億枚の画像(2011年) }  Facebook: 毎年30億枚画像投稿 }  Youtube: 毎日約8年分の動画がアップロード }  何らかのメタ情報が付与される場合も多い }  タグ、コメント、EXIF、位置情報、・・・ }  これらの大量のデータを用いることで、従来考えられ なかったさまざまなアプリケーションが登場している 4. 画像補完 }  Scene completion using millions of photographs [Hays et

                                        大規模画像認識とその周辺
                                      • Google Document の音声認識入力が思ってたよりすごかった - mizchi's blog

                                        はいえーとあの google の音声入力のテストをやってみてるんですけどこれめっちゃすごいですねなんかここまで認識精度良いと思わなかったあの文字の改行とかそこだけちょっと自分でやんないといけないんですけどそれ以外は全然不満がないですねこれなにかコマンドとかあるのかなやそうでもないか何がやりたいかというと discord でちょっと仕事で使ってみたくてボイスチャットチャンネルに没頭*1参加させて録音させてそのデータを google のドキュメントとして音声で食わせて文字起こしさせればあの会議とかねリモートワークとかですごい便利なんじゃないかなと思って文字認識 api ってちょっと公開されてるかわかんないんだけどこういう api って google あんまりね有料 api 脱退後悔*2しきれなかったりっていうイメージあるんだよねまあ google ドキュメントを使わせるためのインセンティブやっ

                                          Google Document の音声認識入力が思ってたよりすごかった - mizchi's blog
                                        • Face.com

                                          出售 For SaleFace.comCategory-defining domain available for crypto or cash. Contact to learn more.可以用加密貨幣或現金購買。聯繫了解更多。 Email [email protected]

                                            Face.com
                                          • سایت های شرط بندی معتبر ایرانی و خارجی مطمئن و نحوه انتخاب بهترین - شابتر

                                            این لیست نهایی بهترین سایت های شرط بندی در این تجارت است. ما هر یک از این سایت ها را تحت یک روند دقیق بررسی قرار داده ایم، و همه آنها امتیازات بالایی را در معیارهای اصلی کسب کرده اند. شما می توانید در هر یک از این سایت های شرط بندی ثبت نام کرده و مطمئن باشید که آنها سابقه طولانی در پرداخت سریع، رفتار عادلانه با مشتری و ایمن نگه داشتن اطلاعات شما دارند. ”بیشتربخوانید” متخصصان نقد و بررسی ما همگی در

                                              سایت های شرط بندی معتبر ایرانی و خارجی مطمئن و نحوه انتخاب بهترین - شابتر
                                            • Speech API - 音声認識  |  Google Cloud Platform

                                              Try Gemini 1.5 models, the latest multimodal models in Vertex AI, and see what you can build with up to a 2M token context window Convert audio into text transcriptions and integrate speech recognition into applications with easy-to-use APIs. Get up to 60 minutes for transcribing and analyzing audio free per month.* New customers also get up to $300 in free credits to try Speech-to-Text and other

                                                Speech API - 音声認識  |  Google Cloud Platform
                                              • 動画からリアルタイムで顔認識する『Viewdle』 | 100SHIKI.COM

                                                なんだかすごそうなテクノロジーなので勢いでご紹介。 Viewdleでは映像からリアルタイムで顔認識を行う技術を開発しているようだ。 これが実現されれば、特定の人だけが映っている映像だけを検索する、といったことができそうだ。 今はユーザーがタグなどでつけている情報をもとに検索しているが、これならそうした手間がいらないだろう。 マッチングするデータベースが充実してくれば、動画共有サイトに導入されることもありうるかもしれない。 さまざまな可能性を秘めていると思うが、まずはこのサイトのトップページのデモを眺めてみよう。なにかアイディアが浮かんできそうでもある。

                                                  動画からリアルタイムで顔認識する『Viewdle』 | 100SHIKI.COM
                                                • 人間の脳は幽霊を見るようにできている。特に右脳を良く使う人は心霊現象を見やすいことが判明(スイス研究) : カラパイア

                                                  スイスのチューリヒ大学病院の神経心理学者ブルッガー氏の研究によると、幽霊を見たとか、超常現象を体験したと思い込む効果の多くが脳の右半球に関連していることが判明したそうだ。 実際に幽霊に遭遇するなどの心霊現象を体験したという人は多い。これはその人が嘘を言っているわけではなく、人間の脳がもともと超常現象などを見るようにできているためだそうだ。

                                                    人間の脳は幽霊を見るようにできている。特に右脳を良く使う人は心霊現象を見やすいことが判明(スイス研究) : カラパイア
                                                  • 画像認識技術のRiya、イメージ検索サービス「Like.com」をついに公開

                                                    あのGoogleが1度は買収に動いたといわれる画像認識技術のRiyaが画像(イメージ)をキーにした検索サービスの開発を計画という話については、以前にブログでお伝えした通りだが、この「Like.com」という新サービスのアルファ版がついに公開された。 この話を伝えるTechCrunchの記事には「はじめての本物の画像検索("First True Visual Image Search")」と書かれているが、これは、他の「画像検索」と称する各サービスが対象となる画像に付されたメタデータの文字情報を頼りに画像を見つけ出すのに対し、Like.comではメタデータのほか画像自体の(視覚的な)類似性を手がかりに検索する、ということを意味している。 現時点では、ジュエリー、シューズ、バッグ、洋服だけが検索の対象だが、同サイトではParis HiltonやJulia Roberts、Victoria Be

                                                      画像認識技術のRiya、イメージ検索サービス「Like.com」をついに公開
                                                    • Right Brain v Left Brain | Herald Sun

                                                      Please note that by blocking any or all cookies you may not have access to certain features, content or personalization. For more information see our Cookie Policy. To enable cookies, follow the instructions for your browser below. Facebook App: Open links in External Browser There is a specific issue with the Facebook in-app browser intermittently making requests to websites without cookies that

                                                      • 携帯に向ってレシートを読み上げるだけでデータ入力できる家計簿サイト『Expense』 | 100SHIKI.COM

                                                        携帯に向ってレシートを読み上げるだけでデータ入力できる家計簿サイト『Xpenser』 January 4th, 2008 Posted in 便利ツール(ウェブ) Write comment お小遣い帳なるものが使えたためしがない。どうにも入力が面倒だからだ。 最近は携帯からメールでちょこちょこと、といったツールもあるが、それでもなんだか億劫である。 そう考えるとXpenserの入力方法にはちょっと惹かれる。このサイト、いわゆる家計簿サイトであるが、データの入力にはメールやPC、IM以外にも音声まで使うことができる。 電話をかけて「牛乳 2ドル」といった具合にしゃべれば自動的に認識してデータを突っ込んでくれるというお手軽さだ。メールやウェブは面倒だが、帰宅後に携帯に向ってレシートを読み上げるぐらいならできそうである。 この音声認識にはJottというサイトの技術を使っているようだ。実際に使っ

                                                          携帯に向ってレシートを読み上げるだけでデータ入力できる家計簿サイト『Expense』 | 100SHIKI.COM
                                                        • Online OCR - FREE OCR PDF Document Scanner & Converter - Soda PDF

                                                          Once your PDF file has been created, access the online OCR file by downloading the PDF to your computer and viewing the OCR content within your document directly through your web browser. Once our software has output your new, editable PDF, you can then send your OCR document by sending & sharing the document with others through email. Did you know? OCR is a key tool for digitizing documents OCR s

                                                            Online OCR - FREE OCR PDF Document Scanner & Converter - Soda PDF
                                                          • 音声認識テキスト入力Javascriptライブラリ w3voiceIM.js

                                                            たった一行追加するだけで、あなたのサイトに音声認識機能を付けられます! w3voiceIM.jsは、Webページの上のテキスト入力フォームに音声認識機能を追加するJavascriptライブラリです。 手軽に音声認識を利用できることが特徴になっています。 また、http://w3voice.jp/でサービスする共有型音声認識エンジンを利用するために、利用者やWeb開発者は、音声認識プログラムのインストールや設定作業を必要としません。 JavaおよびJavascriptが動作するPC及びWebブラウザからの利用をサポートしています。 現在のバージョン 最新のw3voiceIM.jsのバージョンは0.02です。 とりあえず動くようになった開発途上バージョンです。 使い方 音声入力を開始するには、テキストの入力欄をマウスでダブルクリックします。 音声入力パネルが出現したら、「Push here」と

                                                            • Google Photosハンズオン:怖いくらい賢い

                                                              写真サービスの決定版となるか。 Google I/Oで、新たな写真管理サービスGoogle Photosが発表されました。米Gizmodoのマリオ・アギラー記者とブレント・ローズ記者によるファーストインプレッションは上々のようです。以下、見ていきましょう~。 僕は2014年5月28日から今まで、1年で1235枚の写真を撮ったらしいです。そのほとんどは今後見ることもないと思います。良い写真があったとしても、多分見ないと思います。だって、僕という人間の脳が消化できないくらいたくさんあるからです。でも、Google Photosがそれを助けてくれるんでしょうか? Google Photosは、今回のGoogle I/Oで発表された新サービスの中でももっとも面白そうなものです。惹かれる部分は、写真と動画用の容量無制限のストレージであり、大量の写真を見やすくしてくれるUIの小技であり、そして多分一番

                                                                Google Photosハンズオン:怖いくらい賢い
                                                              • 最近の物体検出 2019/05/30

                                                                最近の物体検出 2019/05/30 1. 最近の物体検出 2019/05/30 2. お品書き •イントロ • 歴史の振り返り •最近の動向 • キーポイント系 • multi-scale対応 3. イントロ 4. https://twitter.com/RUSH1L/status/889963452143357952/photo/1https://www.youtube.com/watch?v=VOC3huqHrss 5. MegDet 詳細不明 (ensemble) 52.5 SNIP (R-FCN, DPN-98, DCN) (ensemble) 48.3 Mask R-CNN ResNeXt-152 32x8d CornerNet Hourglass-104 SNIPER (Faster R-CNN, R-101, DCN) NAS-FPN RetinaNet, AmoebaNe

                                                                  最近の物体検出 2019/05/30
                                                                • サポートベクターマシン入門

                                                                  次へ: はじめに サポートベクターマシン入門 栗田 多喜夫 Takio Kurita 産業技術総合研究所 脳神経情報研究部門 Neurosceince Research Institute, National Institute of Advanced Indastrial Science and Technology takio-kurita@aist.go.jp visitors since Jul. 19, 2002. 概要: 最近、サポートベクターマシン(Support Vector Machine, SVM)と呼ばれるパター ン認識手法が注目されており、ちょっとしたブームになっている。カーネルトリッ クにより非線形の識別関数を構成できるように拡張したサポートベクターマシン は、現在知られている多くの手法の中でも最も認識性能の優れた学習モデルの一 つである。サポートベクターマ

                                                                  • 認知負荷は「ワーキングメモリに対する負荷」のこと 認知科学の観点から課題を整理すると“つらい”の輪郭が見えてくる

                                                                    「Developers Meetup 急成長ベンチャーが向き合う『開発生産性』」は、開発組織や事業フェーズの異なる株式会社Another works・株式会社SmartHR・株式会社スタメンの3社が、開発生産性について語り尽くすイベントです。ここで株式会社SmartHRのすがわらまさのり氏が登壇。チーム増加に伴い起きた「認知負荷が高い」状況をどのように解決したかについて紹介します。 チームの増加に伴いできるようになったこと、やりにくくなったこと すがわらまさのり氏:ここから本題ですね。「開発生産性について、上から見るか、下から見るか」ということで、よろしくお願いします。過去に私が登壇したもので似たテーマがいくつかあるので、軽く紹介しておきます。もし気になる方がいれば後で見てください。 前提の共有というところで、先ほどもお話ししたように、私が担当したのは「SmartHR」の基本機能というプロ

                                                                      認知負荷は「ワーキングメモリに対する負荷」のこと 認知科学の観点から課題を整理すると“つらい”の輪郭が見えてくる
                                                                    • リモコンはオワコン。音声認識でお部屋の家電を操作してみた。 - 凹みTips

                                                                      はじめに 本エントリは未来のお部屋シリーズの第4弾です。 本シリーズでは、音声認識システムの Julius と TCP/IP 通信で制御できる赤外線学習リモコン iRemocon を繋いで音声認識による家電操作の実現を目指しています。 ついに!音声認識でお部屋の家電を操作できましたので、ご紹介します。 環境 Ubuntu 10.04 Boost 1.48.0 gcc version 4.6.1 20110617 (prerelease) (GCC) Julius grammar-kit-v4.1 iRemocon 集音マイク×2 (2分岐) 構成 動作構成は以下になります。 マクロ実行部は iRemocon 以外の何か操作も出来るようにしようと思ってますが、未実装です。 ソースコード 各ソースコードは github に上げました。 https://github.com/hecomi/Jul

                                                                        リモコンはオワコン。音声認識でお部屋の家電を操作してみた。 - 凹みTips
                                                                      • Speech-to-Text Webcam Overlay

                                                                        *認識結果が確定したタイミングで反映されます。テキストの編集・コピーも可能です。 **認識中にEnterキーを押すと,認識を止めて文を区切ることができます。日本語の場合は文末に句点が付与されます。 よくある質問・ソースコード: GitHub 音声認識は Web Speech API を利用しています。 カメラやマイクが機能しないとき → ページの再読み込みや,ブラウザの設定を確認してください: Chrome ヘルプ 「ログをダウンロード」でダウンロードされるファイルは,アクセスしているユーザーのブラウザで生成されています。

                                                                          Speech-to-Text Webcam Overlay
                                                                        • ReazonSpeech - Reazon Human Interaction Lab

                                                                          ReazonSpeech¶ ReazonSpeechは、世界最大のオープン日本語音声コーパスを構築するプロジェクトです。 日本語音声技術の推進を目的として、35,000時間の日本語音声コーパスを公開しています。 音声認識モデル・コーパス作成ライブラリをオープンソースライセンスで配布しています。

                                                                          • Amazon.co.jp: フリーソフトでつくる音声認識システム パターン認識・機械学習の初歩から対話システムまで: 荒木雅弘: 本

                                                                              Amazon.co.jp: フリーソフトでつくる音声認識システム パターン認識・機械学習の初歩から対話システムまで: 荒木雅弘: 本
                                                                            • Clarifai, the AI Workflow Orchestration Platform

                                                                              WEBINAR | AI Prototype to Production: Operationalizing and Orchestrating AI

                                                                                Clarifai, the AI Workflow Orchestration Platform
                                                                              • 自動タギングを可能にする高度な画像認識のWebサービスAPI『ReKognition』

                                                                                自動タギングを可能にする高度な画像認識のWebサービスAPI『ReKognition』 『ReKognition API』は指定画像の内容を認識/判断し、その画像が何であるかを自動検出するテクノロジーを用いた統合的なWebサービスAPI。 PHP, iOS, Androidなど各種SKDとしても提供されており様々なプロジェクトやアプリ開発で利用することができます。 先ずはデモが用意されているのでそちらを見てもらうと分りますが、画像認識のタイプとしては大まかに画像の内容物を検出する「オブジェクト認識」と人間の顔を検出する「顔認識」の2種類があります。 「オブジェクト認識」はその画像内に含まれる物体や背景を認識して、それに該当する可能性の高いキーワードを列挙していきます。 一方、「顔認識」の方は単に顔の検出だけでなく、顔の各パーツを検知して性別や年齢あるいは表情から読み取れる感情までも検出する

                                                                                  自動タギングを可能にする高度な画像認識のWebサービスAPI『ReKognition』
                                                                                • xThink Online Calculator (beta)