並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 34765件

新着順 人気順

recognitionの検索結果281 - 320 件 / 34765件

  • Introducing OpenAI

    OpenAI is a non-profit artificial intelligence research company. Our goal is to advance digital intelligence in the way that is most likely to benefit humanity as a whole, unconstrained by a need to generate financial return. Since our research is free from financial obligations, we can better focus on a positive human impact. OpenAI is a non-profit artificial intelligence research company. Our go

      Introducing OpenAI
    • Deep Learning のトレンドについて喋ってきた

      Convolutional Neural NetworksのトレンドについてCasualじゃない話をしてきました. 全脳アーキテクチャ若手の会カジュアルトーク 全脳アーキテクチャ若手の会カジュアルトーク というところでお話をしてきました. ちょっと層がわからなかったのですが,IT系のエンジニアの方が多かったみたいです. (学生は4人くらい…?しかもほぼ身内) 僕のスライドはSlide Shareの方にアップロードされています. しかも,映像もアップロードされていた… 発表後記 実際はConvolutional Neural Networks(CNN)系論文128本ノックにするつもりだったとはいえない空気でしたね… 個人的には画像生成やキャプション生成系の研究速度はとても速く進んでいると感じています. Visual Turing Test の話はもう少し掘り下げたかったですね. Deep M

      • ロボティクスを学ぶのにおすすめの書籍・資料 - MyEnigma

        確率ロボティクス (プレミアムブックス版)posted with カエレバSebastian Thrun,Wolfram Burgard,Dieter Fox マイナビ出版 2016-09-21 Amazonで探す楽天市場で探すYahooショッピングで探す 目次 目次 はじめに 『Probabilistic Robotics』(確率ロボティクス) Sebastian Thrun 他 『パターン認識と機械学習』C.M. ビショップ 『Principles of Robot Motion: Theory, Algorithms, and Implementations』Howie Choset 『マンガでわかる統計学シリーズ』高橋 信 『図解・ベイズ統計「超」入門』涌井 貞美 『プログラミングのための確率統計』平岡 和幸,堀 玄 『Introduction to Applied Linear

          ロボティクスを学ぶのにおすすめの書籍・資料 - MyEnigma
        • 大規模画像認識とその周辺

          Image net classification with Deep Convolutional Neural NetworksShingo Horiuchi

            大規模画像認識とその周辺
          • OpenAIのBatch APIを使ってお得にプロンプトを一括処理してみる - Taste of Tech Topics

            はじめに こんにちは。データサイエンスチームYAMALEXのSsk1029Takashiです。 最近はOpenAIに日本支社が出来て、日本語対応が加速するというニュースにわくわくしています。 今回はそんなOpenAIから発表されたBatch APIという機能が便利、かつお得な機能だったのでどのように使えるのか試してみます。 Introducing the Batch API: save costs and get higher rate limits on async tasks (such as summarization, translation, and image classification). Just upload a file of bulk requests, receive results within 24 hours, and get 50% off API pri

              OpenAIのBatch APIを使ってお得にプロンプトを一括処理してみる - Taste of Tech Topics
            • Shapecatcher: Draw the Unicode character you want!

              You need to find a specific Unicode character? With Shapecatcher.com you can search through a database of characters by simply drawing your character into a box. It can find the most similar character shapes for your drawing.

              • Books for MacOS X

                Books problems? Check that your QuickTime is up to date I’ve been getting some reports about Books not starting on 10.4.11 systems. If you’re experiencing these problems, please check that your QuickTime is completely up to date. If you’re running an sufficiently old version of Quicktime, Books will not start. Posted by Chris Karr on September 30th, 2008 | No Comments » Books 3.2.1 Books 3.2.1 is

                • GitHub - ripienaar/free-for-dev: A list of SaaS, PaaS and IaaS offerings that have free tiers of interest to devops and infradev

                  Developers and Open Source authors now have many services offering free tiers, but finding them all takes time to make informed decisions. This is a list of software (SaaS, PaaS, IaaS, etc.) and other offerings with free developer tiers. The scope of this particular list is limited to things that infrastructure developers (System Administrator, DevOps Practitioners, etc.) are likely to find useful

                    GitHub - ripienaar/free-for-dev: A list of SaaS, PaaS and IaaS offerings that have free tiers of interest to devops and infradev
                  • Tachiagare.com is available at DomainMarket.com

                    What's in your Domain Name? Print This domain name will potentially help you bring in more customers and profits every day, as the domain itself goes up in value. A super premium .Com domain name from DomainMarket.com means instant branding, search engine, and marketing benefits. We make it safe, easy and affordable for you to own Tachiagare.com right away. Click here to purchase Tachiagare.com Do

                      Tachiagare.com is available at DomainMarket.com
                    • Neural networks and deep learning

                      Neural Networks and Deep Learning What this book is about On the exercises and problems Using neural nets to recognize handwritten digits How the backpropagation algorithm works Improving the way neural networks learn A visual proof that neural nets can compute any function Why are deep neural networks hard to train? Deep learning Appendix: Is there a simple algorithm for intelligence? Acknowledge

                        Neural networks and deep learning
                      • arXiv.org e-Print archive

                        arXiv is a free distribution service and an open-access archive for nearly 2.4 million scholarly articles in the fields of physics, mathematics, computer science, quantitative biology, quantitative finance, statistics, electrical engineering and systems science, and economics. Materials on this site are not peer-reviewed by arXiv. Subject search and browse: Physics Astrophysics (astro-ph new, rece

                        • Google Document の音声認識入力が思ってたよりすごかった - mizchi's blog

                          はいえーとあの google の音声入力のテストをやってみてるんですけどこれめっちゃすごいですねなんかここまで認識精度良いと思わなかったあの文字の改行とかそこだけちょっと自分でやんないといけないんですけどそれ以外は全然不満がないですねこれなにかコマンドとかあるのかなやそうでもないか何がやりたいかというと discord でちょっと仕事で使ってみたくてボイスチャットチャンネルに没頭*1参加させて録音させてそのデータを google のドキュメントとして音声で食わせて文字起こしさせればあの会議とかねリモートワークとかですごい便利なんじゃないかなと思って文字認識 api ってちょっと公開されてるかわかんないんだけどこういう api って google あんまりね有料 api 脱退後悔*2しきれなかったりっていうイメージあるんだよねまあ google ドキュメントを使わせるためのインセンティブやっ

                            Google Document の音声認識入力が思ってたよりすごかった - mizchi's blog
                          • Open Source Templates | Free CSS and XHTML Website Templates

                            Open Source Website Templates brings you some of the best designers to showcase their free website template designs. Our Mission at Open Source Website Templates is to provide the highest quality, carefully selected free CSS and XHTML web templates available for your use. We encourage the use of our templates for business, personal, and non-profit websites. Because of our love for the environment

                            • CIMAM(国際美術館会議)が「表現の不自由展・その後」について声明文を発表。「表現の自由が完全に損なわれている」

                              CIMAM(国際美術館会議)が「表現の不自由展・その後」について声明文を発表。「表現の自由が完全に損なわれている」ICOM(国際博物館会議)の提携組織であるCIMAM(国際美術館会議)が、「あいちトリエンナーレ2019」の一企画である「表現の不自由展・その後」の展示中止に対し、声明文を発表した。 愛知芸術文化センター ICOM(International Council of Museums 国際博物館会議)の提携組織であるCIMAM(International Committee for Museums and Collections of Modern Art 国際美術館会議)が、「あいちトリエンナーレ2019」内の「表現の不自由展・その後」展示中止に対し、声明文を発表した(全文は記事末尾に掲載)。名義はCIMAMの美術館監視委員会(The Museum Watch Committee

                                CIMAM(国際美術館会議)が「表現の不自由展・その後」について声明文を発表。「表現の自由が完全に損なわれている」
                              • 「Mobageの大規模データマイニング」- #PRMU 2011 Big Data and Cloud で講演してきました - hamadakoichi blog

                                電子情報通信学会「パターン認識とメディア理解研究会 (PRMU: Pattern Recognition and Media Understanding)」@幕張メッセ国際会議場 で招待講演をしてきました。 「Mobageの大規模データマイニング」に関して、話しています。 Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop View more presentations from Koichi Hamada 2900万人以上の登録会員をかかえるモバイルソーシャルゲームプラットフォーム「Mobage」では、1日20億超の行動情報が蓄積されています。これらの大規模行動データを対象に、データマイニング・機械学習の各種方法論を適用することにより、隠された法則を解明・より良い解を導出し、迅速なサービス洗

                                  「Mobageの大規模データマイニング」- #PRMU 2011 Big Data and Cloud で講演してきました - hamadakoichi blog
                                • メンタルレキシコンとは?わかりやすく解説・心理学との関係 英語学習への効果とは? - ポリグロットライフ | 言語まなび∞ラボ

                                  はじめに 今回はメンタルレキシコンについてわかりやすく解説していきます。メンタルレキシコンとは、どのような意味や性質を持ち、学ぶ意義は何なのかを考えていきます。心理学との関係や英語学習及び語彙学習への効果についても考えていきます。メンタルレキシコンを正しく理解して、正しい効率的な語彙学習をぜひ取り入れてみてください。 ↓↓第二言語習得研究に基づく英語学習動画をアップしていきます。 www.youtube.com メンタルレキシコンとは? メンタルレキシコンの意味 メンタルレキシコンの性質 メンタルレキシコンを学ぶ意義 メンタルレキシコン内の語彙知識モデル 階層的ネットワークモデル 活性化拡散モデル 母国語のメンタルレキシコン 子供の語彙の増加 即時マッピング 第二言語学習への示唆 バイリンガルの語彙発達 バイリンガルの言語的特徴 バイリンガルレキシコン メンタルレキシコンと心理学 二重符号

                                    メンタルレキシコンとは?わかりやすく解説・心理学との関係 英語学習への効果とは? - ポリグロットライフ | 言語まなび∞ラボ
                                  • CUBOCC

                                    Projects featured in the reel above include our work for: Absolut, Beats, Becks, Chivas Regal, Corona, Danone, Dove, Guaraná Antarctica, Heinz, Nestlé, PUC, Riachuelo, Seda, Spotify, Stella Artois, Unilever and VoteLGBT. ‍ Soko is an independent agency that creates brand stories connected to culture and society, generating earned media. Soko's work has been awarded and recognized by The One Show,

                                      CUBOCC
                                    • kikulog

                                      kikulog 記事一覧 カテゴリー別記事一覧201410 2014/10/22 江本勝氏の死去 201409 2014/09/12 生協の「書評対決」の書評 201407 2014/07/04 「いちから聞きたい放射線のほんとう」サポートページ 201406 2014/06/04 「いちから聞きたい放射線のほんとう」訂正箇所 201404 2014/04/23 朝日新聞に書評が出るようです [kikulog 647] 2014/04/09 理研CDBの騒動について [kikulog 646] 2014/04/07 博士論文中での剽窃について [kikulog 645] 201403 2014/03/17 「いちから聞きたい・・」のあとがき [kikulog 644] 2014/03/03 論文: Structural flexibility of intrinsically disord

                                      • 22個の便利APIがマイクロソフトから公開されたよ! - はつねの日記

                                        https://www.microsoft.com/cognitive-services/en-us/sign-up Cognitive Serviceって何かといえば、人間の言語で人と対話して意思決定のサポートをするようなサービス。 もっと簡単にいえば、ハッカソンとかで使えばいい感じのハックができるサービス。 つまりは、これを知っているかいないかでハッカソンで作れるアプリが雲泥の差になる可能性のあるAPI。 今回公開されたのは次の22個。過去にFace APIとかSpeech APIとか公開はされていたけどどーんと22個。 Computer Vision Emotion Face Video Speech ? Custom Speech Recognition Speaker Recognition Speech Bing Spell Check Language Understandi

                                          22個の便利APIがマイクロソフトから公開されたよ! - はつねの日記
                                        • 情報処理から見た錯視・東北大学情報科学研究科にて・2008年

                                          情報処理から見た錯視 東北大学情報科学研究科・2008年1月9(水)10:30-12:00 坪川宏先生ご企画 北岡 明佳(立命館大学 文学部 心理学専攻) email 2008/1/5より 錯視(visual illusion)とは視覚性の錯覚のことであり、錯覚(illusion)とは実在する対象の真の特性とは異なる知覚のことである。 このように、錯視の定義は簡単なのだが・・・ 本日のメニュー 顔ガクガク錯視 視線方向の錯視 顔の幾何学的錯視 顔ガクガク錯視 「『顔ガクガク錯視』はさかさま顔では弱い」 左図を見ると、4つ目で口が2つの女性というよりは、観察者の目が落ちつかないかのように、図がガクガクして見える。 すみませーん、この錯視、名前はありますか? 知っている方は文献を教えて下さい。 →北岡にメールする  この「顔ガクガク」錯視は、さかさま顔では弱い(右図)ので、顔特有の錯視であろう

                                          • Google Glassで目の前の人を自動で顔認識しリアルタイムに情報が見える「NameTag」

                                            顔認識機能を使ってスキャンした写真からその人の情報をデータベースから取得できるサービス「NameTag」が、Google Glassに対応しました。Google GlassでNameTagアプリを使うことで、会話している目の前の人物のSNSやLinkedInの情報や犯罪歴に至るまでさまざまな情報をリアルタイムで知ることができます。 NameTag App | Your Photo Shares You | Powered by the FacialNetwork.com http://www.nametag.ws/ Google Glass real-time facial recognition arrives with “NameTag” - SlashGear http://www.slashgear.com/google-glass-real-time-facial-recogni

                                              Google Glassで目の前の人を自動で顔認識しリアルタイムに情報が見える「NameTag」
                                            • Free Online OCR

                                              Convert scanned images into editable text. Free Online OCR is a free service that allows you to easily convert scanned documents, PDFs, scanned invoices, screenshots and photos into editable and searchable text, such as DOC, TXT or PDF. The service is completely free and you don't need to register or install anything on your computer. Just select an image file and click Convert. You can immediatel

                                              • Deep Learning ideas that have stood the test of time

                                                Deep Learning is such a fast-moving field and the huge number of research papers and ideas can be overwhelming. The goal of this post is to review ideas that have stood the test of time. These ideas, or improvements of them, have been used over and over again. They’re known to work. If you were to start in Deep Learning today, understanding and implementing each of these techniques would probably

                                                • Face.com

                                                  出售 For SaleFace.comCategory-defining domain available for crypto or cash. Contact to learn more.可以用加密貨幣或現金購買。聯繫了解更多。 Email [email protected]

                                                    Face.com
                                                  • 音声認識のしくみ

                                                    音声認識を紹介するページ とにかくここでは、 だらだらと「音声認識」というモノを紹介します。 全体が(ほぼ)このページ一枚に収まっています。 ところどころにリンクがありますが、 そのリンク先には、 難しい話やこぼれ話みたいなものがちょこちょことあります。 ところで、話を簡単にするために、 ちょっと嘘を混ぜています。 そうでないと、ものすごく複雑な話になるので。 音声認識ってなにさ 簡単に言ってしまえば、 人間が喋った声を機械が文字に直すことです。 図で描くとこんな感じです。 左側が音声波形(つまり、声を図に表している)で、 右側がそれをひらがなに直したものです。 左側の音声波形を少し詳しく見てみる 人間は耳で音を聞きますが、 機械はマイクで音を聞きます。 そして、マイクで収録された音をそのまま表示させると、 下のような感じになります。 横軸が時刻で、縦軸が振幅です。 音声というのは、ようす

                                                    • カプセルネットワークはニューラルネットワークを超えるか。 - Qiita

                                                      先日、こんな記事が上がっていました。 グーグルの天才AI研究者、ニューラルネットワークを超える「カプセルネットワーク」を発表 中々刺激的なタイトルですね。 ニューラルネットワークといえば、近年の機械学習分野を支える最も大きな技術の一つであると言えます。そんなニューラルネットワークを超えたカプセルネットワークとは一体何なのでしょうか。また、本当にニューラルネットワークを超えたのでしょうか。 本記事では、カプセルネットワークの仕組みを理解することで、従来のニューラルネットワークとの違いを比較していきます。 CNN カプセルネットワークに触れるにあたり、まず畳み込みニューラルネットワーク(Convolutional Neural Network; CNN)について理解しなければなりません。なぜなら、カプセルネットワークは、CNNをベースとして、CNNの欠点を克服するために生まれたモデルだからです

                                                        カプセルネットワークはニューラルネットワークを超えるか。 - Qiita
                                                      • 飛行機の搭乗券に印刷されたバーコードを読み取ると個人情報など意外にも多くの情報が書かれていた

                                                        近年ではスマートフォンや手首に付けたスマートウォッチをかざして飛行機に搭乗できる「チケットレス」サービスを利用する人も多くなったと思いますが、今でも横長の厚紙に印刷されたボーディングパス(搭乗券)を受け取っている人もいるはず。何気なく手にして、フライト後はポイと捨ててしまう搭乗券ですが、実は記載されているバーコードには多くの情報が含まれている点には注意が必要なようです。 What’s in a Boarding Pass Barcode? A Lot — Krebs on Security http://krebsonsecurity.com/2015/10/whats-in-a-boarding-pass-barcode-a-lot/ 飛行機に乗ったことがある人の多くは、このような横長のボーディングパスを受け取ったことがある人も多いはず。かつては厚手の丈夫な紙が使われていましたが、近年で

                                                          飛行機の搭乗券に印刷されたバーコードを読み取ると個人情報など意外にも多くの情報が書かれていた
                                                        • kikulog

                                                          kikulog 記事一覧 カテゴリー別記事一覧201410 2014/10/22 江本勝氏の死去 201409 2014/09/12 生協の「書評対決」の書評 201407 2014/07/04 「いちから聞きたい放射線のほんとう」サポートページ 201406 2014/06/04 「いちから聞きたい放射線のほんとう」訂正箇所 201404 2014/04/23 朝日新聞に書評が出るようです [kikulog 647] 2014/04/09 理研CDBの騒動について [kikulog 646] 2014/04/07 博士論文中での剽窃について [kikulog 645] 201403 2014/03/17 「いちから聞きたい・・」のあとがき [kikulog 644] 2014/03/03 論文: Structural flexibility of intrinsically disord

                                                          • سایت های شرط بندی معتبر ایرانی و خارجی مطمئن و نحوه انتخاب بهترین - شابتر

                                                            این لیست نهایی بهترین سایت های شرط بندی در این تجارت است. ما هر یک از این سایت ها را تحت یک روند دقیق بررسی قرار داده ایم، و همه آنها امتیازات بالایی را در معیارهای اصلی کسب کرده اند. شما می توانید در هر یک از این سایت های شرط بندی ثبت نام کرده و مطمئن باشید که آنها سابقه طولانی در پرداخت سریع، رفتار عادلانه با مشتری و ایمن نگه داشتن اطلاعات شما دارند. ”بیشتربخوانید” متخصصان نقد و بررسی ما همگی در

                                                              سایت های شرط بندی معتبر ایرانی و خارجی مطمئن و نحوه انتخاب بهترین - شابتر
                                                            • Why .TV | Bassir.io

                                                              .TV domain names are highly valuable to media networks that prioritize content creation because they offer a unique and specific online presence. The .TV extension explicitly signifies a platform for audio-visual content, making it a natural fit for media networks looking to showcase their multimedia offerings. It provides a clear and concise branding opportunity that immediately communicates the

                                                                Why .TV | Bassir.io
                                                              • ディープラーニングは儲けてなんぼ! エンドユーザの付加価値を考えろ!松尾豊氏 | AI専門ニュースメディア AINOW

                                                                最終更新日: 2019年7月10日 2019年6月8日、MicrosoftとPreferred Networksが協同で運営するディープラーニングのコミュニティ「DEEP LEARNING LAB(DLLAB)」が2周年記念のイベントを開催しました。 今回は東京大学大学院 教授で日本ディープラーニング協会理事長の松尾豊氏による基調講演の内容をお伝えします。 松尾氏は、ディープラーニングのビジネス活用において「儲かること」はとても重要で、そのためにユーザにしっかり付加価値を与えていかなければいけないと強調しました。 ビジネスになっていないディープラーニング 松尾教授は、まずはディープラーニングの技術が、事例が増える勢いに対してビジネスになっていないとディープラーニングの現状を振り返ります。 そこで、インターネットが誕生した当時と振り返りながら、ディープラーニングの活用が進んでいないことは、単

                                                                  ディープラーニングは儲けてなんぼ! エンドユーザの付加価値を考えろ!松尾豊氏 | AI専門ニュースメディア AINOW
                                                                • Everything you ever wanted to know about Twitter | Charles Curle Design

                                                                  This is a comprehensive list of websites, applications and tutorials for Twitter. If there is anything you ever wanted to know or learn about Twitter, you will find it here.Charles Curle Design Web Design | Search Engine Optimization (SEO) | Graphic Design | Logo Design ~140 Characters 140it - Makes Your Tweet Less Than 140 Characters Tweetcontd - More than 140 characters Twonvert - Convert your t

                                                                  • opencv.jp - OpenCV-1.0 リファレンス マニュアル(日本語訳)-

                                                                    最終変更者: 怡土順一, 最終変更リビジョン: 467, 最終変更日時: 2009-06-23 14:23:34 +0900 (火, 23 6月 2009) CXCORE リファレンス マニュアル 基本構造体(Basic Structures) 配列操作(Operations on Arrays) 初期化(Initialization) 要素へのアクセスと部分配列(Accessing Elements and sub-Arrays) コピーと充填(Copying and Filling) 変形と置換(Transforms and Permutations) 四則演算,論理演算,比較演算(Arithmetic, Logic and Comparison) 統計(Statistics) 線形代数(Linear Algebra) 数学関数(Math Functions) 乱数生成(Random

                                                                    • Speech API - 音声認識  |  Google Cloud Platform

                                                                      Try Gemini 1.5 models, the latest multimodal models in Vertex AI, and see what you can build with up to a 2M token context window Convert audio into text transcriptions and integrate speech recognition into applications with easy-to-use APIs. Get up to 60 minutes for transcribing and analyzing audio free per month.* New customers also get up to $300 in free credits to try Speech-to-Text and other

                                                                        Speech API - 音声認識  |  Google Cloud Platform
                                                                      • それで、「MCSの本物の性質が認識されている公式な報告書」って、どれ? - NATROMのブログ

                                                                        代替医療を提唱・実践する組織が、○○医学協会、○○学会、○○研究所、○○医学センターなどを名乗ることがある。慣れない人が公的な組織であると誤解することもあるだろうが、名乗るのは自由である。また、代替医療の組織が医学雑誌を発行することも自由である。組織外のメンバーに読まれるかどうかはともかくとして、論文のようなものを掲載すれば医学雑誌のように見える。なんならグループ内部で査読したことにしてもいい。 たとえばの話、日本ホメオパシー医学協会*1が、見た目の体裁だけは整った医学雑誌を発行することもできる。そのような雑誌に載った総説に「複数の公的な報告書がホメオパシーの有効性を科学的に認めている」と書いてあったとして、読者らは信じるだろうか? さて、sivad氏は、「もう少し新しい知見を追いましょうね」として、イギリス・アレルギー環境栄養医学協会(BSAENM)の報告書(以下BSAENM報告書)を引

                                                                          それで、「MCSの本物の性質が認識されている公式な報告書」って、どれ? - NATROMのブログ
                                                                        • 畳み込みニューラルネットワークの最新研究動向 (〜2017) - Qiita

                                                                          昨年に引き続きDeep Learningやっていき Advent Calendar 2017の25日目の滑り込み記事で,畳み込みニューラルネットワークの歴史および最新の研究動向についてのサーベイです.2017年12月のPRMU研究会にて発表した,畳み込みニューラルネットワークについてのサーベイをベースに追記を行ったものになります. はじめに 畳み込みニューラルネットワーク (Convolutional Neural Networks; CNN) (以降CNN)は,主に画像認識に利用されるニューラルネットワークの一種である.CNNの原型は,生物の脳の視覚野に関する神経生理学的な知見1を元に考案されたNeocognitron2に見ることができる.Neocognitronは,特徴抽出を行なう単純型細胞に対応する畳み込み層と,位置ずれを許容する働きを持つ複雑型細胞に対応するpooling層とを交互

                                                                            畳み込みニューラルネットワークの最新研究動向 (〜2017) - Qiita
                                                                          • 音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day

                                                                            OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。 配信中のpodcast番組 白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。 最初に結論 インストール 実行方法 結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果 まとめ 追記 カタカナ英語 完全制覇 whisperくん せんでんせんでん 最初に結論 whisperは異なるモデルサイズが5種が利用可能であ

                                                                              音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
                                                                            • スマートスピーカーはブロガーをやさしく殺す - おまきざるの自由研究

                                                                              音声検索はますます増える スマートスピーカーは人々をキーボードとモニターから解放する 普及は容易だ そしてブロガーはいなくなった 音声検索はますます増える 飛ぶ鳥落とす勢いの俳優を一人だけあげろと言われたら,自分なら菅田将暉をあげる. そんな菅田将暉のデビュー作は『仮面ライダーW』のフィリップ役,彼単独の決め台詞は「さあ,検索をはじめよう」だった. 仮面ライダーW(ダブル) メディア: Amazonビデオ この商品を含むブログを見る 検索するとき,たいていはブラウザの検索窓に文字を打ち込む必要がある. いや,ここは必要が「あった」と言うべきだろう.今やスマホやMacやPCに向かって「Hey, Siri」[1]もしくは「OK, Google」[2]と話しかければ音声で答えてくれるのだから. 『仮面ライダーW』の放送は2010年,それからわずか数年で時代はフィリップに追いついたのだ. ちなみに

                                                                                スマートスピーカーはブロガーをやさしく殺す - おまきざるの自由研究
                                                                              • 効率的な教師データ作成(アノテーション)のための研究サーベイ - ABEJA Tech Blog

                                                                                どうも緒方@conta_です。 みなさんAI頑張ってますか? きっと昼はGPUサーバーを回して、夜は結果待ちでビールサーバーを回してる人が多いことでしょう。 機械学習を実際のプロダクトに活用する場合、自分が解きたいタスクがそのままオープンなデータセットで解決できることは少ないので、まず最初に課題となるのはデータセット作成です。 実際にカメラやセンサーを取り付けて収集したり、Webからクローリングしてきたり、事業会社であれば自社のデータセットに教師ラベルをつけることで新しいタスクに取り組むことが可能になるでしょう。 よく疑問になるポイントとして、データセットの量と質は、多ければ多いほど良く、高品質であれば高品質であるほど良いのですが教師データを作成するのは一苦労です。 *下記アノテーションの量や質について実験した結果がまとまってます tech-blog.abeja.asia もちろん少数デー

                                                                                  効率的な教師データ作成(アノテーション)のための研究サーベイ - ABEJA Tech Blog
                                                                                • ホメオパシーによる児童虐待の件

                                                                                  kikulog 記事一覧 カテゴリー別記事一覧201410 2014/10/22 江本勝氏の死去 201409 2014/09/12 生協の「書評対決」の書評 201407 2014/07/04 「いちから聞きたい放射線のほんとう」サポートページ 201406 2014/06/04 「いちから聞きたい放射線のほんとう」訂正箇所 201404 2014/04/23 朝日新聞に書評が出るようです [kikulog 647] 2014/04/09 理研CDBの騒動について [kikulog 646] 2014/04/07 博士論文中での剽窃について [kikulog 645] 201403 2014/03/17 「いちから聞きたい・・」のあとがき [kikulog 644] 2014/03/03 論文: Structural flexibility of intrinsically disord