並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 1776件

新着順 人気順

recognitionの検索結果41 - 80 件 / 1776件

  • OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる

    OpenAIがSpeech-To-Text AIのWhisperを発表しました。Githubからpipでインストールすれば簡単に使えます。私のM1 Max MacBook Proでも動作しましたので、作業内容を書いておきます。 GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Robust Speech Recognition via Large-Scale Weak Supervision – GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Python仮想環境を作る Python自体のインストールは既に終わっているところから書くことにします。私の環境は

      OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる
    • 【Streamlitよりいいかも?】機械学習系のデモアプリ作成に最適!Gradio解説 - 学習する天然ニューラルネット

      はじめに Streamlit vs Gradio Gradioの設計思想 Interface 入出力に応じたUI Interface String Shortcut 入力データのサンプルのセット ドキュメンテーション テーマの変更 タイムアウトへの対処 中級者への第一歩、デモを作る際に知っておきたい処理 Gradioが担当する前処理について プログレスバー もろもろの出力結果を保存するには? 認証認可(というか認可) その他、解説しないが需要の有りそうなもの まとめ 追記 : 動画になりました。 はじめに 機械学習系のデモアプリを作成することがしばしばありStreamlitを使用していたが、パラメーターなどをいじるたびに処理が最初から走るなどといった挙動に悩まされていた。 同僚がGradioというのを使っていたのでサーベイがてらメモしていたらブログが出来上がってしまった。 本ブログでは、G

        【Streamlitよりいいかも?】機械学習系のデモアプリ作成に最適!Gradio解説 - 学習する天然ニューラルネット
      • 物体認識モデルYOLOv3を軽く凌駕するYOLOv4の紹介 - ほろ酔い開発日誌

        はじめに 先月、YOLOv4が公開されました。位置づけとしては、物体認識のポピュラーなモデルの1つであるYOLO系統の最新版となります。結果がすごいのはぱっと見分かりましたし、内容も既存の手法をサーベイ・実験頑張って、精度上げていったんだなあくらいのさら読みはしていましたが、もう少しちゃんと読んでおこうと思い、読んでみたので紹介します。 私自身は物体認識の研究者というわけではないですが、なんだかんだ物体認識周りの記事をいくつか書いているので興味のある方は以下もご参照下さい。 note.com note.com [DL輪読会]Objects as Points from Deep Learning JP www.slideshare.net さて、このYOLOv4ですが、元々のYOLOの作者であるJoseph Redmon氏は著者ではありません。Jeseph Redmon氏は研究の軍事利用や

          物体認識モデルYOLOv3を軽く凌駕するYOLOv4の紹介 - ほろ酔い開発日誌
        • OpenAIのBatch APIを使ってお得にプロンプトを一括処理してみる - Taste of Tech Topics

          はじめに こんにちは。データサイエンスチームYAMALEXのSsk1029Takashiです。 最近はOpenAIに日本支社が出来て、日本語対応が加速するというニュースにわくわくしています。 今回はそんなOpenAIから発表されたBatch APIという機能が便利、かつお得な機能だったのでどのように使えるのか試してみます。 Introducing the Batch API: save costs and get higher rate limits on async tasks (such as summarization, translation, and image classification). Just upload a file of bulk requests, receive results within 24 hours, and get 50% off API pri

            OpenAIのBatch APIを使ってお得にプロンプトを一括処理してみる - Taste of Tech Topics
          • CIMAM(国際美術館会議)が「表現の不自由展・その後」について声明文を発表。「表現の自由が完全に損なわれている」

            CIMAM(国際美術館会議)が「表現の不自由展・その後」について声明文を発表。「表現の自由が完全に損なわれている」ICOM(国際博物館会議)の提携組織であるCIMAM(国際美術館会議)が、「あいちトリエンナーレ2019」の一企画である「表現の不自由展・その後」の展示中止に対し、声明文を発表した。 愛知芸術文化センター ICOM(International Council of Museums 国際博物館会議)の提携組織であるCIMAM(International Committee for Museums and Collections of Modern Art 国際美術館会議)が、「あいちトリエンナーレ2019」内の「表現の不自由展・その後」展示中止に対し、声明文を発表した(全文は記事末尾に掲載)。名義はCIMAMの美術館監視委員会(The Museum Watch Committee

              CIMAM(国際美術館会議)が「表現の不自由展・その後」について声明文を発表。「表現の自由が完全に損なわれている」
            • メンタルレキシコンとは?わかりやすく解説・心理学との関係 英語学習への効果とは? - ポリグロットライフ | 言語まなび∞ラボ

              はじめに 今回はメンタルレキシコンについてわかりやすく解説していきます。メンタルレキシコンとは、どのような意味や性質を持ち、学ぶ意義は何なのかを考えていきます。心理学との関係や英語学習及び語彙学習への効果についても考えていきます。メンタルレキシコンを正しく理解して、正しい効率的な語彙学習をぜひ取り入れてみてください。 ↓↓第二言語習得研究に基づく英語学習動画をアップしていきます。 www.youtube.com メンタルレキシコンとは? メンタルレキシコンの意味 メンタルレキシコンの性質 メンタルレキシコンを学ぶ意義 メンタルレキシコン内の語彙知識モデル 階層的ネットワークモデル 活性化拡散モデル 母国語のメンタルレキシコン 子供の語彙の増加 即時マッピング 第二言語学習への示唆 バイリンガルの語彙発達 バイリンガルの言語的特徴 バイリンガルレキシコン メンタルレキシコンと心理学 二重符号

                メンタルレキシコンとは?わかりやすく解説・心理学との関係 英語学習への効果とは? - ポリグロットライフ | 言語まなび∞ラボ
              • Deep Learning ideas that have stood the test of time

                Deep Learning is such a fast-moving field and the huge number of research papers and ideas can be overwhelming. The goal of this post is to review ideas that have stood the test of time. These ideas, or improvements of them, have been used over and over again. They’re known to work. If you were to start in Deep Learning today, understanding and implementing each of these techniques would probably

                • 音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day

                  OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。 配信中のpodcast番組 白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。 最初に結論 インストール 実行方法 結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果 まとめ 追記 カタカナ英語 完全制覇 whisperくん せんでんせんでん 最初に結論 whisperは異なるモデルサイズが5種が利用可能であ

                    音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
                  • Introducing the ChatGPT app for iOS

                    The ChatGPT app syncs your conversations, supports voice input, and brings our latest model improvements to your fingertips. Since the release of ChatGPT, we've heard from users that they love using ChatGPT on the go. Today, we’re launching the ChatGPT app for iOS. The ChatGPT app is free to use and syncs your history across devices. It also integrates Whisper, our open-source speech-recognition s

                      Introducing the ChatGPT app for iOS
                    • 【動画解説】2020年に読んだAI論文100本全部解説(俺的ベスト3付き) - Qiita

                      この記事は私, wataokaが1年間をかけて作り続けた超大作記事です. 総文字数は8万を超えていますので, お好みのところだけでもみていってください. ついにこの時が来ました!!!!! 1年間書き続けたQiita記事です!!!!! ご覧下さい!!!!!https://t.co/eKBwP1zoeB — 綿岡 晃輝 (@Wataoka_Koki) December 31, 2020 俺的ランキング 動画での解説も挑戦してみました! ぜひぜひご覧下さい! 動画のリンク 第3位: Likelihood-Free Overcomplete ICA and Applications in Causal Discovery wataokaの日本語訳「尤度が必要ない過完備ICAと 因果探索における応用」 - 種類: ICA - 学会: NeurIPS2019 - 日付: 20190904 - URL:

                        【動画解説】2020年に読んだAI論文100本全部解説(俺的ベスト3付き) - Qiita
                      • プログラミング初心者がKaggle Expertになるまでの10ヵ月間を振り返る - Qiita

                        Kaggle Expertになったので、イキってポエムを書こうと思いました。 AIに興味あるけどプログラミングすらできないんだよねという人向けの参考になれば幸いです。 1. 初期スペック (2019年2月) 機械工学系修士卒。よくいるメカニカルエンジニア 線形代数も統計も正直そんなに好きじゃない。力学の方が得意。 AI?あれでしょ。将棋超強いやつでしょ? パイソン?スト2のボクサーみたいなやつ? 2. 現在のスペック (2019年12月) Kaggle Expert (微妙?) 機械学習コンペでそれなりの成績 (Kaggle Kuzushiji Recognition 7th,Signate tellus 3rd 5th) 機械学習:なんとなくコーディングできる。 深層学習:なんとなくコーディングできる。 関連論文読める。簡単なものは実装できる。 業務適用も見えてきた 3. 機械学習を学ん

                          プログラミング初心者がKaggle Expertになるまでの10ヵ月間を振り返る - Qiita
                        • マスターアルゴリズム ー 世界を再構築する「究極の機械学習」

                          原著:ペドロ・ドミンゴス 翻訳:神嶌 敏弘 イラスト:六七質 出版社:講談社 発行日:2021-04-21 ISBN:978-4062192231 本書は,ペドロ・ドミンゴス著『The Master Algorithm』の翻訳書で,近年の人工知能技術の進展を支える機械学習についての解説書です.機械学習とは,作業手順を明示的に指示しなくても,それをデータから学ぶ能力を計算機に与える技術です.この機械学習について,計算機科学や統計学の高度な知識を前提とせずに,その内側に踏み込んで仕組みを明らかにし,この技術の可能性と課題を論じています. 出版社ホームページ 版元ドットコム Googleブックス ネット書店:Amazon 楽天ブックス honto 紀伊國屋書店 電子書籍:Amazon 楽天ブックス honto 紀伊國屋書店 Apple 読書ログ: 読書メーター(電子版) ブクログ(電子版) 図書

                            マスターアルゴリズム ー 世界を再構築する「究極の機械学習」
                          • GitHub supports Web Authentication (WebAuthn) for security keys

                            ProductSecurityGitHub supports Web Authentication (WebAuthn) for security keysThe WebAuthn standard for security keys is making authentication as easy as possible. Now you can use security keys for second-factor authentication on GitHub with many more browsers and devices. GitHub now supports Web Authentication (WebAuthn) for security keys—the new standard for secure authentication on the web. Sta

                              GitHub supports Web Authentication (WebAuthn) for security keys
                            • Pythonの高速なスーパーセット「Mojo」がAppleシリコン搭載のMacにまもなく対応

                              Modular社はPythonの高速なスーパーセットだと同社が位置づけている開発中の新言語「Mojo」が、今月(2023年10月)中にAppleシリコンを搭載したMacに対応予定であることを明らかにしました。 Mojo is coming to Apple Silicon before the end of October! Here’s a sneak-peak using Infermo - https://t.co/7KEV3G5xj7 - created by @fe_tilli to train a model for digit recognition pic.twitter.com/q350IS2oDl — Modular (@Modular_AI) October 11, 2023 MojoはPython互換として既存のTensorFlowやPyTorchなどをそのまま実行

                                Pythonの高速なスーパーセット「Mojo」がAppleシリコン搭載のMacにまもなく対応
                              • Announcing New Tools for Building with Generative AI on AWS | Amazon Web Services

                                AWS Machine Learning Blog Announcing New Tools for Building with Generative AI on AWS The seeds of a machine learning (ML) paradigm shift have existed for decades, but with the ready availability of scalable compute capacity, a massive proliferation of data, and the rapid advancement of ML technologies, customers across industries are transforming their businesses. Just recently, generative AI app

                                  Announcing New Tools for Building with Generative AI on AWS | Amazon Web Services
                                • Monorepo Explained

                                  Everything you need to know about monorepos, and the tools to build them.- Made with love by Nrwl (the company behind Nx) Understanding Monorepos Monorepos are hot right now, especially among Web developers. We created this resource to help developers understand what monorepos are, what benefitsthey can bring, and the tools available to make monorepo development delightful. There are many great mo

                                    Monorepo Explained
                                  • AI搭載イーロン・マスクの肖像画が侵入者を猛火で撃退する超危険なセキュリティシステムが誕生

                                    AIによる顔認識技術は日々進歩を遂げており、スマートフォンのロック解除や監視カメラ、決済システムなど日常生活の至る所で応用されています。そんな顔認識技術を使って「侵入者を火炎放射で攻撃する」というかなり過激な自作セキュリティシステムを、エンジニアのマーク・ラディノヴィク氏がムービーで公開しています。 Flamethrower Security System with AI Face Recognition - YouTube 家やPC、スマートフォンは鍵をかけることができますが、例えば家の前にとめている車は常に盗難のリスクにさらされています。 もちろん監視カメラで見張ることも可能で、Amazonでも手頃なものが販売されています。しかし、監視カメラはあくまでも犯罪者を警戒させて盗難を抑止する効果と、犯罪現場を録画して証拠を残すことしかできず、犯罪行為を直接食い止めることはできません。 そこで

                                      AI搭載イーロン・マスクの肖像画が侵入者を猛火で撃退する超危険なセキュリティシステムが誕生
                                    • 西欧社会民主主義はなぜ衰退しているのか?/吉田徹 - SYNODOS

                                      ポピュリズム伸長と社民の衰退 西欧各国の社民政党が大きなダメージを受けている。 2017年から2018年は、英EU離脱と米トランプ大統領誕生があったこともあり、西ヨーロッパ各国での選挙が大きな注目を浴びた。オーストリアやイタリアではポピュリスト政党が参画する連立政権が発足したが、フランスといった欧州の中核国ではポピュリスト勢力は政権の座から遠ざけられ、グローバルなポピュリズム・ドミノは押しとどめられたようにもみえる。 もっとも、これまでの各国選挙の推移を注意深くみれば、留意すべきはポピュリズム政党の伸長以上に、各国政治で中心的な役割を占めていた社民政党の決定的な衰退である。 まず、2017年3月のオランダ総選挙では、与党・労働党がわずか9議席(改選前38議席)という、歴史的敗北を喫した。1980年代から90年代にかけ、同党は中道右派政党のキリスト教民主アピールとともに2大政党のひとつだった

                                        西欧社会民主主義はなぜ衰退しているのか?/吉田徹 - SYNODOS
                                      • Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog

                                        2.3k{icon} {views} 複数のLLM(GPT/Claude3)とArxivの検索APIをRAGで統合し、論文サーベイの自動生成を作りました。検索結果の前処理や、サーベイ特有のプロンプトエンジニアリングやソートが重要で、最適化手法として古くからある巡回セールスマン問題(TSP)が有効に機能しました。また、生成部分ではGPTよりClaude3の明確な有効性を確認できました。 できたもの Arxivの検索APIを使って検索拡張生成(RAG)したらサーベイを自動生成できた やっていること Arxivの検索ワードをGPT-4-Turboで生成 ArxivのAPIを叩いてヒューリスティックでフィルタリング OpenAIのEmbedding APIを叩く Embeddingに対して巡回セールスマン問題(TSP)を解いてソートをかける 論文の要旨をGPT-3.5-Turboで要約 ソートした

                                          Arxiv RAGによる論文サーベイの自動生成 | Shikoan's ML Blog
                                        • Google Cloud Storage(GCS)でうっかり30万以上溶かした話 - のんびりしているエンジニアの日記

                                          皆さんこんにちは。 コンペで頑張ったので疲れました。 さて、Google Landmark 2021が終了し、Retrieval5位(金)、Recognition12位(銀)となりました。 本日は自戒と反省により、クラウドで30万円消失した話を 記録として書こうと思います。皆さん私を見て反面教師にしてください。 事象 9月入ってからLandmark2021に参加し、Google Cloud Platform、通称GCPを利用していた。 主な利用はGoogle Cloud Storageのみで、ほぼ容量課金だろうと高をくくっており、課金請求の上限など入れ忘れてました。 すると9/18に久々に請求額を確認すると32万ほどの請求額がありました。 さすがに目玉が飛び出て、調査にあたったといったものになります。 課金内容を確認したら原因はすぐにわかり、チームで対策を打ちました。(私が慌てて学習にスト

                                            Google Cloud Storage(GCS)でうっかり30万以上溶かした話 - のんびりしているエンジニアの日記
                                          • 2019年、俺の読んだ論文50本全部解説(俺的ベスト3付き) - Qiita

                                            第一位 Focal Loss for Dense Object Detection 物体検知のためのFocal Loss これは不均衡データに対処するための損失関数Focal Lossを提案した論文なのですが, とにかくそのシンプルさにやられました. 画像のFLの式を見てください. たったこれだけです. ptは正解ラベルに対する予測値なのですが, ptが大きければ大きいほど損失値をしっかり抑えられるように設計された関数となっています. 正解ラベルに対して0.6と予測するサンプルを学習に重要視せず, 0.3とか0.1とか予測しちゃうサンプルにしっかりと重要視するのです. 自分も7月くらいまでは不均衡データに関する研究していたのですが, 自分が考えた多くのアイディアが結局Focal Lossの下位互換に帰結してしまうのです. しかもこの損失関数の汎用性は非常に高く, あらゆるタスクに入れること

                                              2019年、俺の読んだ論文50本全部解説(俺的ベスト3付き) - Qiita
                                            • Daily Life:生物学者は「自然主義的誤謬」概念をどう使ってきたか

                                              July 16, 2020 生物学者は「自然主義的誤謬」概念をどう使ってきたか 最近発表された人間行動進化学会の声明の中で、「自然主義的誤謬」という哲学由来の概念が使われていた。 そこでは、自然主義的誤謬が、「「自然の状態」を「あるべき状態だ」もしくは「望ましい状態だ」とする自然主義的誤謬と呼ばれる「間違い」」という言い方で紹介されている。これを倫理学者が聞いたなら「いや、自然主義的誤謬はそういう意味じゃないんだけどなあ」と言いたくなるところであろう。しかし、進化生物学者と「自然主義的誤謬」という概念の付き合いはかなり長く、それなりの経緯がある。本稿の目的はとりあえずその経緯を追うことで、「自然主義的誤謬」という概念の適切な用法とはなんだろうかということを考えることである。 最初に断っておくが、本稿はいかなる意味でも体系的なサーベイとはなっていない。どちらかといえば、目立つ事例いくつかをつ

                                              • 顔識別技術でガールスカウトの母親が「裁判中の弁護士事務所の弁護士」だと判明しイベント会場から追い出されてしまう

                                                by Kevin Poh ある母娘がガールスカウトの集まりでクリスマスイベントの舞台を観劇しようとしたところ、母親だけ警備に呼び止められて会場から追い出されてしまいました。その理由について会場の運営会社は、母親が自社の訴訟を担当している弁護士事務所に所属する弁護士だからだと説明しました。 MSG’s Facial Recognition at Radio City Gets Girl Scout Mom Kicked Out – NBC New York https://www.nbcnewyork.com/investigations/face-recognition-tech-gets-girl-scout-mom-booted-from-rockettes-show-due-to-her-employer/4004677/ Girl Scout mom banned from Rad

                                                  顔識別技術でガールスカウトの母親が「裁判中の弁護士事務所の弁護士」だと判明しイベント会場から追い出されてしまう
                                                • Kaggleランカーの9人に聞いた、2020年面白かったコンペ9選と論文9選 | 宙畑

                                                  9名のKagglerの方にアンケートにご協力いただき、2020年に面白かったコンペと論文を教えていただきましたのでその結果を紹介します。 2020年も数多くのデータ解析コンペが開催され、興味深い論文が多く発表されました。 昨年公開した「Kaggle上位ランカーの5人に聞いた、2019年面白かったコンペ12選と論文7選」は現時点で20,000人を超える方にご覧いただき、Kaggleを始めとするデータ解析コンペへの関心が非常に高まっていると感じました。 そして本年も9名のKagglerの方にアンケートにご協力いただき、2020年に面白かったコンペと論文を教えていただきましたのでその結果を紹介します。 (1)回答いただいたKaggler9名のご紹介 まずは今回のアンケートに回答いただいたのは以下9名のKagglerの方です。 aryyyyyさま(@aryyyyy221) カレーちゃんさま(@cu

                                                    Kaggleランカーの9人に聞いた、2020年面白かったコンペ9選と論文9選 | 宙畑
                                                  • When charity becomes business in Japan - UCA News

                                                    There are instances where non-profit organizations fail to live up to their stated mission and instead engage in unethical or illegal activities such as the misuse of public funds. (Photo: Unsplash) The reputation of the mainstream media has tumbled over the past few years, as the recently released Twitter files highlight. The reputation of the mainstream media in Japan is at an all-time low over

                                                      When charity becomes business in Japan - UCA News
                                                    • ゼロからはじめるPython(84) 録り溜めたボイスメモをAI音声認識APIで一気にテキスト変換しよう

                                                      家電量販店に行くと今でもボイスレコーダーのコーナーがあり人気だ。またスマートフォンにも必ずボイスメモアプリがある。筆者も一時期アイデアをボイスメモで録り溜めていた。しかし、ボイスメモは聞き直す必要があり管理が面倒という欠点もある。そこで、今回はPythonからMicrosoftのAPIを利用して自動的にボイスメモをテキストに変換する方法を紹介しよう。 WAVファイルを音声認識してテキストに変換したところ 音声認識APIを使ってみよう AI技術の進歩により音声認識の精度が向上している。これまでも音声認識の技術はあったものの精度が今一歩だった。そして個人ユーザーが気軽に活用できる感じではなかった。ところが、最近では、各社が競い合うように音声認識の精度向上に力を入れている。各社から発売されているAIスピーカーを積極的に活用している読者も多いことだろう。 そして、大きな点として、Microsoft

                                                        ゼロからはじめるPython(84) 録り溜めたボイスメモをAI音声認識APIで一気にテキスト変換しよう
                                                      • 隣の防音部屋をミリ波で盗聴、瞬時にテキスト化する技術 中国の研究者らが開発

                                                        このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 香港大学や清華大学に所属する研究者らが発表した論文「Radio2Text: Streaming Speech Recognition Using mmWave Radio Signals」は、ミリ波(mmWave)信号から音声を認識するストリーミング自動音声認識(ASR)システムを提案した研究報告である。このシステムは、周囲のノイズに強く、防音対策した部屋の外からでも取得でき、これまでと異なり長い文章をリアルタイムに認識する能力を提供する。 無線センシングの進展に伴い、特にミリ波信号の注目が高まっている。なぜなら、音源のミリメートルレベルの

                                                          隣の防音部屋をミリ波で盗聴、瞬時にテキスト化する技術 中国の研究者らが開発
                                                        • Stanford CS229: Machine Learning Full Course taught by Andrew Ng | Autumn 2018

                                                          Led by Andrew Ng, this course provides a broad introduction to machine learning and statistical pattern recognition. Topics include: supervised learning (gen...

                                                            Stanford CS229: Machine Learning Full Course taught by Andrew Ng | Autumn 2018
                                                          • ノイズのある教師データを用いた機械学習に関する研究サーベイ - ABEJA Tech Blog

                                                            こんにちは、Research Internの荒尾(@karolis_ml)です。 日進月歩の勢いで研究が進んでいる深層学習ですが、教師あり学習でもっとも大事なデータのアノテーション、応用分野ではまだまだ大変ですよね。例えば、犬の写真から犬種を判断する分類器を作ろうとして教師データが必要になったとき、あなたは以下の画像にどんなラベルをつけるでしょうか? 出典: Pixabay 犬好きの方は正しくアラスカンマラミュート、そうではない方は似た有名犬種であるシベリアンハスキーと答えられたことでしょう。マラミュートの茶色い目(かわいい)や小さめの尖った耳(かわいい)を見分けて正しくラベル付けをするのは、決して簡単ではありません。 このようなアノテーションの分野に関して当ブログでは以前、Bounding BoxやSegmentationの効率化についての研究サーベイを行いましたが、この犬種分類のような

                                                              ノイズのある教師データを用いた機械学習に関する研究サーベイ - ABEJA Tech Blog
                                                            • 顔認証の40%以上をたった9つの顔で突破するマスターキーならぬ「マスターフェイス」を作るAIが登場

                                                              顔認証システムはスマートフォンやPCのロック解除など、日常生活のさまざまな場所に浸透しています。ところがイスラエル・テルアビブ大学の研究チームは、マスターキーならぬ「マスターフェイス」を生成するAIを開発したと発表。たった9つの顔で全体の40%以上の顔になりすまして、顔認証を突破可能だと報告しています。 [2108.01077] Generating Master Faces for Dictionary Attacks with a Network-Assisted Latent Space Evolution https://arxiv.org/abs/2108.01077 ‘Master Faces’ That Can Bypass Over 40% Of Facial ID Authentication Systems - Unite.AI https://www.unite.ai

                                                                顔認証の40%以上をたった9つの顔で突破するマスターキーならぬ「マスターフェイス」を作るAIが登場
                                                              • 日本語正式サポートされた自然言語処理ライブラリspaCyのStreamlit可視化が超お手軽だった - OPTiM TECH BLOG

                                                                R&D チームの徳田(@dakuton)です。 最近、spaCyの日本語版モデルが正式サポートされたのでいろいろ触ってみたところ、解析結果ビジュアライズを全部まとめるStreamlitアプリも同じ月に提供されていることがわかったので、今回はそちらを紹介します。 なお、ビジュアライズ機能の一部(係り受け解析)は1年前の記事「その他」で紹介しています。 tech-blog.optim.co.jp 実行手順 spaCyのUniverseプロジェクトであるspacy-streamlitをインストールします。 pip install spacy-streamlit 起動用スクリプト(streamlit_app.py) import os import pkg_resources, imp import spacy_streamlit models = ["ja_core_news_lg", "ja_

                                                                  日本語正式サポートされた自然言語処理ライブラリspaCyのStreamlit可視化が超お手軽だった - OPTiM TECH BLOG
                                                                • Google Colaboratoryで試せる面白い機械学習プロジェクト6選 – ツクレル

                                                                  Google Colaboratoryで試せる面白い機械学習プロジェクト6選投稿者: tsukurel 投稿日: 2020年6月10日2020年6月10日 Google Colaboratory(略称Colab)はご存じでしょうか。名前の通りGoogleによって提供されているサービスで、PythonをWebブラウザ上で実行できるJupyter Notebookを提供しています。さらにGPUが無料で実行できるとあって、機械学習系のプロジェクトでも利用されています(実用というより実験などで用いられています)。 今回はそんなGoogle Colaboratoryで実行できる面白いプロジェクトを幾つか紹介します。Open in Colabの画像をクリックすれば、それぞれのプロジェクトをすぐに試せます。 動画中の車認識 Google公式に提供されているプロジェクトです。道路を走っている車を認識し、車

                                                                    Google Colaboratoryで試せる面白い機械学習プロジェクト6選 – ツクレル
                                                                  • BERTによるニュース記事の構造化:企業名抽出

                                                                    はじめにMachine Learning部門の近江です。ストックマークでは、自然言語処理技術の研究開発を行っています。 先日、弊社のTech Blogにて弊社が公開している言語モデルを紹介しました。 ストックマークが公開した言語モデルの一覧と振り返り 今回は、言語モデルがプロダクトにおいて実際にどのように利用されているかについての一例を紹介します。 ニュース記事の構造化マーケティング、新規事業開発などの調査業務では、調査を行う人が書籍、ニュース記事、ホームページなどの情報を網羅的に調べ、整理し、報告書などにまとめていきます。その際に扱う情報は膨大であり、そのため調査業務には多くの時間と労力がかかります。 弊社のプロダクトである「Astrategy」は機械学習を用いてニュース記事から特徴となる情報を抽出し、構造化することで、大量のニュース記事を効率的に俯瞰し、さらに新規事業開発などに繋がりう

                                                                      BERTによるニュース記事の構造化:企業名抽出
                                                                    • 2020年のおもしろかったDL/ML論文10選 - Qiita

                                                                      はじめに 2020年も,機械学習コミュニティでは多くの新しい成果が見られました.2019年に引き続き,1年を振り返ってもっとも面白かった論文を10本紹介したいと思います. * 本記事は,私のブログにて英語で書いた記事を翻訳し,適宜加筆修正したものです. ** 記事中の画像は,ことわりのない限り対象論文からの引用です. 論文10選(公開順) 普段から,読んだ論文を簡単にまとめてツイートしているので,それを使って公開日順に振り返っていきます.対象はおおまかに「2020年に公開された論文」と「2020年に学会・雑誌で発表されたもの」とします.全くの主観で選んでいるので,私の興味範囲である深層学習および応用研究に偏っている点はご容赦ください. 紹介するのはこちらの10本です! Rigging the Lottery: Making All Tickets Winners PIFuHD: Multi

                                                                        2020年のおもしろかったDL/ML論文10選 - Qiita
                                                                      • 【AI最新論文】2022年に読むべき「機械学習/ディープラーニングの最新論文」30選 - Qiita

                                                                        <目次> はじめに 第1回:コンピュータビジョン編 第2回:自然言語処理編 第3回:強化学習編 第4回:実務応用編 次回予告 1. はじめに GAN(敵対的生成ネットワーク)講座 現場で使える XAI(Explainable AI)講座 現場で使える自然言語処理実践講座 ディープラーニング最新論文対策講座 スキルアップAIでは、上記の4講座を始めとして、現在、そしてこれから注目されるであろう最先端の機械学習/ディープラーニング技術に関する講座を開講しております。このような講座を開講していく中で、スキルアップAIの講師陣が注目している最先端技術をぜひ知りたいというお声を多くいただきました。 そこで、自動機械学習(AutoML)を専門としICMLなどのトップカンファレンスへの論文採択経験もある斉藤と、需要予測・異常検知など様々な分野で機械学習/ディープラーニングの産業応用に取り組んできた小縣が

                                                                          【AI最新論文】2022年に読むべき「機械学習/ディープラーニングの最新論文」30選 - Qiita
                                                                        • 1bit LLM の時代は来るのか,来ないのか,どっちなんだい?|情報処理学会・学会誌「情報処理」

                                                                          徳永拓之(LeapMind(株)) 1bit LLMの時代が来る? 2024 年2 月,The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits¹⁾ というタイトルの論文がarXiv上で公開され,にわかに話題となりました.“1.58 Bits” という表現はあまりなじみがありませんが,log₂(3) = 1.58 . . . ということで,パラメーターを三値にした場合の情報量を示しているようです.この論文(以下b1.58 論文とする)は,同じ著者グループによる文献2)を少し拡張したもので,大規模言語モデル(LLM)の効率化についての研究です. 本稿の前半ではこれらの論文の主張を解説し,後半ではその主張の妥当性について検討します. なお,これらの2本の論文は,本稿執筆時点では,査読を経たものではありませんのでご注意くだ

                                                                            1bit LLM の時代は来るのか,来ないのか,どっちなんだい?|情報処理学会・学会誌「情報処理」
                                                                          • 画像grepツールを作ってみた - Qiita

                                                                            経緯 ごく稀に、プロダクト内に書かれた文言の修正をすることってありますよね。 htmlやテンプレートファイルに文字列が記載されていれば、普通にgrepするなり、sedで一括置換できたりします。 問題は画像です・・・! 画像の中に置き換えなければいけない文字があることもあると思いますが、画像を目視で見ないと分からないですよね。 過去の経験的にも、あとから置き換えなければいけない文字を含む画像が見つかって、修正する・・・みたいなことを何度か経験したことがあります。 (本来は、画像内にあまり文字を書くのは良くないと思うのだけど・・・説明ページとかだと仕方ない場合もありますよね。) 画像内をgrepできたらいいのに、と思ったのでOCRを活用して画像内の文字列をテキスト化し、その中に調べたい文字列があるかをチェックするツールを作ってみたので紹介します。 OCRとは OCR(Optical Chara

                                                                              画像grepツールを作ってみた - Qiita
                                                                            • Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog

                                                                              こんにちは! 画像システムグループで機械学習エンジニアをやっている小島です。 この記事では、今ホットな「Zero-shot Learning」と「Vision & Language」に関する最新情報を、CLIPという研究を起点として網羅的にサーベイをしていきます。このために論文1000本に目を通し、70本程度を記事にしました。 Zero-shotやVision & Languageは、Stable Diffusionに代表される画像生成AIとも密接に関連している技術です。この記事を通して、Vision & Languageの奥深い世界を体感できるでしょう。 注意事項 この記事は非常に長いため、全部読むのに1時間以上かかる可能性があるので、休憩を取りながら、または必要な部分だけ読んでください。各セクションを個別に読んでも問題ありません。 また、文章中の画像は、特別な記載がない限り、引用元の論

                                                                                Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog
                                                                              • OSSなWeb会議アプリ(SkyWay Conf)に文字起こし機能を実装してみた - Qiita

                                                                                SkyWay ConferenceはSkyWayを利用したのブラウザ上で動作するWeb会議デモアプリです。OSSとして公開されています。 今回はSkyWay Confを改造して文字起こし機能をつけてみました! Web会議アプリに文字起こし機能がついてると、出先でイヤホンを忘れてもなんとかなるかもしれません。 議事録も自動で出来て素晴らしいですね。 左上の窓で文字起こし関連の操作が出来て、画面中央下部に書き起こされた文字が表示されるようにしました。 できたもの まずデモアプリはこちら。Chromeで開いてください! 文字起こし機能つきSkyWay Confのデモページ https://shinyoshiaki.github.io/skyway-conf ソースコードなど 文字起こし機能つきSkyWay Confのソースコード https://github.com/shinyoshiaki/s

                                                                                  OSSなWeb会議アプリ(SkyWay Conf)に文字起こし機能を実装してみた - Qiita
                                                                                • Papers with Code - Machine Learning Datasets

                                                                                  CIFAR-10 (Canadian Institute for Advanced Research, 10 classes) The CIFAR-10 dataset (Canadian Institute for Advanced Research, 10 classes) is a subset of the Tiny Images dataset and consists of 60000 32x32 color images. The images are labelled with one of 10 mutually exclusive classes: airplane, automobile (but not truck or pickup truck), bird, cat, deer, dog, frog, horse, ship, and truck (but no

                                                                                    Papers with Code - Machine Learning Datasets