本文「recognition」を検索 - はてなブックマーク

41 - 48 件 / 48件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

recognitionの検索結果41 - 48 件 / 48件

OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる
- 121 users
- inoccu.com
- テクノロジー
- 2022/09/26
OpenAIがSpeech-To-Text AIのWhisperを発表しました。Githubからpipでインストールすれば簡単に使えます。私のM1 Max MacBook Proでも動作しましたので、作業内容を書いておきます。 GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Robust Speech Recognition via Large-Scale Weak Supervision – GitHub – openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision Python仮想環境を作る Python自体のインストールは既に終わっているところから書くことにします。私の環境は
- python
- whisper
- あとで読む
- mac
- AI
- インストール
- github
【Streamlitよりいいかも？】機械学習系のデモアプリ作成に最適！Gradio解説 - 学習する天然ニューラルネット
- 117 users
- aotamasaki.hatenablog.com
- テクノロジー
- 2023/07/03
はじめに Streamlit vs Gradio Gradioの設計思想 Interface 入出力に応じたUI Interface String Shortcut 入力データのサンプルのセットドキュメンテーションテーマの変更タイムアウトへの対処中級者への第一歩、デモを作る際に知っておきたい処理 Gradioが担当する前処理についてプログレスバーもろもろの出力結果を保存するには？認証認可（というか認可）その他、解説しないが需要の有りそうなものまとめ追記 : 動画になりました。はじめに機械学習系のデモアプリを作成することがしばしばありStreamlitを使用していたが、パラメーターなどをいじるたびに処理が最初から走るなどといった挙動に悩まされていた。同僚がGradioというのを使っていたのでサーベイがてらメモしていたらブログが出来上がってしまった。本ブログでは、G
- 機械学習
- python
- streamlit
- あとで読む
- UI
- 勉強
- 学習
- programming
物体認識モデルYOLOv3を軽く凌駕するYOLOv4の紹介 - ほろ酔い開発日誌
- 116 users
- blog.seishin55.com
- テクノロジー
- 2020/05/16
はじめに先月、YOLOv4が公開されました。位置づけとしては、物体認識のポピュラーなモデルの1つであるYOLO系統の最新版となります。結果がすごいのはぱっと見分かりましたし、内容も既存の手法をサーベイ・実験頑張って、精度上げていったんだなあくらいのさら読みはしていましたが、もう少しちゃんと読んでおこうと思い、読んでみたので紹介します。私自身は物体認識の研究者というわけではないですが、なんだかんだ物体認識周りの記事をいくつか書いているので興味のある方は以下もご参照下さい。 note.com note.com [DL輪読会]Objects as Points from Deep Learning JP www.slideshare.net さて、このYOLOv4ですが、元々のYOLOの作者であるJoseph Redmon氏は著者ではありません。Jeseph Redmon氏は研究の軍事利用や
- 機械学習
- yolo
- 物体認識
- あとで読む
- deep learning
- 画像処理
- 論文
- GPU
OpenAIのBatch APIを使ってお得にプロンプトを一括処理してみる - Taste of Tech Topics
- 115 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2024/04/17
はじめにこんにちは。データサイエンスチームYAMALEXのSsk1029Takashiです。最近はOpenAIに日本支社が出来て、日本語対応が加速するというニュースにわくわくしています。今回はそんなOpenAIから発表されたBatch APIという機能が便利、かつお得な機能だったのでどのように使えるのか試してみます。 Introducing the Batch API: save costs and get higher rate limits on async tasks (such as summarization, translation, and image classification). Just upload a file of bulk requests, receive results within 24 hours, and get 50% off API pri
- ChatGPT
- api
- AI
- あとで読む
- LLM
- GPT
- OpenAI
CIMAM（国際美術館会議）が「表現の不自由展・その後」について声明文を発表。「表現の自由が完全に損なわれている」
- 110 users
- bijutsutecho.com
- 学び
- 2019/08/28
CIMAM（国際美術館会議）が「表現の不自由展・その後」について声明文を発表。「表現の自由が完全に損なわれている」ICOM（国際博物館会議）の提携組織であるCIMAM（国際美術館会議）が、「あいちトリエンナーレ2019」の一企画である「表現の不自由展・その後」の展示中止に対し、声明文を発表した。愛知芸術文化センター ICOM（International Council of Museums 国際博物館会議）の提携組織であるCIMAM（International Committee for Museums and Collections of Modern Art 国際美術館会議）が、「あいちトリエンナーレ2019」内の「表現の不自由展・その後」展示中止に対し、声明文を発表した（全文は記事末尾に掲載）。名義はCIMAMの美術館監視委員会（The Museum Watch Committee
メンタルレキシコンとは？わかりやすく解説・心理学との関係　英語学習への効果とは？ - ポリグロットライフ | 言語まなび∞ラボ
- 108 users
- www.sunafuki.com
- 学び
- 2023/06/04
はじめに今回はメンタルレキシコンについてわかりやすく解説していきます。メンタルレキシコンとは、どのような意味や性質を持ち、学ぶ意義は何なのかを考えていきます。心理学との関係や英語学習及び語彙学習への効果についても考えていきます。メンタルレキシコンを正しく理解して、正しい効率的な語彙学習をぜひ取り入れてみてください。 ↓↓第二言語習得研究に基づく英語学習動画をアップしていきます。 www.youtube.com メンタルレキシコンとは？メンタルレキシコンの意味メンタルレキシコンの性質メンタルレキシコンを学ぶ意義メンタルレキシコン内の語彙知識モデル階層的ネットワークモデル活性化拡散モデル母国語のメンタルレキシコン子供の語彙の増加即時マッピング第二言語学習への示唆バイリンガルの語彙発達バイリンガルの言語的特徴バイリンガルレキシコンメンタルレキシコンと心理学二重符号
- 言語
- あとで読む
- 学習
- 言語学
- 脳
- 英語
- 心理
Deep Learning ideas that have stood the test of time
- 105 users
- dennybritz.com
- テクノロジー
- 2020/07/30
Deep Learning is such a fast-moving field and the huge number of research papers and ideas can be overwhelming. The goal of this post is to review ideas that have stood the test of time. These ideas, or improvements of them, have been used over and over again. They’re known to work. If you were to start in Deep Learning today, understanding and implementing each of these techniques would probably
- 機械学習
- deeplearning
- あとで読む
- machinelearning
- PyTorch
- DL
- AI
- programming
音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
- 101 users
- ysdyt.hatenablog.jp
- テクノロジー
- 2022/10/13
OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。配信中のpodcast番組白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。最初に結論インストール実行方法結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果まとめ追記カタカナ英語完全制覇 whisperくんせんでんせんでん最初に結論 whisperは異なるモデルサイズが5種が利用可能であ