大福好きの甘党ソフトウェアエンジニア(主に業務システム系)である『テクノ大福』のブログです。面白そうな技術、影響を受けた本や音楽などを共有したいと思っています。
こんにちは、google vision APIを使って画像中の文字を読み取り、数量をカウントする方法を記事にします。 普段の業務で、業者から大量に事務用品が届き、納品チェックで製品名やサイズ、型番を一つ一つチェックしており、とても時間がかかっていました。この作業をAI-OCRで置き換えられないかと考え試してみました。 Google Vision APIの使い方 とっても丁寧に解説されていますので、こちらをご参照ください。 秘密鍵のJSONファイルまでゲットします。 https://self-development.info/python%E3%81%A7google-cloud-vision-api%E3%82%92%E5%88%A9%E7%94%A8%E3%81%99%E3%82%8B%E6%96%B9%E6%B3%95/ AI-OCRで画像中のテキストを読み取る 画像はこんなものを用意
はじめに 夢見ていた nikkieです。 最近LangChainに執心ですが、今回は「こんなこともサクッとできちゃうの!?」という個人的ビッグニュースをアウトプットします🔥 目次 はじめに 目次 YouTubeの文字起こしをこんなに簡単に取得できちゃうの!? 素振り:LangChainでYouTube動画の文字起こしを取得する 動作環境 文字起こし取得 ChatGPTに要約をお願い youtube-transcript-api 終わりに YouTubeの文字起こしをこんなに簡単に取得できちゃうの!? 話題の つくりながら学ぶ!AIアプリ開発入門 - LangChain & Streamlit による ChatGPT API 徹底活用 を眺めていたnikkie氏。 Chapter 07「Youtube動画の要約をしよう」を読んでいると YouTubeの動画の文字起こし(transcript
近年は文章や画像を生成するAIの発展が著しく、スタンフォード大学が行った調査では、学生の約17%が「課題または試験にChatGPTを使っている」と回答しています。カンザス大学のヘザー・デゼール氏らの研究チームはChatGPTを使って書かれた論文を検出するツールを開発しました。研究チームによると、検出の精度は99%以上とされています。 Distinguishing academic science writing from humans or ChatGPT with over 99% accuracy using off-the-shelf machine learning tools: Cell Reports Physical Science https://doi.org/10.1016/j.xcrp.2023.101426 AI-generated academic science
Multiple models, each with different capabilities and price points. Prices can be viewed in units of either per 1M or 1K tokens. You can think of tokens as pieces of words, where 1,000 tokens is about 750 words. This paragraph is 35 tokens. With 128k context, fresher knowledge and the broadest set of capabilities, GPT-4 Turbo is more powerful than GPT-4 and offered at a lower price.
「Huggingface Transformers」のモデルのキャッシュパスについてまとめました。 ・Huggingface Transformers 4.4.2前回 1. モデルのデフォルトのキャッシュパス「Huggingface Transformers」のモデルは、初回利用時にダウンロードおよびキャッシュされます。デフォルトのキャッシュパスは環境ごとに異なります。 以下のコードで、モデルのデフォルトのキャッシュパスを確認できます。 # モデルのキャッシュパスの確認 from transformers import file_utils print(file_utils.default_cache_path)該当フォルダを削除することで、モデルのキャッシュを削除できます。 2. モデルのキャッシュパスの変更以下のコードで、モデルのキャッシュパスを変更できます。 # モデルのキャッシュパ
2. 解析動機 2013年5月18日Tokyo WebMining #26 2 最後の春だし画像処理の勉強でもしとくか 後輩からAV女優の類似画像検索の話を聞く (ぱろすけ 2012) DMMにはアフィリエイトあったよな これでウェブサービス作れば儲かるかも 決して下半身からの要望で解析したのではありません http://blog.parosky.net/archives/1506 3. 計算環境 2013年5月18日Tokyo WebMining #26 3 使用言語:Python 2.7 (少しだけR) 使用モジュール:Numpy, Scipy, OpenCV 科学技術計算用のライブラリ MATLABにできることは大体できる numpy.ndarray 型付き多次元配列 numpy.linalg 線形代数計算 scipy.cluster 今回はこれのk-means法を使用
はじめまして!エンジニアのUemaです。 近年では、スマホのロックの解除や入館時の認証など様々なことに顔認識の技術が使われています。 顔認識を利用するには機械学習、画像処理や数学などの様々な知識が必要で学習コストがかかり、顔認識を使ってアプリケーションを作ってみたいと考えている人もなかなか手が出ないと思います。 そんな人に朗報です! 手軽に顔認識を行えるface-recognitionというPythonライブラリが存在します! 今回は顔認識の入り口として、face-recognitionを実際に使ってみたいと思います。 face-recognitionとは Pythonコードやコマンドラインで手軽に顔を検出・認識することができるライブラリです。face-recognitionの顔認識モデルは99%の正解率を記録しているそうです。 インストール(mac) Pythonとhomebrewがイン
金子 邦彦(かねこ くにひこ) 勤務:福山大工学部情報工学科 学内の役職:情報工学科学科長,共同利用センター副センター長(ICT サービス部門長),大学教育センター・数理・データサイエンス・AI教育部門長 こんにちは.私は大学教授であり,人工知能,データベース,3次元コンピュータグラフィックス,プログラミングの分野で研究,実践プロジェクト,教材開発を行い,学会活動や論文執筆,書籍出版,大学での授業実施,研究室の運営にも携わっています.役職を持ち,情報工学科の発展,大学のICTの発展,大学の数理・データサイエンス・AI教育の発展にも尽力しています. また,インターネットを通じて情報発信を行い,基礎的な知識から最新技術,教材に至るまで幅広く発信しています.これらの情報が多くの人々に役立つことを願っています. 金子邦彦研究室では,こんなことを行っている. 【活動の概要】 データベースに関する最新
Free and open source face recognition with deep neural networks. News 2016-09-15: We presented OpenFace in the Data (after)Lives art exhibit at the University of Pittsburgh and have released the code as Demo 4: Real-time Face Embedding Visualization. 2016-08-09: New blog post: (Face) Image Completion with Deep Learning in TensorFlow. (OpenFace group discussion on it) 2016-06-01: OpenFace tech repo
OpenCVの勉強、第3回です。 前回は予め準備されているカスケード分類器を使ってオブジェクト検出をしましたが、 今回はカスケード分類器を自作してみたいと思います。 目標 テニスボールを検出できるカスケード分類器を作る。 作業フォルダの準備 分類器を作成する作業フォルダの作成と、必要なファイルの準備をします。 <DIR> cascade <DIR> neg <DIR> pos <DIR> vec opencv_annotation.exe opencv_createsamples.exe opencv_ffmpeg346_64.dll opencv_interactive-calibration.exe opencv_traincascade.exe opencv_version.exe opencv_version_win32.exe opencv_visualisation.exe o
今日の話題は,OpenCVを使った機械学習.物体検出をご紹介しよう ちなみに使ったOpenCVのバージョンは1.0.上位バージョンも大筋は変わらない. 機械学習に使うツールは、 ・createsamples.exe ・haartraining.exe なのだ. これらはOpenCVをインストールすると、デフォルトで”C:\Program Files\OpenCV\bin”の下にできる. 1.学習データを用意する 学習に必要なデータは、学習対象の画像データ(正解画像)と、学習対象が写っていない不正解画像である。 正解画像7000、不正解画像3000位は必要と言われているらしい。 で、これらの画像から学習に使う、vecファイルなるものを作成するのだが、そこでcreatesamples.exeを使用する。 大量の正解画像を用意する方法は2つあり、まず根性で全部自分で用意する方法。そして回転等加え
画像生成AI「Stable Diffusion」を使いこなす上で、覚えておきたいのが、embeddingsファイル。ネガティブプロンプトをまとめたり、指の生成に特化したものなど様々なものがありますが、今回は、利用方法を中心に解説します。 embeddingsとは? embeddingsとは「埋め込み」という意味で、「Textual Inversion」という手法で学習させたファイルを指します。これらを利用することでそれぞれに学習されたファイルが生成される画像を補正し、品質を上げてくれます。「Textual Inversion」を略して、TIと言われることもあります。 embeddingの導入方法 今回は代表的なembeddingsのEasyNegativeをインストールしてみます。以下のURLから「EasyNegative.safetensors」をダウンロードします。 https://h
March 24, 2023 Stable UnCLIP 2.1 New stable diffusion finetune (Stable unCLIP 2.1, Hugging Face) at 768x768 resolution, based on SD2.1-768. This model allows for image variations and mixing operations as described in Hierarchical Text-Conditional Image Generation with CLIP Latents, and, thanks to its modularity, can be combined with other models such as KARLO. Comes in two variants: Stable unCLIP-
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く