並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 13 件 / 13件

新着順 人気順

image_detectionの検索結果1 - 13 件 / 13件

  • OpenCVでのデモの見栄えを工夫したまとめ(ディープラーニング系) - Qiita

    この記事はOpenCV Advent Calendar 2020の12日目の記事です。 他の記事は目次にまとめられています。 対象者 以下みたいな作業依頼を受けることのある人。 つまり、デザインに予算はつかないけど、ある程度の工夫を求められるやつ。。。 上長「部内とかで見せるちょっとしたデモをパパッと作って欲しい」 高橋「デザインは○○さんか、△△社さんにお願いします?」 ※○○さん:デザイン会社から派遣で来ているデザイナーさん ※△△社:デザイン会社 上長「今回、デザインに出すお金は無い」 高橋「What?」 高橋「それじゃ、見た目は気にしな」 上長「偉い人も見る可能性あるからソレっぽくしといてもらわないと困る」 高橋「短い間ですが、お世話になりました」 Flaskとか立てて、UI作る人とデザイナーと役割分担出来るようなプロジェクトは対象外 はじめに OpenCVとかPillowで出来る

      OpenCVでのデモの見栄えを工夫したまとめ(ディープラーニング系) - Qiita
    • Designed to Deceive: Do These People Look Real to You? (Published 2020)

      The creation of these types of fake images only became possible in recent years thanks to a new type of artificial intelligence called a generative adversarial network. In essence, you feed a computer program a bunch of photos of real people. It studies them and tries to come up with its own photos of people, while another part of the system tries to detect which of those photos are fake. The back

        Designed to Deceive: Do These People Look Real to You? (Published 2020)
      • 歴史・年表でみるAWS全サービス一覧(参考資料編) -アナウンス日、General Availability(GA)の参考URL- - NRIネットコムBlog

        小西秀和です。 歴史・年表でみるAWS全サービス一覧 -アナウンス日、General Availability(GA)、AWSサービス概要のまとめの記事で参考にしたURLが多すぎるため、こちらに別記事としてまとめました。 AWSサービスの概要など「歴史・年表でみるAWS全サービス一覧」のメインコンテンツは本編を御覧ください。 ただ、見方によってはこの記事の方が面白いかもしれません。 [English Edition] AWS History and Timeline - Almost All AWS Services List, Announcements, General Availability(GA) AWS全サービスの歴史年表に記載したアナウンス日・GA日(一般提供開始日)の参考URL 「What's New」のURL(例:https://aws.amazon.com/about-

          歴史・年表でみるAWS全サービス一覧(参考資料編) -アナウンス日、General Availability(GA)の参考URL- - NRIネットコムBlog
        • Table TransformerとGPT-4Vを用いたPDF内の表の解析|QunaSys

          RAGは非常に有用なツールですが、PDFの論文などを扱う際には、表データを正しく読み取れない場合があります。 表の構造を適切に処理することは難しく、いくつかの改善策が提案されています。 例えば、RAGを構築するのに使われるライブラリであるLlamaIndexのドキュメントに以下のような情報があります。 このドキュメントでは表を含むデータを扱う方法として、PDFを一旦すべて画像データに変換し、画像として表の形式を保持したままGPT-4Vでデータを解析することを提案しています。 ただ、PDF1ページ分の画像をそのままGPT-4Vに解析させても精度はあまり良くないようで、後述するTable Transformerを使って表部分の画像のみ抽出してから解析を行うことで、より良い結果が得られたのことでした。 本記事では、この方法を用いてPDF内の表の解析を試してみます。 手順としては 1. PDFの全

            Table TransformerとGPT-4Vを用いたPDF内の表の解析|QunaSys
          • Blender ウォッチング 2024年 記事一覧

            レビュー 生成AIによる偽画像に騙されるな! AIが生成した画像を判別する方法 動画もOKな無償のWebアプリ「Hive AI-Generated Image Detection」 9月6日 06:45

              Blender ウォッチング 2024年 記事一覧
            • TensorFlow のモデルを Graph Transform Tool で最適化してサービングする | メルカリエンジニアリング

              こんにちは。メルカリアドベントカレンダー 9日目は JP AI Engieering Team 所属の @KosukeArase がお送りします。 機械学習技術をサービスに適用するにあたって、機械学習モデルによる推論を API として提供(サービング)したいという場面は多いと思います。 TensorFlow community は TensorFlow Serving によるモデルのサービングを可能にしており、メルカリでも多くの機械学習プロダクトでこの TensorFlow Serving を利用しています。 TensorFlow Serving はドキュメントがしっかりしているため本稿では詳細に説明しませんが、実運用に際してはなるべくモデルサイズを小さくしたい、無駄な計算を減らし推論速度をあげたい、といったモチベーションがあるかと思います。 このような計算グラフの最適化を実現する関数、ツ

                TensorFlow のモデルを Graph Transform Tool で最適化してサービングする | メルカリエンジニアリング
              • 生成AIによる偽画像に騙されるな! AIが生成した画像を判別する方法/動画もOKな無償のWebアプリ「Hive AI-Generated Image Detection」【レビュー】

                  生成AIによる偽画像に騙されるな! AIが生成した画像を判別する方法/動画もOKな無償のWebアプリ「Hive AI-Generated Image Detection」【レビュー】
                • A Dive into Vision-Language Models

                  Human learning is inherently multi-modal as jointly leveraging multiple senses helps us understand and analyze new information better. Unsurprisingly, recent advances in multi-modal learning take inspiration from the effectiveness of this process to create models that can process and link information using various modalities such as image, video, text, audio, body gestures, facial expressions, and

                    A Dive into Vision-Language Models
                  • Engadget | Technology News & Reviews

                    Some Amazon and Max cartoons may have been partially animated in North Korea

                      Engadget | Technology News & Reviews
                    • GitHub - taishi-i/awesome-ChatGPT-repositories: A curated list of resources dedicated to open source GitHub repositories related to ChatGPT

                      awesome-chatgpt-api - Curated list of apps and tools that not only use the new ChatGPT API, but also allow users to configure their own API keys, enabling free and on-demand usage of their own quota. awesome-chatgpt-prompts - This repo includes ChatGPT prompt curation to use ChatGPT better. awesome-chatgpt - Curated list of awesome tools, demos, docs for ChatGPT and GPT-3 awesome-totally-open-chat

                        GitHub - taishi-i/awesome-ChatGPT-repositories: A curated list of resources dedicated to open source GitHub repositories related to ChatGPT
                      • MediaPipeで遊んでみる

                        MediaPipe – FaceMesh MediaPipeとは、Googleで開発を主導しているオープンソースの機械学習ライブラリーで、ライブストリーミングでの使用に特化しています。今回はこのMediaPipeのPython版による導入とTouchDesignerでの応用について紹介します。 開発環境の準備 1. Pythonのインストール 今回は後半のTouchDesignerとの連携を意識して、(※2022年12月現在) TouchDesignerにインストールされているPython 3.9系のバージョンをインストールします。以下のリンクから使用している環境にあわせてインストーラーをダウンロードしてインストールしてください。 https://www.python.org/downloads/release/python-3913/ 2. Visual Studio Codeのインスト

                          MediaPipeで遊んでみる
                        • Rasperry Pi 4のCPUでDeep Learningを高速化 - Qiita

                          私たちは、マルチコアCPUやSIMDアーキテクチャのHW性能を引出す組込みSW最適化技術をコアコンピタンスとするスタートアップを目指す有志集団です。 Raspberry Pi 3/4のCPUだけでどれくらいDeep Learningを高速化できるかに挑戦しています。 過去、Chainerやdarknetといったフレームワーを対象としていましたが、現在はONNX runtimeの高速化に挑戦しています。 現時点での結果は以下の通りです。 @onnxruntime on RPi4(CPU Only) MobileNetV3(Image clasification) MobileNetV2-SSDLite(Image detection) Original vs. Accelerated#RaspberryPi #Python #DeepLearninghttps://t.co/wvBLn9Tf

                            Rasperry Pi 4のCPUでDeep Learningを高速化 - Qiita
                          • Large Text Compression Benchmark

                             Large Text Compression Benchmark Matt Mahoney Last update: Sept 19, 2024. history This competition ranks lossless data compression programs by the compressed size (including the size of the decompression program) of the first 109 bytes of the XML text dump of the English version of Wikipedia on Mar. 3, 2006. About the test data. The goal of this benchmark is not to find the best overall compress

                            1