並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 234件

新着順 人気順

computer_visionの検索結果81 - 120 件 / 234件

  • Real-time Human Detection with OpenCV

    Let's use the HOG algorithm implemented in OpenCV to detect people in real time in a video stream! Introduction Today, we will write a program that can detect people in a video stream, almost in real-time (it will depend on how fast your CPU is.) In my article about object detection with darknet , we have seen how to use deep learning to detect objects in an image. For this, we used a YOLOv3 neura

      Real-time Human Detection with OpenCV
    • Scenic: A JAX Library for Computer Vision Research and Beyond - stMind

      github.com Scenicは、TransformerベースのモデルにフォーカスしたオープンソースのJAXライブラリ。 最近、Transformerを適用した動画認識モデルの論文(ViViT, MTV, ObjectViViT)を読んでいる中で見かけていました。 研究のコードであっても、構造化され、実験しやすいことが、色々なアイデアを素早く検証できるベースになることを実感していて、 Scenicが気になっていました。 そこで、arxivに公開されているScenicの論文を読んでみたので、ここで内容をメモしておきます。 arxiv.org Abstract Scenicの目的は、新しいビジョンアーキテクチャやモデルの素早い実験、プロトタイピング、リサーチを促進すること。 Scenicは、マルチホスト、マルチデバイスの大規模学習のためのGPU/TPUサポートとともに、多様なビジョンタスク

        Scenic: A JAX Library for Computer Vision Research and Beyond - stMind
      • クラス間不均衡問題への対処でビジネスコストを考慮する必要はあるか? - Insight Edge Tech Blog

        こんにちは! 分析チームの梶原(悠)です。今回はクラス間不均衡問題について議論します。 目次 クラス間不均衡問題とは 問題の定式化にまつわる議論 比較シミュレーションの設定 比較シミュレーションの結果 考察 クラス間不均衡問題とは 実務で扱われる多くの分類問題はクラス間のサイズに偏りがあります。 いくつかのクラスのデータが他のクラスよりも著しく多いとき、分類器は小さなクラスを無視しやすくなります。 これは、クラス間不均衡問題と呼ばれます。 問題の定式化にまつわる議論 クラス間不均衡問題は、「分類問題の構造の複雑さ」「訓練データの大きさ」「クラス間のサイズの偏り」などの条件が絡みあって起きます [1]。 一方で、Lingらは、学習器が正解率(accuracy)の最大化を目標として訓練される分類タスクの設定自体に問題があると指摘しています [2]。 そして不均衡問題には、ビジネスコストを考慮し

          クラス間不均衡問題への対処でビジネスコストを考慮する必要はあるか? - Insight Edge Tech Blog
        • 「AIの基本から応用」までをマスターできる“学習コース”5選

          関連キーワード 人工知能 | 資格 ビジネスにおける人工知能(AI)技術活用が進む中で、これから重要度が高まると考えられるのがAI技術関連の知識やスキルだ。今後は、AI技術関連の認定資格を持っていることがビジネスを開発したりキャリアを形成したりする上で有利に働く可能性がある。本稿はAI関連の認定資格を取得できる主要なコース10選のうち、後半の5つを紹介する。 6. Courseraの「Introduction to TensorFlow for Artificial Intelligence, Machine Learning and Deep Learning」 併せて読みたいお薦め記事 連載:仕事に役立つ「AI」資格10選 前編:「AI系の資格」を持っておくのが“賢い選択”になる3つの理由 中編:「AI」のエキスパートになるなら、どの知識とスキルを極めるべき? 資格に関する記事 “DX

            「AIの基本から応用」までをマスターできる“学習コース”5選
          • 今さらNetVLADの日本語解説 - takminの書きっぱなし備忘録 @はてなブログ

            NetVLADは結構メジャーな手法だと思ってたんだけど、案外日本語解説はネットに落ちてないんだね。昨今、有名な手法は誰かしらブログ書いてるイメージだったので意外。— Minagawa Takuya (@takmin) 2024年3月22日 というわけで、自分が解説記事を書こうかと思い立ちました。 NetVLADが発表されたのは2016年のCVPRなので[1]、進化の早いAI分野では古めの技術となってしまいますが、画像検索(Image Retrieval)や、撮影場所の推定(Visual Place Recognition)などの論文に未だに現役で出てくる手法なので、この日本語記事が色んな人の役に立ったら良いなと期待してます。 NetVLADは1枚の画像全体を1つの特徴ベクトル(Global Feature)に変換するためのもので、例えば画像検索タスクであれば、クエリー画像から抽出した特徴ベ

              今さらNetVLADの日本語解説 - takminの書きっぱなし備忘録 @はてなブログ
            • So What - Georgia Live At Outernet

              Georgia - "So What" Live At Outernet, from the album 'Euphoric', out now on Domino Record Co. Subscribe to Georgia on YouTube: https://georgia.ffm.to/yt Stream & order 'Euphoric': https://georgia.ffm.to/euphoric Georgia is a Londoner, producer, club-informed forward thinker. Continuing to push boundaries, these films are another expression of the visual language created for her album campaign,

                So What - Georgia Live At Outernet
              • 無料で使えるAI-OCRの機能や使い方を徹底紹介

                AI-OCRというと、AIという技術の価値にあわせ、企業向けの値段設定がされている場合が多いです。 一方、無料で利用できると宣伝している、AI‐OCRサービスも増えつつあります。 印字や手書き文字をテキストに変換する技術をオンライン・無料で利用できるというメリットを感じる一方、扱う際には実運用になじむかどうか注意も必要になります。 無料で利用可能なAI-OCRサービスと、利用時の注意点について解説します。 AI-OCRは機械学習や深層学習などのAI技術をOCRに活用したサービスです。従来のOCRは読取精度が常に一定でした。一方でAI-OCRは読み取ったデータをAIが学習することで、文字の識別精度が向上します。従来のOCRでは読み取りが困難であった手書きなどの非定型文章であっても、AI-OCRは高い精度でテキストデータへの変換が可能です。そのため業務での活用が期待されています。 1 OCRと

                  無料で使えるAI-OCRの機能や使い方を徹底紹介
                • Wavelet Diffusion: 最高速の拡散モデル

                  3つの要点 ✔️ 拡散モデルは高い出力画質と高い多様性を持ち、GANを上回っているが、推論速度が非常に遅いため、リアルタイムでの使用が難しい ✔️ 先行研究のDiffusionGANはGANの仕組みと組み合わせることで、推定速度を大幅に向上できた ✔️ DiffusionGANをベースにして、低周波数成分と高周波数成分に変換することで、入力を4倍圧縮して、高画質維持しながら、拡散モデルの中で最高速を達成した Wavelet Diffusion Models are fast and scalable Image Generators written by Hao Phung, Quan Dao, Anh Tran (Submitted on 29 Nov 2022 (v1), last revised 22 Mar 2023 (this version, v2)) Comments: Ac

                    Wavelet Diffusion: 最高速の拡散モデル
                  • 2023: A year of groundbreaking advances in AI and computing

                    2023: A year of groundbreaking advances in AI and computing Posted by Jeff Dean, Chief Scientist, Google DeepMind & Google Research, Demis Hassabis, CEO, Google DeepMind, and James Manyika, SVP, Google Research, Technology & Society This has been a year of incredible progress in the field of Artificial Intelligence (AI) research and its practical applications. As ongoing research pushes AI even fa

                      2023: A year of groundbreaking advances in AI and computing
                    • MELON: Reconstructing 3D objects from images with unknown poses

                      Posted by Mark Matthews, Senior Software Engineer, and Dmitry Lagun, Research Scientist, Google Research A person's prior experience and understanding of the world generally enables them to easily infer what an object looks like in whole, even if only looking at a few 2D pictures of it. Yet the capacity for a computer to reconstruct the shape of an object in 3D given only a few images has remained

                        MELON: Reconstructing 3D objects from images with unknown poses
                      • Lang Segment Anything – Object Detection and Segmentation With Text Prompt - Lightning AI

                        ← Back to blog Lang Segment Anything – Object Detection and Segmentation With Text Prompt Posted on May 24, 2023 by Adam Kuhn - Community, Tutorials Takeaways Our community member Luca Medeiros shows how he leveraged the Segment Anything Model from Meta AI and built his lang-segment-anything library for object detection and image segmentation based on text prompts. Segment Anything Model (SAM)In r

                          Lang Segment Anything – Object Detection and Segmentation With Text Prompt - Lightning AI
                        • Ollama : ローカル環境で容易にllamaを利用可能にるするAIチャットプログラム|AstroPomeAI

                          特徴 (ChatGPTによる調査)コマンドラインインターフェースを通じて大規模言語モデル(LLM)とやり取り可能なAIチャットプログラム LlamaやCode Llamaなど、さまざまなオープンソースモデルをサポート モデルのパラメーターやサイズが異なり、計算リソースに応じたAIモデルの実行を柔軟に対応 Dockerがインストールされたシステムで利用可能で、Nvidia GPUのGPUアクセラレーションをサポート(CPU上でも実行可能) パフォーマンスはハードウェアに依存し、例えばLlama 2の7Bモデルを実行するには最低15GBのRAMと4つのCPUコアが必要 MacOSとLinux用のデスクトップアプリケーションがあり、Windows版が開発中 ユーザーフレンドリーでテスト環境での効果が実証されており、モデルのダウンロードが簡単 コマンドラインの性質により、ターミナルで直接迅速にチャ

                            Ollama : ローカル環境で容易にllamaを利用可能にるするAIチャットプログラム|AstroPomeAI
                          • Generating value from enterprise data: Best practices for Text2SQL and generative AI | Amazon Web Services

                            AWS Machine Learning Blog Generating value from enterprise data: Best practices for Text2SQL and generative AI Generative AI has opened up a lot of potential in the field of AI. We are seeing numerous uses, including text generation, code generation, summarization, translation, chatbots, and more. One such area that is evolving is using natural language processing (NLP) to unlock new opportunities

                              Generating value from enterprise data: Best practices for Text2SQL and generative AI | Amazon Web Services
                            • Person Re-Identificationの全体像を把握してみた - yuichinagapan’s diary

                              今回、エンジニアアルバイトとして携わっている会社株式会社HULIX | 人流解析でPerson Re-Identificationに関する技術調査を行ったので、その内容を記事にまとめてみました。 この記事では具体的な研究の内容、例えばどのような手法が使われているかなどには深入りせずに、Person Re-Identification(以降Person Re-Id)は何を行っているかと、Person Re-Idを取り入れたシステムは現実的に実装可能なのかという視点で、記事を書いていこうと思います。 Person Re-Idとは Person Re-Id(日本語では人物再同定)とは、簡単にいうと、とあるカメラに映った人物が、別のカメラに映った場合に、その人物同士を同一人物として結びつけるようなタスクのことです。Person Re-Idの実システムへの導入が可能になれば、例えば大型商業施設などの

                                Person Re-Identificationの全体像を把握してみた - yuichinagapan’s diary
                              • Diffusion modelを用いたfew-shot商品画像分類の検討 - Preferred Networks Research & Development

                                はじめに 2023年度夏季インターンシップに参加させて頂きました、京都大学大学院情報学研究科知能情報学専攻1年の田村駿弥です。今回のインターンシップでは、拡散モデルを活用した商品画像のData Augmentationを行い、商品の分類精度を向上させるというプロジェクトに取り組みました。 背景 リテールチームでは、何の商品かを画像から推論する商品分類モデルを作成しています。商品分類モデルの学習にあたって、対象商品を3Dスキャンしたデータを用いて、架空の商品棚に対象商品を陳列させてレンダリングします。得られた大量のアノテーション付きCG商品画像を用いて商品分類モデルを学習させることで、高精度な商品の分類が可能となっています。 レンダリングしたCG商品画像の例 しかし、日々開発される新商品を全て3Dスキャンすることは非現実的であるため、3Dスキャンなしで分類精度を上げる手法が、特に数枚の商品写

                                  Diffusion modelを用いたfew-shot商品画像分類の検討 - Preferred Networks Research & Development
                                • WTF Is a Vector Database: A Beginner's Guide!

                                  In the age of burgeoning data complexity and high-dimensional information, traditional databases often fall short when it comes to efficiently handling and extracting meaning from intricate datasets. Enter vector databases, a technological innovation that has emerged as a solution to the challenges posed by the ever-expanding landscape of data. Understanding Vector Databases Vector databases have

                                    WTF Is a Vector Database: A Beginner's Guide!
                                  • 🤗 Transformers

                                    🤗 Transformers PyTorch, TensorFlow, JAXのための最先端機械学習。 🤗 Transformers は最先端の学習済みモデルを簡単にダウンロードして学習するAPIとツールを提供します。学習済みモデルを使用することで計算コストと二酸化炭素の排出量を削減でき、またゼロからモデルを学習するために要求される時間とリソースを節約することができます。 これらのモデルは以下のような異なるモダリティにおける一般的なタスクをサポートします: 📝 自然言語処理: テキスト分類、 固有表現抽出、 質問応答、 言語モデリング、 文章要約、 機械翻訳、 複数選択、テキスト生成。 🖼️ コンピュータビジョン: 画像分類、 物体検出、 セグメンテーション。 🗣️ 音声: 自動音声認識、音声分類。 🐙 マルチモーダル: テーブル質問応答、 光学文字認識(OCR)、 スキャンさ

                                      🤗 Transformers
                                    • 「ChatGPTがあればUiPathはいらない」という“暴言”に、最高製品責任者の回答は?【前編】

                                      生成AIを使ったソリューションが次々とリリースされている。RPAをはじめとする自動化技術を内包した自動化プラットフォームを提供するUiPathは、生成AIが「業務の自動化」にもたらす影響についてどのように考えているのか。 同社で最高製品責任者を務めるグラハム・シェルドン(Graham Sheldon)氏がインタビューに答えた。前編の本稿では、生成AIを活用したUiPathの機能とそれらが業務自動化に与えるインパクトについて、後編では日本企業における自動化の特徴と、企業の自動化プロジェクトをより深化させる方法について、同氏が語った内容を紹介する。 生成AIが「業務の自動化」にもたらすものは? ――今、多くの人々がAI(人工知能)と業務自動化の融合に注目しています。 シェルドン氏: AIと業務自動化が融合することによって“魔法”が生まれます。ほとんどの企業にとって業務自動化は戦略的な必須事項に

                                        「ChatGPTがあればUiPathはいらない」という“暴言”に、最高製品責任者の回答は?【前編】
                                      • Automated Guided Vehicle Market Size, Growth, Trends 2032 | MRFR

                                        Automated Guided Vehicle Market By Vehicle Type (Tow, Unit Load Carrier, Pallet Truck, Forklift Truck, Hybrid Vehicles), Navigation Technology (Laser, Magnetic, Vision, Inductive, Natural Navigation), Application (Logistics and Warehousing, Transportation, Cold Storage, Wholesale & Distribution, Cross-docking, Assembly, Packaging, Trailer Loading & Unloading, Raw Material Handling), End-use Indust

                                        • Year in Review: Deep Learning Papers in 2023 | Hippocampus's Garden

                                          Year in Review: Deep Learning Papers in 2023January 27, 2024  |  12 min read  |  384 views enmachine-learningdeep-learningAs we step into 2024, let’s take a moment to look back at the significant progress made in deep learning throughout the past year. In this year-in-review post, I’ll share my 10 favorite papers from 2023. I hope you enjoy it! If you’re interested in this post, you can also check

                                            Year in Review: Deep Learning Papers in 2023 | Hippocampus's Garden
                                          • LINE株式会社を退職しました(②Computer Vision Lab新規設立の喜びと苦労)|Yamato.OKAMOTO

                                            もくじ私がLINEを大好きになった理由と魅力 Computer Vision Lab新規設立の喜びと苦労(←本記事) 退職理由(←本記事) 前回の記事では、あまりに筆が走りすぎて記事が長くなったので前後半に分けました。後半は、Computer Vision Labを立ち上げた話を綴ります。なお、本記事に企業の機密情報や悪口は含まれません(当然)。 Computer Vision Lab新規設立の喜びと苦労新卒入社のオムロンを辞めてLINEに転職したきっかけは「一緒にComputer Vision Labの立ち上げ人をやってほしい!」という嬉しいお声がけでした。LINEは私の大好きな京都にオフィスを構えていて、エキサイトな研究に挑戦中なのも知っていたので、転職を即決しました。 楽しすぎた研究所の立ち上げComputer Vision Labの立ち上げにあたって、初期メンバで話し合いながら、ど

                                              LINE株式会社を退職しました(②Computer Vision Lab新規設立の喜びと苦労)|Yamato.OKAMOTO
                                            • Software Technical Writing: A Guidebook

                                              Software Technical Writing: A Guidebook James (jamesg.blog) Software Technical Writing: A Guidebook Contents License 5 Introduction 6 My experience starting as a technical writer 8 Why technical writing? . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 Mediums of writing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Moving on: Reference material, communication . . . . . . . . .

                                              • Stanford CS25: V1 I Transformers United: DL Models that have revolutionized NLP, CV, RL

                                                Since their introduction in 2017, transformers have revolutionized Natural Language Processing (NLP). Now, transformers are finding applications all over Deep Learning, be it computer vision (CV), reinforcement learning (RL), Generative Adversarial Networks (GANs), Speech or even Biology. Among other things, transformers have enabled the creation of powerful language models like GPT-3 and were ins

                                                  Stanford CS25: V1 I Transformers United: DL Models that have revolutionized NLP, CV, RL
                                                • Give It Up For Love - Georgia Live At Outernet

                                                  Georgia - "Give It Up For Love" Live At Outernet, from the album 'Euphoric', out now on Domino Record Co. Subscribe to Georgia on YouTube: https://georgia.ffm.to/yt Stream & save "Give It Up For Love": https://georgia.ffm.to/giveitupforlove Stream & order 'Euphoric': https://georgia.ffm.to/euphoric Georgia is a Londoner, producer, club-informed forward thinker. Continuing to push boundaries, t

                                                    Give It Up For Love - Georgia Live At Outernet
                                                  • Get Into AI: The Only Relevant Guide, By Experts (2023)

                                                    You’re most likely here because you want to learn: How to get into AI – Artificial Intelligence But you have no idea where to begin And all other guides are: too long, hard to read, and say same thing I’ve been in your position — and I’ve been through all these boring guides. The search stops here. Read below this paragraph and you’ll become a pro in AI and ML. Contents Chapter I: Fundamentals Cha

                                                      Get Into AI: The Only Relevant Guide, By Experts (2023)
                                                    • GPU Shortage, Affordable Robodog, Humanizing Large Language Models, and more

                                                      Dear friends, An increasing variety of large language models (LLMs) are open source, or close to it. The proliferation of models with relatively permissive licenses gives developers more options for building applications. Here are some different ways to build applications based on LLMs, in increasing order of cost/complexity: Prompting. Giving a pretrained LLM instructions lets you build a prototy

                                                        GPU Shortage, Affordable Robodog, Humanizing Large Language Models, and more
                                                      • Cognition | Introducing Devin, the first AI software engineer

                                                        /blog Introducing Devin, the first AI software engineer March 12, 2024 by Scott Wu Setting a new state of the art on the SWE-bench coding benchmark. Meet Devin, the world’s first fully autonomous AI software engineer. AnnouncementsDevin Devin is a tireless, skilled teammate, equally ready to build alongside you or independently complete tasks for you to review. With Devin, engineers can focus on m

                                                        • Revealed: a California city is training AI to spot homeless encampments

                                                          For the last several months, a city at the heart of Silicon Valley has been training artificial intelligence to recognize tents and cars with people living inside in what experts believe is the first experiment of its kind in the United States. Last July, San Jose issued an open invitation to technology companies to mount cameras on a municipal vehicle that began periodically driving through the c

                                                            Revealed: a California city is training AI to spot homeless encampments
                                                          • AI manga translation start-up Orange gets $20 million in funding

                                                            Orange Inc., developers of a Japanese-to-English language manga localization tool, announced earlier this week that it secured 2.92 billion yen (approximately $19.4 million USD, based on the current 1 USD = 150 yen exchange rate) in pre-Series A round funding. This round of funding for this US/Japan-based start-up include investments from Japanese publisher Shogakukan (publisher of Shonen Sunday m

                                                              AI manga translation start-up Orange gets $20 million in funding
                                                            • Microsoft Word - Version Beta v2

                                                              1 Computer Science Curricula 2023 Version Beta March 2023 The Joint Task Force on Computing Curricula Association for Computing Machinery (ACM) IEEE-Computer Society (IEEE-CS) Association for Advancement of Artificial Intelligence (AAAI) 2 Steering Committee members: ACM members:  Amruth N. Kumar, Ramapo College of NJ, Mahwah, NJ, USA (ACM CoChair)  Monica D. Anderson, University of Alabama, Tus

                                                              • 【UniD3】画像と文章を統合的に扱うマルチモーダル離散拡散モデル

                                                                3つの要点 ✔️ Any-to-Anyを実現するマルチモーダル拡散モデル ✔️ 画像と文章を1つの離散トークンとして(統合的に)扱う ✔️ デノイジングにMutual Attention付きのTransformerを導入 Unified Discrete Diffusion for Simultaneous Vision-Language Generation written by Minghui Hu, Chuanxia Zheng, Heliang Zheng, Tat-Jen Cham, Chaoyue Wang, Zuopeng Yang, Dacheng Tao, Ponnuthurai N. Suganthan (Submitted on 27 Nov 2022) Comments: Published on arxiv. Subjects: Computer Vision a

                                                                  【UniD3】画像と文章を統合的に扱うマルチモーダル離散拡散モデル
                                                                • AIを使えば標的型攻撃が“超簡単”に 5つの要素で攻撃に対処せよ

                                                                  「ChatGPT」に代表される対話型のAI(人工知能)チャットサービス(生成AIやチャットbotAIなどとも呼ばれる)をサイバー攻撃に悪用する場合、どのようなケースが考えられるのか。 本連載「ChatGPTでサイバー犯罪はどう変わるか」では、第1回でChatGPTを取り巻く動向と、サイバーセキュリティにおけるAIチャットサービスの脅威について特に懸念されるビジネスメール詐欺(BEC)について説明した。第2回となる本稿は、悪意あるAIから組織を守るための対策を紹介する。 著者紹介:伊藤利昭 Vade Japan カントリーマネージャー 2020年1月に就任。責任者として、日本国内におけるVadeのビジネスを推進する。これまで実績を重ねてきたサービスプロバイダー向けのメールフィルタリング事業の継続的な成長と新たに企業向けのメールセキュリティを展開するに当たり、日本国内のパートナーネットワークの

                                                                    AIを使えば標的型攻撃が“超簡単”に 5つの要素で攻撃に対処せよ
                                                                  • 直感的に理解する Transformer への CNN の導入 - hello-stats - BOOTH

                                                                    2020 年に発表された ViT(Vision Transformer) はそれまで畳み込みニ ューラルネットワーク (CNN; Convolutional Neural Network) が支配的で あった Computer Vision 分野における DeepLearning に新たなトレンドを もたらしました。 しかしながら、必要な学習データが多い・計算効率があまりよくないなどの課題がありました。 そこでそれらの課題の解決を図るために、階層型 ViT の研究が 2021 年頃に多く発表され ました。 本書では階層型 ViT の中でも Convolutional vision Transformer で導入 された「Transformer への CNN の導入」をメインテーマに詳しく取りまと めました。 2020 年に発表された ViT(Vision Transformer) はそれま

                                                                      直感的に理解する Transformer への CNN の導入 - hello-stats - BOOTH
                                                                    • アニメスタイルの自動彩色手法のご紹介 | 株式会社 IMAGICA GROUP Advanced Research Group

                                                                      IMAGICA GROUP ARG(Advanced Research Group)とオー・エル・エム・デジタルでは、奈良先端科学技術大学院大学、千葉大学と共同でアニメキャラクター線画に対する自動彩色技術に関する研究を進めています。 ここでは、その成果の1つである、アニメスタイルの自動彩色手法をご紹介します。 まず、我々の自動彩色手法を用いた彩色結果の例を図1に示します。Few-shot learningにもとづき、少数の線画・彩色済みの線画のペアを使ってアニメスタイルの自動彩色を行っています[1]。 図1.我々の手法とCadmium Appによる彩色結果の比較 比較のため、ICCV2021で発表されたAnimation Transformer[5]を使った彩色ツールCadmium App[6]を使った彩色結果も示してあります。mIoUとは、領域分割の精度評価で一般的に使われているもので、

                                                                        アニメスタイルの自動彩色手法のご紹介 | 株式会社 IMAGICA GROUP Advanced Research Group
                                                                      • 「Surface Laptop 7」のCPU性能を詳細に調べてみた - 秋葉原ぶらり

                                                                        ついに発売された「Surface Laptop 7」。AIに最適化されたことで早くも注目を集めています。しかし、肝心のプロセッサ性能はまだ不明な部分が多く、購入をためらっている人も多いのではないでしょうか? そこで今回は「Surface Laptop 7」のプロセッサ性能を5つの観点で詳細に検証してみました。 CPU ベンチマーク グラフィック性能 AIの性能 消費電力 また、前モデル「Surface Laptop 5」やAppleのMacBookとの比較も紹介!AIを使って利用できるアプリやサービス、新プロセッサの注意点もあるのでぜひ参考にしてみてください。 「Surface Laptop 7」が発売開始! 2024年6月18日、日本でマイクロソフトの新製品「Surface Laptop 7」(サーフェイス ラップトップ 7)が発売されました。 Snapdragon X Elite /

                                                                        • 少量データでも高性能に?Multilabel approachでPET/CTの病変誤認を改善!

                                                                          3つの要点 ✔️ マルチラベルモデルの有効性を実証 ✔️ PET/CT の病変誤認を改善 ✔️ 追加のデータだけでなく複数のラベルを組み込むことの重要性を実証 Improving Lesion Segmentation in FDG-18 Whole-Body PET/CT scans using Multilabel approach: AutoPET II challenge written by Gowtham Krishnan Murugesan, Diana McCrumb, Eric Brunner, Jithendra Kumar, Rahul Soni, Vasily Grigorash, Stephen Moore, Jeff Van Oss (Submitted on 2 Nov 2023) Comments: AutoPET II challenge paper Su

                                                                            少量データでも高性能に?Multilabel approachでPET/CTの病変誤認を改善!
                                                                          • ACC-UNet:2020年代に向けた完全畳み込みUNet

                                                                            3つの要点 ✔️ 従来のUNetに新しい畳み込みブロックとスキップ接続を導入して、新しい完全畳み込みUNetを提案 ✔️ 提案するUNetはCNNの帰納バイアスとTransformerの大域特徴の抽出能力の両方を活用可能 ✔️ 異なる5タスクでUNetの中で、SOTAの精度を達成 ACC-UNet: A Completely Convolutional UNet model for the 2020s written by Nabil Ibtehaz, Daisuke Kihara (Submitted on 25 Aug 2023) Comments: Published on arxiv. Subjects: Computer Vision and Pattern Recognition (cs.CV) code: 本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれ

                                                                              ACC-UNet:2020年代に向けた完全畳み込みUNet
                                                                            • Computer Vision/Deep Learning論文千本ノック vol.2 - deconvo's blog

                                                                              誰も読まないだろうが貼っておく、味読・乱読・積読メモ。 https://drive.google.com/file/d/1XHaQNG6d3tXnvLzjvv_Qdj_eWGNfAhS8/view?usp=drive_link

                                                                                Computer Vision/Deep Learning論文千本ノック vol.2 - deconvo's blog
                                                                              • 【ChatAnything】テキストからデジタルペルソナを創造する新しいフレームワーク

                                                                                3つの要点 ✔️ 新しいフレームワーク「ChatAnything」の導入:テキスト入力から個性と視覚的特徴を持つペルソナを生成する新しいフレームワークを提案。 ✔️ 画像生成とトーキングヘッドモデルとの統合の課題:生成された画像がトーキングヘッドモデルに適合しない問題に対処。 ✔️ 将来の研究への展望:ゼロショット手法を用いた生成モデルとトーキングヘッドモデルの融合、そして、その潜在的な改善点を提示。 ChatAnything: Facetime Chat with LLM-Enhanced Personas written by Yilin Zhao, Xinbin Yuan, Shanghua Gao, Zhijie Lin, Qibin Hou, Jiashi Feng, Daquan Zhou (Submitted on 12 Nov 2023) Subjects: Compute

                                                                                  【ChatAnything】テキストからデジタルペルソナを創造する新しいフレームワーク
                                                                                • 大学レベルの教養に挑む: 大規模マルチモーダルモデルのための新ベンチマーク「MMMU」

                                                                                  3つの要点 ✔️ 汎用人工知能(AGI)のレベル3として定義される「エキスパートAGI」の進歩を評価する方法の重要性を提起。 ✔️  大学レベルのマルチモーダル理解を評価するための新しいベンチマーク「MMMU」を提案し、AIモデルの専門知識と推論能力を評価。 ✔️ 現在のAIモデル(GPT-4Vを含む)はMMMUで低い性能を示しており、エキスパートAGIの達成に向けて更なる改善が必要であることを指摘。 MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI written by Xiang Yue, Yuansheng Ni, Kai Zhang, Tianyu Zheng, Ruoqi Liu, Ge Zhang, Samuel Stevens, Do

                                                                                    大学レベルの教養に挑む: 大規模マルチモーダルモデルのための新ベンチマーク「MMMU」