ni66lingのブックマーク - はてなブックマーク

ni66ling id:ni66ling

ni66lingのブックマーク (8,484)

How to Extract Text from a PDF Using PyMuPDF and Python
ni66ling 2024/02/24
PDFの構造ブロック単位で抽出するチュートリアル

PyMuPDF

tutorial
リンク
pdfからtextを抜き出す試行錯誤のメモ｜Kan Hatakeyama
これは二段構えの構成を持っています。この二段構えを正確に検出し、テキストを理解することが望ましいです。 Unstructuredを使うPythonのライブラリであるUnstructuredを試してみましょう。参考記事導入は非常に簡単です。 pip install 'unstructured[pdf]' 実装も簡単です。解析コード： from unstructured.partition.pdf import partition_pdf pdf_elements = partition_pdf("pdf/7_71_5.pdf") 表示コード： for structure in pdf_elements: print(structure) 結果：残念ながら、2段組のカラムを正確に検出することはできませんでした。 Grobidを使うGrobidは、peS2oというオープンアクセス論文のコ
ni66ling 2024/02/24
Unstructured, Grobid, PyMuPDFを検証してPyMuPDFが相対的によく、二段カラムにもおおよそ対応できたとのこと

pdf

パーシング
リンク
https://arxiv.org/pdf/2209.11055.pdf
- 1 user
- arxiv.org
- 学び
ni66ling 2024/02/23
RoBERTaと比較してクラスごとのサンプル数が約64件以下であれば、SetFitのほうが精度高くfinetuningできる。

SetFit

paper

pdf

2022

few-shot learning
リンク
実際問題、Few-Shot学習手法SetFitはいつ使うとよいのか？ - Qiita
概要少量の学習データ（Few-Shot）でも精度が出る深層学習手法が登場してきています。その一つがSetF itです。テキスト分類向けのFew-Shot学習手法です。本記事では、SetF itを使うとよい（使わない方がよい）場面を見極めるために、リアルな問題に近い日本語ニュースジャンル分類タスクをお題に、学習データ数を変えながらそこそこ強い日本語T5と戦わせてみます。忙しい方向けに最初に結論をまとめ、その後にSetF itの使い方の説明を兼ねて実験を再現するためのコードの解説をしていきます。結論 Livedoor news記事のジャンル分類タスク（9分類タスク）について、クラスあたりのデータ数を2倍ずつ変えながら、SetF itと日本語T5それぞれについて分類精度を計測しました。結果は下図のとおりです。なお、クラスあたりのデータ数は全クラスで同一（均衡）になるようにランダムサンプリン
ni66ling 2024/02/23
クラスあたりのデータ数が64個未満（合計576個未満）ならSetFit, それ以上ならT5等

SetFit

few-shot learning

qiita

2022
リンク
Mastering Few-Shot Learning with SetFit for Text Classification | HackerNoon
ni66ling 2024/02/23
SetFit

few-shot learning

2023
リンク
https://scikit-learn.org/stable/modules/cross_validation.html
ni66ling 2024/02/23
cross validation

scikit-learn

tutorial
リンク
交差検証（Python実装）を徹底解説！図解・サンプル実装コードあり
何かを「正しい」と判断するとき、読者の皆様は何を根拠としますか。例えば、経験を元にする場合、一度だけの経験では偶然の可能性も考えられます。これが複数の経験からの判断であれば、少しは信憑性が増すと思います。一度の結果では信憑性が薄くとも、多くの結果を得られればある程度の精度で判断できる材料となります。機械学習も同様です。様々な特徴量を扱う機械学習では、予測モデル（以下：モデル）の評価が本当に「正しい」のかを判断することは難しい問題です。特に、過学習などの問題は機械学習の技術が発展している近年でも残り続けています。本稿では、機械学習を扱う上で重要な交差検証（クロスバリデーション）について解説します。前半ではデータ分割の基本と、交差検証の定義を解説をします。後半では実際のデータセットを用いて交差検証の実装を行います。交差検証は様々な場面で紹介されていますが、実際に学ぶと詰まるポイントが多い
ni66ling 2024/02/23
cross validation

tutorial

sample

python
リンク
GitHub - hppRC/bert-classification-tutorial: 【2023年版】BERTによるテキスト分類
A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?
ni66ling 2024/02/23
BERT

2023

text classification

文書分類

日本語

github

tutorial
リンク
GitHub - NirAharon/BoT-SORT: BoT-SORT: Robust Associations Multi-Pedestrian Tracking
ni66ling 2024/02/19
MOT

2022

github
リンク
Papers with Code - MOT20 Benchmark (Multi-Object Tracking)
ni66ling 2024/02/19
MOT

dataset

2020

leader board
リンク
GitHub - GerardMaggiolino/Deep-OC-SORT: https://arxiv.org/abs/2302.11813
ni66ling 2024/02/19
MOT

2023

github
リンク
GitHub - megvii-research/MOTRv2: [CVPR2023] MOTRv2: Bootstrapping End-to-End Multi-Object Tracking by Pretrained Object Detectors
ni66ling 2024/02/19
MOT

CVPR

2023

github
リンク
Multi-Object Trackingの精度評価指標 | 株式会社ARISE analytics（アライズアナリティクス）
Business Development Divisionでデータサイエンティストをしている秋元です。今回はARISEの画像分析チームが取り組んでいる画像処理技術の一つであるMulti-Object Trackingについて、その評価指標を紹介します。 1.Multi-Object Trackingとは Multi-Object Tracking（MOT）は、動画の中で移動していく複数の人や物をそれぞれ区別して継続的に追跡する画像処理技術です。技術的には画像処理の基本的な技術の一つである物体認識の応用技術になりますが、静止画の物体認識とは異なり動画中の物体は常に外観が変化し続けることから、非常に難しいタスクとされています。 MOTは研究が盛んな分野であり多くのアルゴリズムが開発されています。広く使われているTracking by Detectionと呼ばれる手法では、まず動画の各フレーム
ni66ling 2024/02/19
MOTA

IDF1

MOT

評価指標
リンク
【物体検出2022】BoT-SORTを使ってYOLOv7のモデルで物体追跡(MOT)を実装する - Qiita
はじめに物体検出でお馴染みのYOLOシリーズの最新版「YOLOv7」について、動かしながら試していきます。 YOLOv7は2022年7月に公開された最新バージョンであり、速度と精度の面で限界を押し広げています。今回の記事では、YOLOv7とBoT-SORTによる物体追跡(MOT)の実装方法を紹介します。 Google colabで簡単に最新の物体検出モデルを実装することができますので、ぜひ最後までご覧ください。（詳細） YOLOv7とは YOLOv7は2022年7月に公開された最新バージョンであり、5FPSから160FPSの範囲で速度と精度の両方ですべての既知のオブジェクト検出器を上回り、速度と精度の面で限界を押し広げています。これまでのYOLOR、YOLOX、Scaled-YOLOv4、YOLOv5、 DETR、Deformable DETR、DINO-5scale-R50、Vi
ni66ling 2024/02/18
BoT-SORT

MOT

qiita
リンク
Clustering Categorical Data: K-modes (CAT II)
ni66ling 2024/02/12
k-modes

clustering

categorical

kaggle
リンク
File naming ends with S, T or V
ni66ling 2024/02/11
S = spliced or screen (as in what was visible on the controller’s screen during recording), T = Thermal, V = Video

dji

mavic 3t
リンク
极飞科技
ni66ling 2024/02/10
xag

r150

login
リンク
RAGの性能を改善するための8つの戦略 | Fintan
近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル（Large Language Model：LLM）の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ
ni66ling 2024/02/09
rag

まとめ

2024

llm
リンク
YOLO Data Augmentation Explained
ni66ling 2024/02/09
yolo

data augmentation

tutorial

medium

2023
リンク
はじめての自然言語処理 MixCSE による教師なし文章ベクトル生成 | オブジェクトの広場
今回は教師なしの文章ベクトル化手法である MixCSE の検証です。教師なし学習ですから教師ありの手法よりは精度的に不利でしょうが、局面によっては役に立つケースもあるのでは？と試してみることに。公開されているコードは transf ormers ベースなのですが、今回は Colab の TPU で動かしてみたので、その方法も紹介しますね。 1. はじめに今回は教師なしの文章ベクトル化手法である MixCSE1 の検証をしてみました。本連載では文章ベクトル化のモデルとして、 Sentence BERT を取り上げたこと(第9回, 第18回)がありますが、品質の良いベクトルを生成する為には大量かつ良質の教師データが必要でした。法律や特許のような特定領域に特化した文章を扱う局面では、対象領域の文書で学習したモデルを使いたいところですが、特定領域限定の都合良いデータはなかなか手に入りません。そ
ni66ling 2024/02/09
nlp

finetuning
リンク
前のページ 1 2 3 4 5 6 7 8 9 10 次のページ

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx