タグ

ブックマーク / acro-engineer.hatenablog.com (4)

  • PythonでPDFからテキスト/表情報の抽出精度を比較してみた - Taste of Tech Topics

    はじめに こんにちは。ついにジム通いを始めて四六時中筋肉痛を感じながら過ごしているイワツカです。 最近はLLM(大規模言語モデル)とRAG(検索拡張生成)を用いて企業内ドキュメントを活用する取り組みが多く見受けられます。 ドキュメントは基PDFで保存されているため、PDFからテキストを抽出して、検索対象にすることが必要です。 そこで今回は、PythonPDFからテキストを抽出するためのライブラリを比較して、どれが良いのか検証しました。 はじめに 概要 実装 PyMuPDF pdfplumber unstructured 比較結果 テキスト抽出 サンプル1のテキスト抽出結果 サンプル2のテキスト抽出結果 表の抽出 サンプル3の表抽出結果 サンプル4の表抽出結果 検証結果 まとめ 概要 今回はPDF読み取りライブラリとして、PyMuPDFpdfplumber、unstructuredの3

    PythonでPDFからテキスト/表情報の抽出精度を比較してみた - Taste of Tech Topics
    jin07nov
    jin07nov 2024/09/12
  • ChatGPTとOneDriveを連携させて業務効率化 - Taste of Tech Topics

    はじめに こんにちは、イワツカです。 最近は湿度と気温が高く蒸し暑いので海やプールで涼みたいものですね。 さて今回は、OpenAIからChatGPTExcelデータの分析機能が進化したという発表があったので、OneDrive上のファイルをもとにExcelデータをどのように分析できるのか試してみます。 はじめに 概要 Google Drive・Microsoft OneDriveからのファイル連携 テーブルデータのインタラクティブな操作 この記事で試すこと OneDriveとの連携方法 OneDriveからファイルをアップロードしてみる ChatGPTデータ分析する アップロードされたExcelのテーブルを見る テーブルをプロンプトから操作 グラフを出力 まとめ 概要 今回、ChatGPTデータ分析機能の強化として以下2点の新機能が発表されました。 ・OneDrive・Google D

    ChatGPTとOneDriveを連携させて業務効率化 - Taste of Tech Topics
    jin07nov
    jin07nov 2024/07/26
  • ChatGPTの Assistants API でPDFを要約 - Taste of Tech Topics

    こんにちは、安部です。 最近急に、暖かさを通り越して暑いぐらいになってきましたが、皆さまいかがお過ごしでしょうか。 季節外れかなとも思いつつ、もう半袖で過ごしたいくらいの気候ですね。 さて、今回は、OpenAIのAssistants APIの使い方を紹介していきます。 題材は「PDFを和訳して要約してもらう」としました。 これはWeb版のChatGPTでも単にPDFファイルを添付して依頼すればできますが、APIの使い方を示すサンプルとしてはちょうどよいと思います。 最新情報については以下の公式ドキュメントをご覧ください。 https://platform.openai.com/docs/assistants/overview https://platform.openai.com/docs/api-reference/assistants それでは早速、Assistants APIの使い方

    ChatGPTの Assistants API でPDFを要約 - Taste of Tech Topics
    jin07nov
    jin07nov 2024/04/16
  • ChatGPT Code Interpreterで画像編集をしてみる - Taste of Tech Topics

    カメラ好き機械学習エンジニアの@yktm31です。 先日、以下のように、ChatGPTのCode Interpreterを用いて、画像データを加工する記事を書きました。 その際は、リサイズや画像の切り抜きなど、基的な加工ができることを確認しました。 今回は、画像編集ソフトで行うような、より高度な画像処理を実施してみたいと思います。 acro-engineer.hatenablog.com 利用する画像は前回記事と同様、以前撮影した富士山の写真を使いたいと思います。 画像処理/加工 今回、以下のような画像処理/加工を実施してみました。 ガンマ補正を適用し画像を明るくする CLAHEを適用しコントラストを調整する シャープネスを向上させる ノイズ除去を適用する ガンマ補正を適用し画像を明るくする ガンマ補正は、画像の明るさを非線形に調整するための手法です。 一番単純に画像を明るくする方法は、

    ChatGPT Code Interpreterで画像編集をしてみる - Taste of Tech Topics
    jin07nov
    jin07nov 2023/08/03
  • 1