タグ

markdownとPDFに関するmkusakaのブックマーク (2)

  • PDFを高品質なマークダウンに変換する方法|すぅ | AI駆動PM

    PDFファイルをマークダウンに変換する作業って、地味だけど当に大切な作業ですよね。 「また手作業でコピペか...」 「レイアウトが崩れてる...」 「表がめちゃくちゃになってる...」 私もさまざまな文書管理の現場で同じような課題に直面してきました。特に、既存のPDF資料をObisidianやNotionなどのマークダウン形式で管理したい場面って、当に多いですよね。 手作業でやると、一つの文書だけで数時間かかることもあります。表や画像の配置を調整して、リンクを張り直して、フォーマットを整えて...。骨が折れる作業です。 「もっと効率的な方法はないだろうか?」 そう思っていた矢先、いくつかの優秀な手法を発見しました。今回は、スキルレベル別に4つのアプローチをご紹介したいと思います。 【各レベルの概要】まず、それぞれのアプローチの特徴を簡単にご紹介しておきますね。 レベル1:GPT-5でシ

    PDFを高品質なマークダウンに変換する方法|すぅ | AI駆動PM
    mkusaka
    mkusaka 2025/12/24
    PDFをMarkdownに変換する4つのレベルを紹介、GPT‑5のシンプル変換やMarkitdownで30秒・90%精度、Doclingで最高精度を実現
  • Geminiを使うと本当に1ドルで6000ページ分のPDFをMarkdown化できるのか? - Ahogrammer

    少し前に、Hacker Newsで以下の記事が話題になっていました。 www.sergey.fyi この記事では、Geminiのモデル(Gemini 2.0 Flash)を使うと、1ドルで6000ページ分のPDFMarkdown化できるという話が書いてあります。方法的には、各ページを画像化してモデルに渡してMarkdownを出力するだけなので珍しくはないのですが、その価格でそれだけ処理できるの?という部分に興味を持ちました。そこで、価格の計算をし、実際に試してみることにしました。 価格の計算 記事にも価格計算の方法は書かれているのですが、ここでも改めて計算してみます。対象とするモデルはGemini 2.0 Flash、価格計算には2025/02/25時点の価格表[1]を使います。また、APIとしては、通常のAPIと比べて半額のバッチAPIを使った場合の価格を計算します。以下に計算に使う数

    Geminiを使うと本当に1ドルで6000ページ分のPDFをMarkdown化できるのか? - Ahogrammer
  • 1