少し前に、Hacker Newsで以下の記事が話題になっていました。 www.sergey.fyi この記事では、Geminiのモデル(Gemini 2.0 Flash)を使うと、1ドルで6000ページ分のPDFをMarkdown化できるという話が書いてあります。方法的には、各ページを画像化してモデルに渡してMarkdownを出力するだけなので珍しくはないのですが、その価格でそれだけ処理できるの?という部分に興味を持ちました。そこで、価格の計算をし、実際に試してみることにしました。 価格の計算 記事にも価格計算の方法は書かれているのですが、ここでも改めて計算してみます。対象とするモデルはGemini 2.0 Flash、価格計算には2025/02/25時点の価格表[1]を使います。また、APIとしては、通常のAPIと比べて半額のバッチAPIを使った場合の価格を計算します。以下に計算に使う数