エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
数式を含むスキャン画像のPDFをOCRしてマークダウン形式に変換できる。Nougatを試す|はまち
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
数式を含むスキャン画像のPDFをOCRしてマークダウン形式に変換できる。Nougatを試す|はまち
Meta社が公開した数式を含むPDFのOCRモデル、Nougat (Neural Optical Understanding for Academic Docum... Meta社が公開した数式を含むPDFのOCRモデル、Nougat (Neural Optical Understanding for Academic Documents)を試してみました。 PDFを入力すると、いい感じにLaTeX埋め込みマークダウン形式で出力されるので、いろいろ捗りそうです。😄 なお、コードはMITライセンス、モデルウェイトはCC-BY-NCライセンスになっています。 https://facebookresearch.github.io/nougat/ Google Colabで実行してみますGPUを有効にしてインストール !pip install nougat-ocr目的のPDFを入力 !nougat /content/Attention_Is_All_You_Need.pdf --out .出力結果いい感じにマークダウン形式で出力されました。 左: マークダウン形