


  • から
  • まで

1 - 7 件 / 7件

新着順 人気順

Nougatの検索結果1 - 7 件 / 7件

  • 数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB

    科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。 Nougatは、数式や文章が複雑に配置された画像であっても、それをマークアップ言語に高品質で変換する能力を持っています。この技術は、新しい論文だけでなく、電子データが存在しない古い書類などの解析にも非常に有用です。 参照論文情報 タイトル:Nougat: Neural Optical Understanding for Academic Documents 著者:Lukas Blecher, Guillem

      数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB
    • 論文PDFを数式込みで全文読み取るモデル 米Metaが「Nougat」開発 スキャンした古書の画像もOK

      このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Meta AIに所属する研究者らが発表した論文「Nougat: Neural Optical Understanding for Academic Documents」は、論文を記録したPDF内のテキストや数式を正確に読み取るモデルを提案した研究報告である。研究論文を機械が読めるテキストに変換することで、知識全体がより探しやすく、多くの人々がアクセスできるようになる。モデルのコードなどは全て公開されている。

        論文PDFを数式込みで全文読み取るモデル 米Metaが「Nougat」開発 スキャンした古書の画像もOK
      • 「Google Chrome 107」が正式公開 ~14件の脆弱性に対処、新しいダウンロードUIを展開/Android版のサポートOSは「Android 7.0 Nougat」以降に

          「Google Chrome 107」が正式公開 ~14件の脆弱性に対処、新しいダウンロードUIを展開/Android版のサポートOSは「Android 7.0 Nougat」以降に
        • 「Google Chrome 119」が正式公開 ~Android版は「Android 7.0 Nougat」対応を終了/セキュリティ関連の修正は全15件

            「Google Chrome 119」が正式公開 ~Android版は「Android 7.0 Nougat」対応を終了/セキュリティ関連の修正は全15件
          • GitHub - facebookresearch/nougat: Implementation of Nougat Neural Optical Understanding for Academic Documents

            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

              GitHub - facebookresearch/nougat: Implementation of Nougat Neural Optical Understanding for Academic Documents
            • Nougat: Neural Optical Understanding for Academic Documents

              Scientific knowledge is predominantly stored in books and scientific journals, often in the form of PDFs. However, the PDF format leads to a loss of semantic information, particularly for mathematical expressions. We propose Nougat (Neural Optical Understanding for Academic Documents), a Visual Transformer model that performs an Optical Character Recognition (OCR) task for processing scientific do

              • Nougat

