並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 3 件 / 3件

新着順 人気順

OCRの検索結果1 - 3 件 / 3件

  • 積読を消化する技術 - sasasin’s blog

    私は積読の山々を眺めると、買ったのに読まず積み上がってる現状にイラつくし、最近ではSNSや書店で面白そうな本を目撃してもどうせ積読になるからと買い控えするようになってきている。 これは私の望むところではないと一念発起し、ふとYoutubeやPodcastのような受動的なコンテンツは1日に何時間でも視聴してると気付き、読書も受動的な形にできれば、、、読み上げか!と。 書籍を読み上げることで積読の消化が捗ってきたので、とりあえず現状をまとめてみた。 ウェブページ のっけから書籍ではないけど、ウェブページも「後で読む」が無限に積み上がる。 Pocket で消化する。 任意のウェブページ Android 版 Pocket の「聴く」で読み上げる。「聴く」の設定で「記事を自動再生」「聴いた後に自動アーカイブ」することで、どんどん消化していける。 Pocket が読み上げできないウェブページは、記事を

      積読を消化する技術 - sasasin’s blog
    • ドキュメントをMarkdownやJSONに変換してくれる「Docling」を試す

      ここで知った。 試しに、神戸市が公開している観光に関する統計・調査資料のうち、「令和5年度 神戸市観光動向調査結果について」のPDFで一度試していたのだけども: (出典) 神戸市Webサイトの「観光に関する統計・調査」のページ 上記にある「令和5年度 神戸市観光動向調査結果について」のPDF 日本語でも、概ね問題なく、表などもきれいにパースされる ただし、表が画像 になってる場合に、うまく解釈されない(表は解釈されるが、中の文字が化ける) OCRが正しくできていない可能性 というのがあって、ドキュメント読んだけどわからなくて、それ以上深追いしてなかった。 ただ、X界隈を見る限りは評判は良さそうで、いろいろ記事も出てきたみたいなので、改めて試してみる。 GitHubレポジトリ ドキュメント Docling Doclingは、ドキュメントを解析し、簡単かつ迅速に希望の形式にエクスポートします。

        ドキュメントをMarkdownやJSONに変換してくれる「Docling」を試す
      • ドキュメントファイルの解析と変換に特化したオープンソースツール「docling」を試してみた | DevelopersIO

        AWS事業本部コンサルティング部の石川です。最近、文書ファイルの解析と変換に特化した オープンソースツール「docling」 が注目を集めています。このツールは、最先端のAIモデルを活用して、ドキュメントの構造を理解し、様々な形式に変換することができます。今回、実際にdoclingを使用して日本語のドキュメントファイルからMarkdownファイルとJSONファイルへ変換を試してみます。 doclingとは doclingは、ドキュメントの変換と解析に特化したオープンソースのPythonパッケージです。最先端の人工知能モデルを活用し、レイアウト解析にDocLayNetモデル、表構造認識にTableFormerモデルを使用しています。一般的なハードウェアで効率的に動作し、少ないリソースで高性能を発揮します。JSONやMarkdown形式への変換が可能で、拡張性も高く、新機能やモデルの追加が容易

          ドキュメントファイルの解析と変換に特化したオープンソースツール「docling」を試してみた | DevelopersIO
        1