CSS Typesetting 最新 Web 標準技術により、電子出版や Web 出版のための 新しい組版システムを作るオープンソース・プロジェクト
上達のコツはやはり反復練習!ということで、第4回では、InDesignで作られた書籍のPDF(なければプリントアウト)をもとに、紙面デザインをそっくりに再現する方法について解説します。何度か作成していくうちに、Vivliostyleの可能性やクセがつかめてくるはずです。 CSS組版を覚える早道は……? 筆者は2023年に『Web技術で「本」が作れるCSS組版 Vivliostyle入門』を執筆しましたが、これを読んだだけで自在に本を組めるようになるかといえば、残念ながらそう簡単なものではないというのが正直なところです。 では、どうやってCSS組版を勉強すればいいのでしょうか? ひるがえって、自分がたどった道のりを思い出してみると、CSS組版とVivliostyleを使い始めたのは、書籍の原稿整理の一環として、書籍デザイン通りの字数・行数をCSS組版で再現したのが始まりでした。何度もそれを繰
近年の AI の進歩により、論文の読み方も大きく変化を遂げました。AI を活用することで以前と比べてはるかに簡単かつ早く論文が読めるようになりました。 以前私の個人ブログにて、論文の読み方やまとめ方を紹介しました。その時には要約ツールは用いていませんでしたが、最近はすっかり要約ツールを多用するようになりました。 本稿では、最新の AI を使った論文の読み方を丁寧に紹介します。 基本的な流れ 本稿でおすすめするのは ChatGPT か Claude で要約を生成して論文の概要をつかみ、Readable で精読するという方法です。ChatGPT や Claude では単に全体の要約を生成するだけでなく、肝となる箇所を特定したり理解するためにも用います。具体的な手順については後の項で解説します。 私が特定のテーマについて調査を行う場合には、テーマに関係する論文を被引用数の多いものを中心に 10
PNG・JPEG・GIFといった画像ファイルやPDFファイルから、TesseractによるOCR(光学文字認識)でテキストを抽出できる「OCR PDFs and images directly in your browser」をエンジニアのサイモン・ウィルソン氏が公開しました。OCR PDFs and images directly in your browserはすべての処理をブラウザ上で実行するため、ファイルをどこかのサーバーにアップロードすることがないというのが大きな特徴です。 OCR PDFs and images directly in your browser https://tools.simonwillison.net/ocr Running OCR against PDFs and images directly in your browser https://simon
(表内のデータ確認日:2024/03/21) スター数だけで言えば prawn が強いですし、歴史もあります。 しかし、コミットが現在もされているものの、最新バージョンのリリースが2020年12月から3年以上空いてしまったのは気がかりです。 wicked_pdf や pdfkit は1年に1度以上は新バージョンのリリースがおこなわれているので、 この2つのどちらかが良さそうに思いました。 最終的には、README が充実していて使うまでのハードルが低そうな wicked_pdf を選びました。 1-1. WkHtmlToPDF 問題 wicked_pdf や pdfkit には重大な問題があります。 これらの gem は WkHtmlToPDF という HTML を PDF に変換する CLI ツールによって支えられているのですが、 これのメンテナンスが 2022/6/29 のコミットを最
Google、PDF論文を劇的に読みやすくするChrome拡張「Google Scholar PDF Reader」 米Googleが「Google Scholar PDF Reader」というPDF形式の論文を読みやすくするChromeブラウザ拡張機能の提供を開始した。 プラットフォームやOSに依存せず、クリーンで、文章の構造が一貫しているPDFは、学術文書の標準的なフォーマットとして広く利用されている。しかし、一方で、引用されている他の文献にジャンプするのが難しかったり、あるいは特定のセクションを閲覧したくても、PDFの構造上、簡単に移動できないなど、閲覧性に関して不便と感じる面もある。Googleは「Google Scholar」という学術論文の検索エンジンを提供している。シンプルで分かりやすい画面構成で、良質な学術文書を効率的に見つけられるサービスである。Scholar PDF R
Teedyはさまざまな種類のファイルの中身を読み取って検索できる状態にしてくれるドキュメント整理ツールです。受信したメールを自動で取り込む設定もできるとのことなので、実際にセルフホストして使い勝手を確かめてみました。 sismics/docs: Lightweight document management system packed with all the features you can expect from big expensive solutions https://github.com/sismics/docs TeedyのインストールにDockerを利用するので、下記のリンクから自分の環境に合った方法でDockerをインストールします。 Install Docker Engine | Docker Documentation https://docs.docker.com
PDFファイルを圧縮する PDFファイルをWebサーバに置くような場合、なるべくファイルサイズを小さくしたい。無料のオンラインツールやPDF作成・編集ソフトウェアを使うことで、PDFファイルのサイズを圧縮できる。ただし、注意が必要な点もある。 カタログやマニュアルなどをPDFファイルにして、Webサーバに置いて参照できるようにすることも多いのではないだろうか。しかし、印刷用に作成したPDFファイルをそのままWebサーバに置くと、ファイルサイズが大きいため、ユーザーに負担をかけてしまう。 またPDFファイルをメールに添付する場合も、メールシステムによってはファイルサイズが大きいと送信できないこともある。 このような場合、PDFファイルを圧縮して、ファイルサイズを小さくすればよい。「Adobe Acrobat」などのPDF作成ツールの他、無料のオンラインツール(Webサービス)でも簡単にPDF
今日は、ローカルにてRAG(Retrieval-Augmented Generation)を使って、あるPFDについて質問するチャットを作ろうと思う。 OpenAIを使うので、無料ではないので注意されたい。 今回のソースは LangChain 完全入門 という本を参考にしていて、とても勉強になるので購入をお勧めする。 行いたいこと ローカルでPDFを読み込ませて、内容を質問したり、要約させること。 大きな流れ 環境準備 チャットアプリの土台の作成 プロンプトを定義 アップロードされたPDFファイルを分割 内容をベクトル化し保存 入力された質問とPDFから抽出した適した文をOpenAIに送信 回答を得る。 詳細 環境準備 環境構築 Python : 3.11.6 pip ライブラリ chainlit==1.0.101 チャット画面を簡単に作るライブラリ chromadb==0.4.22 ベク
はじめに 本記事ではNode.js環境でTypeScriptを用いてPDFテキストを抽出する手順について、プロジェクトのセットアップから扱います。また、型定義を参照しつつサンプルコードに解説を加え、筆者の環境で遭遇したエラーも簡単に取り上げています。 想定読者 PDFをTypeScriptで扱いたい人。 使うもの/環境 2023年3月上旬、下記の環境化での実装です。 OS: Windows 11 VSCode コードの実行はCode Runnerを使用。 Node.js v16.13.2 16系だとエラーが生じます。本文ではそのエラーも扱います。 TypeScript v4.5.5 インストール済であること、文法の知識は前提としています。 pdfjs-dist PDF.jsのnpmライブラリ PDFの操作に使用 サンプルPDF 日本語、テキストのみ。 Marked Contentは対象外。
これは二段構えの構成を持っています。この二段構えを正確に検出し、テキストを理解することが望ましいです。 Unstructuredを使うPythonのライブラリであるUnstructuredを試してみましょう。 参考記事 導入は非常に簡単です。 pip install 'unstructured[pdf]' 実装も簡単です。 解析コード: from unstructured.partition.pdf import partition_pdf pdf_elements = partition_pdf("pdf/7_71_5.pdf") 表示コード: for structure in pdf_elements: print(structure) 結果: 残念ながら、2段組のカラムを正確に検出することはできませんでした。 Grobidを使うGrobidは、peS2oというオープンアクセス論文のコ
PDF 1.6以前のバージョンでは、デフォルトのユーザースペースの単位のサイズは1/72インチで固定されています。Acrobatのバージョン 4.0以前のビューアでは、許容ページサイズの最小値はデフォルで72x72単位(1x1インチ)で、最大値は3240x3240単位(45x45インチ)です。Acrobatのバージョン 5.0以降では、許容ページサイズの最小値は3x3単位(約0.04x0.04インチ)で、最大値は14,400x14,400単位(200x200インチ)です。 PDF 1.6以降では、デフォルトのユーザースペースの単位のサイズは、ページ辞書のUserUnitで設定できます。Acrobat 7.0では、UserUnitの最大値75,000をサポートしており、これによってページの最大値は15,000,000インチ(14,400*75,000*1/72)となり、最小値は1.0(デフォ
pdfmeとは Website: https://pdfme.com/ TypeScriptで書かれたオープンソースの無料の帳票エンジン。 テンプレートを使って宣言的にPDFを作成でき、サーバー、ブラウザどちらでも動作する。 2022年2月にbeta版としてリリースしてから現在 Version3で GitHubではStartが1500、npmではバラツキはあるが週間1万件くらいのダウンロードがある。 自分が把握しているだけで、世界中で採用事例があり、電子カルテ作成、工場の手順書作成、ECのカスタムパッケージ制作ソフトなど、すでにいろんなサービスに組み込まれている。 この記事ではどのようなモチベーションでpdfmeを開発しているのかということを説明したいと思います。 なんで帳票エンジンを新規開発するのか PDFファイルを作成・編集するという観点ではpdfkitという素晴らしいライブラリが20
こんにちは、以前 FlightBooksというサービスを立ち上げていたのですが、2年ほどメンテしていなかったため、ローカル動作するOSS版として公開することにしました。 OSS版を作るにあたり、エディタ部分はVSCodeなりお好きなエディタを使ってもらうとして、 MarkdownからHTMLを生成する部分 HTMLからPDFを生成する部分 を切り出して公開しました。 ほかのサービスや技術と何が違うの? 技術書をマークアップテキストで書くプラットフォームとしては、Re:VIEW、Vivliostyleなどがありますが、FlightBooksは「出版やDTPに関する知識がなくても印刷所にだしたい」というエンジニア諸氏のために開発されました。 「商業印刷」にどこまで向き合うか ご家庭のプリンタに印刷を指示すると、ファイルの情報がプリンタドライバに送信され、そこでインクの出し方を制御するためのデー
科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。 Nougatは、数式や文章が複雑に配置された画像であっても、それをマークアップ言語に高品質で変換する能力を持っています。この技術は、新しい論文だけでなく、電子データが存在しない古い書類などの解析にも非常に有用です。 参照論文情報 タイトル:Nougat: Neural Optical Understanding for Academic Documents 著者:Lukas Blecher, Guillem
ChatGPTにコーディング能力でも敗北しました この前、ChatGPTに文章能力で敗北したというブログ記事を書きました。 今回は、文章に続いてコーディング能力でも完全敗北したという話です。 きっかけは、以下の妻の「複数ページのPDFを1つずつ別ファイルで保存する作業を自動化するプログラム」のお願いです。 単純作業が辛いから、アレをあーしてこーしてくれるプログラム書いて😥と思いついちゃったので、いつもなら @karaage0703 先生に言うんだけど、絶賛社畜中で毎日遅くて可哀想なので、仕事増やしても良いかしらと一応気を遣っています。でも私も(確定申告しんどすぎて)発狂しそう笑。— ねこじすた (@necogista) March 9, 2023 いつもなら、妻に尊敬してもらうために頑張ってプログラム作るのですが、その日は仕事のトラブルで帰宅が11時過ぎ。ご飯食べてお風呂入ったら深夜1時
PDF編集ツールは、アドビシステムズが開発した文書フォーマットPDF(ポータブルドキュメントフォーマット)を編集できるツールだ。PDF形式ファイルは、テキストファイルやMicrosoft Wordなどの文書ファイルとは異なり、異なる環境においても同じように文書を閲覧したり印刷したりすることを目的としている。そのため、いったん作成されたPDFファイルの再編集はできないことが多い。 PDF編集ツールはPDFファイルのテキストや(画像や図版などの)オブジェクトの編集を可能にするものだ。複数のPDFファイルを1つに結合したり、逆に1つのPDFファイルを複数に分割したりできる。また、不特定多数が閲覧できないようにパスワードロックを設定したり、文書の信頼性確保のための電子署名を追加したりできる。 では、ユーザー満足度の高いPDF編集ツールはいったいどれだろうか? IT製品レビューサイト「ITrevie
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く