[B! PDF][pdf] igrepのブックマーク

GitHub - bevren/simple-chat-pdf

igrep 2024/08/12

リンク

Re: なんで今さら帳票エンジンを新規開発しているのか

pdfmeとは Website: https://pdfme.com/ TypeScriptで書かれたオープンソースの無料の帳票エンジン。テンプレートを使って宣言的にPDFを作成でき、サーバー、ブラウザどちらでも動作する。 2022年2月にbeta版としてリリースしてから現在 Version3で GitHubではStartが1500、npmではバラツキはあるが週間1万件くらいのダウンロードがある。自分が把握しているだけで、世界中で採用事例があり、電子カルテ作成、工場の手順書作成、ECのカスタムパッケージ制作ソフトなど、すでにいろんなサービスに組み込まれている。この記事ではどのようなモチベーションでpdfmeを開発しているのかということを説明したいと思います。なんで帳票エンジンを新規開発するのか PDFファイルを作成・編集するという観点ではpdfkitという素晴らしいライブラリが20

igrep 2023/12/07

oss
PDF

リンク

なんで今さら帳票エンジンを新規開発しているのか

yagisan-reports開発チームリーダーのterurouです。デンキヤギでは yagisan-reports という「Webで使うことを前提とした」商用の帳票エンジンを開発しています（厳密にはyagisan-reportsはエンジン単体の製品ではなくクラウドサービスとして開発していますが、この記事では帳票エンジンとして記載しています）。 yagisan-reportsとは「Webブラウザ単体で動作すること」にこだわっている帳票エンジンです。 2023年11月現在、アーリーアクセス版を提供しています。既に3社5システムで本番稼働しており、一番長いものでは3年ほど本番稼働を続けています。開発中のシステムも含めると、さらに数社あります。元々はアーリーアクセス版の公開から早めにパブリックベータに移行する計画だったのですが、ありがたいことに早期から大口の導入相談が複数あり、こちらを優

igrep 2023/11/13

すごいなぁ

リンク

Free and Open source PDF generation library! | pdfme

"content": "data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAZ4AAAKFCAMAAADLW3/4AAAABGdBTUEAALGPC/xhBQAAAAFzUkdCAK7OHOkAAADDUExURfLx8N7b2eLg3+7k2ero5+bl4/Do3e3r6vDw7+/u7PHr4ezh1c3LysjGxune0cLBw/b08vPu5tnW1dPQz769v+bZy9jNwtDEuuHa0ratp+LTxLe3uvby6sO4sObg2Orl3t3Uy6utsbazss68rayinXxiVaKYk5WMiLWZg5d5ZYhvYN/MuqWBacaxobKOc4qAemxXTbyml/bm06WJd9rDrsSli6OkqIFQRdS0mGlKOldCOJhSRY9oVfTdxEYvJCkYD8iadvAoFyAAACAASU

igrep 2023/01/20

リンク

PDFの編集・閲覧が自由自在、Acrobatより便利なフリーソフト

複数のPDFファイルを結合して1つにしたい、長文PDFの途中にしおりを挟みたい――。こうした願いはPDF編集機能を備えたフリーソフトでかなえられる。ここでは市販アプリ顔負けの便利なパソコン向け3本とスマホアプリ1本を紹介する。 1本で結合、抽出、削除…　CubePDFは万能ツール PDFの編集に欠かせない万能ツールが「CubePDF Utility」だ。これ1本でPDFの結合やページの抽出、削除などの編集ができる（図1、図2）。PDFにパスワードを付けてセキュリティを強化することも可能だ（図3）。図1 インストールして起動［注］。別のPDFファイルを挿入するときは、ページのサムネイルを選択し（1）、ツールバーの「挿入」の「▼」メニューから挿入位置を選ぶ（2）（3）。挿入するPDFを選んで実際に挿入されたら（4）、「保存」を押して上書き保存する（5）

igrep 2022/09/22

PDF

リンク

Local PDF - Your Free PDF Editor in the Browser

Local PDF ToolsLocal PDF is a powerful PDF editing tool that uses WebAssembly techno logy to enable seamless editing directly in your web browser. With our platform, you can merge PDFs, optimize PDFs, and extract valuable information, such as images, from PDF files. Best of all, your files rem ain secure and confidential as they will not leave your system or be sent to another server. Trust Local PD

igrep 2021/03/03

リンク

【 pdfinfo 】コマンド――PDFファイルの情報を表示する

本連載は、Linuxのコマンドについて、基本書式からオプション、具体的な実行例までを紹介していきます。今回は、PDFファイルの情報を表示する「pdfinfo」コマンドです。

igrep 2021/01/26

PDF
cli

リンク

GitHub - pdf2htmlEX/pdf2htmlEX: Convert PDF to HTML without losing text or format.

This is my branch of pdf2htmlEX which aims to allow an open collaboration to help keep the project active. A number of changes and improvements have been incorporated from other forks: Lots of bugs fixes, mostly of edge cases Integration of latest Cairo code Out of source building Rewritten handling of obscured/partially obscured text - now much more accurate Some support for transparent text Impr

igrep 2020/11/24

PDF

リンク

マイナンバーカードによるPDFへの電子署名がどのように動作するのかを実験してみた【イニシャルB】

igrep 2020/10/05

PDF
security

リンク

PDFから「使える」テキストを取り出す（第5回） - golden-luckyの日記

昨日の記事では、PDFのコンテンツストリームから文字を読めたことにして、その文字をテキストとして再構築する話をしました。今日は昨日までの話の締めくくりとして、「PDFごとにカスタムなテキスト取り出し」の話をするつもりだったのですが、その前に文字とコンテンツストリームについて落穂拾いをしておくことにしました。というのは、昨日までの記事への反応を見ていて、この本のことをちょっと思い出したからです。 John Whitington 著、村上雅章訳『PDF構造解説』（オライリー・ジャパン、2012年5月）この本、PDFのドキュメント構造を知りたい人が最初に読むにはぴったりだと思います。自分で簡単なPDFを手書きしながら「PDFの中身がどうなっているのか」を学べるように書かれているので、ドキュメント構造やコンテンツストリームの雰囲気を手軽に体験できる良書です。しかし、この「自分で簡単な

igrep 2019/12/13

PDF

リンク

PDFから「使える」テキストを取り出す（第4回） - golden-luckyの日記

昨日までで、PDFからテキストを取り出すにあたり、グリフから文字を手に入れるところまでを説明しました。いや本当のことを言うと、まだ全然説明できてないんです。でも、文字の話ばかりしていても先に進めないので、今日は（可能な場合には）PDFから文字を入手できるものとし、そこからテキストを再構築する話に進みます。文字については改めて明後日にでも補足記事を書くかも（このシリーズはいちおう今日と明日で終わる予定）。 PDFオペレータを読むとグリフを置く場所がわかる昨日に引き続き、次のようなテキストセクションで考えます。グリフから文字の解決は済んでいるということにして、TJオペレータの引数は文字そのものに置き換えました。 BT /F1 12.4811 Tf 125.585 -462.55 Td [(#1)] TJ /F2 13.2657 Tf 19.932 0 Td [(代数的データ型とパター

igrep 2019/12/13

PDF

リンク

PDFから「使える」テキストを取り出す（第3回） - golden-luckyの日記

昨日の記事では、PDFのページに表示されるコンテンツはPDFのドキュメント構造を掘っていくと手に入れることができて、それはこんな姿をしているぞ、というところまで話が進みました。 $ hpdft -r 66 NML-book.pdf [ /Filter: /FlateDecode /Length: 381.0, q .913 0 0 .913 0 595.276 cm q 462.33906 0 0 655.95015 -3.064 -652.208 cm /Im24 Do Q 1 G 1 g BT /F1 12.4811 Tf 125.585 -462.55 Td[(#1)]TJ /F2 13.2657 Tf 19.932 0 Td[<0b450a3a0c2403c3029403bb0715037103cd03bb029403ef03da03bf03bd0377062c0ac5>] TJ

igrep 2019/12/13

すごいたらい回しだ…

PDF

リンク

PDFから「使える」テキストを取り出す（第6回） - golden-luckyの日記

今日まで延々と「PDFからテキストデータを取り出すのは大変」という話を続けてきましたが、その構造を見るにあたっては、 hpdft という自作のツールを使ってきました。大変とはいっても、まあ実現困難な話ではなく、この程度のPDFパーザであれば趣味プログラミングで自作できる範囲です。しかし、べつにわざわざ自作しなくても、「PDFからテキストデータを取り出す」ためのツールなら世の中にはすでにいくつもあります。特に有名で昔からよく使われているのは、Xpdf由来のpdftotextでしょう。 pdftotext http://www.xpdfreader.com/ XpdfからはPopplerが分派しているので、Poppler版のpdftotextもあります。また、pdfminerというツールもあります。 pdfminer https://www.unixuser.org/~euske/py

igrep 2019/12/06

PDF

リンク

PDFから「使える」テキストを取り出す（第2回） - golden-luckyの日記

昨日は、PDFの本来の用途は「人間がPDFをビューワーで開いて読む」ことなので、そこから文字を抜き出すのは一筋縄ではいかない、という話をしました。ではどうすればPDFファイルの中からテキストを取り出せるの、というのが今日の話の出発点です。まず昨日の記事で、「PDFには国際的な規格があり、これはAdobeから『PDFリファレンスマニュアル』という形で無償で入手できる」という話をしたことを思い出してください。昨日は話のついでみたいな感じで書きましたが、実を言うと、このリファレンスの中に、「PDFファイルの中に書き込まれているグリフを表示するための情報からUnicodeなテキストを取り出す手法」がちゃんと書いてあるのです。具体的には、『PDFリファレンスマニュアル第6版』の §5.9 "Extraction of Text Content"に、その情報が一応整理されています。ただし、言

igrep 2019/12/02

pdf

リンク

GitHub - k16shikano/hpdft: tools to poke pdf using haskell

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

igrep 2019/12/02

pdf
haskell

リンク

PDFから「使える」テキストを取り出す（第1回） - golden-luckyの日記

PDFからテキストを取り出すのは、意外と大変です。それにはいくつかの理由があるのですが、もっとも根本的な点で真っ先に解決が必要になるのは、人間が雑に文字としてみなしている絵（「グリフ」）をコンピューターで扱えるような「文字」にする方法です。これには2つのアプローチが考えられます。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る PDFファイルの中身を解析してテキストを抜き出すこのうち2つめの話は明日以降にして、今日は1つめの話をします。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る方法この方法は、言ってみれば、人間もしくは人間のように振る舞うソフトウェアによりPDFビューワーの表示を「視覚的に読む」ということです。これはPDFの本来の使い道に即した手法です。 PDFというのは、グリフ（文字の形）をページ上に表示するための汎用の仕組

igrep 2019/12/01

PDF

リンク

Online Summarizing Tool | Flashcard Generator & Summarizer | Scholarcy

So many great articles, so little time. Keeping up with the latest research is tough. Millions of new research articles are published each year. Then there’s reports, white papers and company documents. Your usual research tools can find the most recent or influential ones, but you still have hundreds of papers on your desktop – and no time to read them. Skimming the abstract doesn’t give you enou

igrep 2019/03/14

リンク

Is it possible to extract the bibliography from a PDF file as a .bibtex?

igrep 2019/03/14

LaTeX
PDF

リンク

GitHub - danburzo/percollate: 🌐 → 📖 A command-line tool to grab web pages as beautifully formatted PDFs

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.

igrep 2018/10/22

PDF

リンク

アドビがマイクロソフトと連携強化--PDFサービスとOffice 365統合など

印刷するメールで送るテキスト HTML 電子書籍 PDF ダウンロードテキスト電子書籍 PDF クリップした記事をMyページから読むことができます Adobeは、約2年前から進めているMicrosoftとの戦略的パートナーシップをさらに推し進め、両社の製品の連携を強化するいくつかの新たな施策を発表した。今回の連携強化策の主眼は、すでに広く利用されているツールで行う書類仕事をさらに効率化し、電子サインを使った決済をスムーズに行えるようにすることだ。まず、AdobeのPDF関連ツールをMicrosoftのツールの中でサービスとして利用できるようになる。 PDFファイルの作成などの機能を、「SharePoint」「OneDrive」「Office 365」の中から利用可能になる。「Word」「Excel」「PowerPoint」のオンライン版では、文書を高品質なAdobeのPDFに変換

igrep 2018/06/20

リンク

はてなブックマーク

タグ

関連タグで絞り込む (51)

PDFとpdfに関するigrepのブックマーク (47)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス