タグ

pdfに関するvccのブックマーク (87)

  • AIを使った論文の読み方

    近年の AI の進歩により、論文の読み方も大きく変化を遂げました。AI を活用することで以前と比べてはるかに簡単かつ早く論文が読めるようになりました。 以前私の個人ブログにて、論文の読み方やまとめ方を紹介しました。その時には要約ツールは用いていませんでしたが、最近はすっかり要約ツールを多用するようになりました。 稿では、最新の AI を使った論文の読み方を丁寧に紹介します。 基的な流れ 稿でおすすめするのは ChatGPT か Claude で要約を生成して論文の概要をつかみ、Readable で精読するという方法です。ChatGPT や Claude では単に全体の要約を生成するだけでなく、肝となる箇所を特定したり理解するためにも用います。具体的な手順については後の項で解説します。 私が特定のテーマについて調査を行う場合には、テーマに関係する論文を被引用数の多いものを中心に 10

  • Re: なんで今さら帳票エンジンを新規開発しているのか

    pdfmeとは Website: https://pdfme.com/ TypeScriptで書かれたオープンソースの無料の帳票エンジン。 テンプレートを使って宣言的にPDFを作成でき、サーバー、ブラウザどちらでも動作する。 2022年2月にbeta版としてリリースしてから現在 Version3で GitHubではStartが1500、npmではバラツキはあるが週間1万件くらいのダウンロードがある。 自分が把握しているだけで、世界中で採用事例があり、電子カルテ作成、工場の手順書作成、ECのカスタムパッケージ制作ソフトなど、すでにいろんなサービスに組み込まれている。 この記事ではどのようなモチベーションでpdfmeを開発しているのかということを説明したいと思います。 なんで帳票エンジンを新規開発するのか PDFファイルを作成・編集するという観点ではpdfkitという素晴らしいライブラリが20

    Re: なんで今さら帳票エンジンを新規開発しているのか
  • JavaやC#のアプリケーションで、PDFの入出力や電子署名などを実現するオープンソースライブラリ「iText by Apryse」[PR]

    JavaやC#のアプリケーションで、PDFの入出力や電子署名などを実現するオープンソースライブラリ「iText by Apryse」[PR] ここ数年でのリモートワークの普及は、多くの職場で紙の帳票を減らし、電子的な情報のやり取りを増やすことにつながりました。 例えば社内文書の配布が紙から電子メールやグループウェアなどによる配信に変わり、取引先に郵送していた見積書や請求書もPDF文書を電子メールで送付するようになり、印鑑の押印が求められていた契約書もPDFの電子署名になる、などの変化が起きています。 PDF文書が活用される場面が増えてくれば、当然ながら業務システムにおいてもPDF文書の出力機能が求められるようになるでしょう。 出力だけでなく、PDF文書の業務システムへの読み込み、電子署名の対応、複数のPDF文書の取り扱いなど、さらに柔軟な操作への要望が高まってくることも予想されます。 こう

    JavaやC#のアプリケーションで、PDFの入出力や電子署名などを実現するオープンソースライブラリ「iText by Apryse」[PR]
  • 【DeepL裏技】英語だらけの米国株IR資料を難なく読み込みまくる方法|Tomoki Hirata

    このnoteは以前有料で公開していましたが、事業に詳しくなりたい方なら全員知っておいて損はないだろうと思ったので無料で公開することにしました。 有料で買っていただいた皆様には申し訳ないですが、価値を感じてくださった方は投げ銭していただけますと幸いです! バフェットはこう言っています。 あなたは数えきれないほどの企業の年次報告書と財務諸表を読まなければなりません。 手当たり次第に読むことです。 「プレイボーイ」を読む連中もいるが、わたしは年次報告書を読む。 米国株のIR資料は勉強になることが多く、投資検討にはもちろんのこと、事業アイデアのインプット源としても優れています。 しかし現実問題として、英語が母国語でない大多数の日人にとっては海外銘柄のIR資料を読み込むのはかなりハードルが高いことでした。 私はDeepL Proに課金してPDFごと翻訳するオプションを使ったりしていたのですが、これ

    【DeepL裏技】英語だらけの米国株IR資料を難なく読み込みまくる方法|Tomoki Hirata
  • Webブラウザ上で動作する帳票エンジンを作る話

    NGK2022S発表資料です https://ngk2022s.connpass.com/event/233520/ yagisan-reportsのWebサイト https://www.denkiyagi.jp/yagisan-reports/Read less

    Webブラウザ上で動作する帳票エンジンを作る話
  • ついに、Webアプリでの帳票印刷のベストプラクティスを編み出しました

    この記事で紹介した手順をライブラリ化して公開しました🎉 こちらの別記事 で使い方など詳しくご紹介していますので、ぜひご参照ください! はじめに 言い切りタイトルすみません 僕を含む一定数の人にとって現時点でのベストプラクティスとなりうる手法という意味で紹介しています 極めてシビアな帳票出力の世界にいる人から見ると使い物にならない内容かもしれないと思います 帳票印刷の世界では SVF というサービスが有名らしいです。が、こういった外部サービスは使わずに自力で実装するというのがこの記事の前提です 動的に明細行の数が増減する連票はこの記事の解説では考慮していませんが、追加で実装するのはそれほど難しくないということは読んでいただければ分かるかなと思います 結論から 僕が考える現時点でのWebアプリでの帳票印刷のベストプラクティスは、 Adobe XD や Figma で帳票のレイアウトをデザイン

    ついに、Webアプリでの帳票印刷のベストプラクティスを編み出しました
  • プログラマーから見たPDFファイル - アンテナハウス PDF資料室

    更新日: 2020年8月14日 このページの目的 プログラマーは、クライアントから提供されたPDFファイルで、その要求を実現させようとしたとき、PDFのどんなところを見ているのでしょうか。このページでは、ちょっと珍しい視点でPDFファイルを解き明かしていきます。 自分でプログラムを書いてPDFファイルからテキストデータを取り出したいという人も、ぜひご一読ください。 はじめに PDFファイルをクリックすると、あたかも紙に印刷したかのように、どんなマシンでも同じような見た目で文章や画像がディスプレイに表示されます。 この単純な事実は、日常的にPDFファイルを利用していると当たり前に感じられるかもしれません。しかし、よくよく考えると驚くべきことです。 いったい、どのような仕組みがあれば、「過去から現在に至るさまざまな種類のコンピューターで見た目を変えずに同一の紙面を再現する」という目的を達成でき

    プログラマーから見たPDFファイル - アンテナハウス PDF資料室
  • ポエム:LibreOfficeの相互運用性について - おがさわらなるひこのオープンソースとかプログラミングとか印刷技術とか

    この記事はLibreOffice Advent Calendar 2019の17日目です。 記事はLibreOffice日語チームあるいはThe Document Foundation、その他いかなるLibreOfficeコミュニティの意見を代表したものではない私見です*1。さらにいうと私はLibreOfficeの認定ほげほげではないので、ビジネスとしてガチに相互運用を検討したい場合はぜひ認定移行専門家にご相談ください。 さてと。 よく「LibreOfficeはMicrosoft Officeとの互換性がね……」という意見を目にします。そのたびに私みたいなうるさ型から「いやいや別にLibreOfficeはMS Officeとの互換製品だとは言ってないし」とか言われたって人もいるんじゃないでしょうか。 とはいえLibreOfficeはMicrosoft Officeと「互換」ではないのか

    ポエム:LibreOfficeの相互運用性について - おがさわらなるひこのオープンソースとかプログラミングとか印刷技術とか
    vcc
    vcc 2019/12/19
    編集が不要であれば、PDFが一番良い。LibreOfficeの「ハイブリッドPDF」(埋め込みドキュメントとしてODF形式を丸ごと抱いたPDF。LibOで開けば編集可能文書、そうでなければPDFとして見られる)
  • Javaを使ってPDFからテキストを抽出する(Apache PDFBox 編) - デベルマン

    最新の情報を利用する場合は、キャッシュレス・消費者還元事業(https://cashless.go.jp/)のページより入手してください。 処理実装今回読み取りに使用するPDFは、以下のように店舗が一覧化されています。この一覧から、「No.」「都道府県」「市区町村」「事業所名(屋号)」「業種」「業種(サブカテゴリ)」「還元率」の7種類の情報を個別の文字列として取得しましょう。 ちなみにいろいろひっかかるこの一覧。「伊達の牛タン舗」の各店でスペース有り無しが混在しているのが細かいけどすごく気になるし、No.10001にはおそらく間違いが2つ存在してます。まず気になる文字化けはハイフン。その上で「だし廊」と「だし廊 -NIBO-」は別店舗。この一覧の作者は詰めが甘いように思う。。 こんにちは!だし廊店です! 遅くなり申し訳ございません! 今週の限定の献立表が出来ました! 今週もだし廊でお待

  • Windows 8.1の新機能、PDFを表示するには?[Windows 8.1ストア・アプリ開発]

    Windows 8.1の新機能、PDFを表示するには?[Windows 8.1ストア・アプリ開発]:WinRT/Metro TIPS Windows 8.1用のWindowsストア・アプリでは、PDFファイルを表示できる新機能が追加された。その機能を使ってPDFファイルを画面に表示する方法を解説する。 連載目次 待ち望まれた機能、といってよいだろう。Windows 8.1(以降、Win 8.1)用のWindowsストア・アプリ(以降、Win 8.1アプリ)では、PDFファイルを表示できるようになったのだ。稿では、新設されたWindows.Data.Pdf名前空間の機能を使ってPDFファイルを画面に表示する方法を解説する。稿のサンプルは「Windows Store app samples:MetroTips #55(Windows 8.1版)」からダウンロードできる。 事前準備 Win

    Windows 8.1の新機能、PDFを表示するには?[Windows 8.1ストア・アプリ開発]
  • 紙の帳票からHTML帳票を作る方法 - Qiita

    この記事について 現物の紙の帳票を、デザインをできるだけ変えずにHTML帳票に変換する際の作業手順について整理しました。 印刷に使うブラウザを指定できるという前提になりますが、今のブラウザなら詳細なデザインの帳票を作って印刷させることは難しくありません。 印刷機能というと難解なPDFモジュールを使ったりして手間がかかるイメージでしたが、画面に表示されたページをそのまま印刷すればOKということになれば、業務システムなどで様々なブレークスルーが起きるんじゃないかなーと思っています。 役所や社からWordやExcelでフォーマットを指定された書類提出業務を、こっそりWebアプリ化してみんなで楽する用途などに使いましょう。 ※ この記事は以前作成した記事の再整理として作成しました。 paper.cssを使ってブラウザだけで名刺を印刷する サンプルコード 記事で作っている請求書の完成品です。Chr

    紙の帳票からHTML帳票を作る方法 - Qiita
  • そろそろ真面目に、HTMLで帳票を描く話をしようか - Qiita

    帳票といえばPDFとして生成するのが一般的でしょうか? でも、2015年の今、あえてHTMLで描くのがホットです(個人的に)。ミリ単位で設定された高度な帳票も、CSSを駆使して簡単に作ることができます。業務システムでもモダンブラウザを選択することが増え、@pageなども積極的に使えるようになったこと、SPA(Single Page Application)の台頭、いろいろと条件が揃ってきました。 書いてたら結構長くなっちゃったので、さくっとコードだけ見たい方は、Paper CSSリポジトリをどうぞ。 はじめに HTML帳票のメリット 2015年現在、HTML帳票を選択する幾つかのメリットがあります。 ライブリロードで、リアルタイムなスタイル調整 バックエンドではなくフロントエンドで生成できる 前者は、gulpやGruntの普及で、CSSにしろHTMLにしろ、リアルタイムにプレビューできる環

    そろそろ真面目に、HTMLで帳票を描く話をしようか - Qiita
  • Postscript ファイルの書き方入門

    初版 2001.8.10 Postscript 言語はプリンター制御言語の一つです。Canon の レーザープリンターは lips、NEC のレーザープリンターは NPDL、 エプソンのレーザープリンターは ESC/Page という独自の制御 言語を持っています。Postscript はそのようなプリンター制御言語の 一種で、Postscript という高機能な制御言語を 持ったプリンターが PS プリンターです。 PS プリンターを動作させるには、 ポストスクリプト言語で記述された命令(プログラム)を送ります。 通常は PS 命令を記述したファイルを作製し、そのファイルをプリンターへ 送ります。ゆえに、そのようなファイルを PS ファイルと呼びます。 PS ファイルはアスキーコードで記述でき、 命令は分かりやすい(他のプリンター制御言語と比較しての話です) ので、自分で書くことは難しいこ

  • PostScript 基礎文法最速マスター - daily dayflower

    基礎文法最速マスターがはやっているみたいなので便乗します。 ほんとは Lua について書くつもり……というか書いていたんですけど、完成するより前に 良いもの。悪いもの。: Lua基礎文法最速マスター があがってました。 最近、基礎文法最速マスターというプログラミング言語の解説が流行ってるようなので、便乗してみた。個人的にはC++Pythonの方が慣れ親しんでいるのだが、自分でも勉強できるように普段使っていない言語を書いてみることにした。 良いもの。悪いもの。: Lua基礎文法最速マスター うんうん。わたしも勉強のために普段使ってない言語にするか。たまたまさいきん Ghostscript づいていたので PostScript にしようと思いました。 なにぶん初学者なのでいろいろ間違いがあればご指摘ください。とゆーか、詳しい人がよりよい最速マスターや補遺を書いてくださるとうれしいです。 下記

    PostScript 基礎文法最速マスター - daily dayflower
  • 理想の読書システムが構築できたので紹介します - おんがえしの blog

    電子書籍、全文検索、Webアプリケーションといった現代技術を組み合わせる(無いものは自分でソフトウェアを書いた)ことで理想の読書システムを構築することができた気がしたので紹介します。 1. 購入 コンピュータ関連の書籍は Gihyo、オライリー、達人出版会などほとんどがDRMフリー(mobi, epub, pdf)で購入できる。後で検索できるようにしたいので、できるだけpdfがついてくるものを買う。 洋書はThe Pragmatic Bookshelfを定期的にチェックしている。PayPalのアカウントを持っているとあまり知らない出版社から購入するときでも安心。 電子版がないけどPCで読みたいもの、最初はどうしても紙で読みたいものは自炊する。 2. 読む 当は紙ので読みたいのだが、ペーパーバック+電子書籍で安く買えるプランがあまりないので電子書籍で買ってKindleで読むことが多い。S

    理想の読書システムが構築できたので紹介します - おんがえしの blog
  • Linux:pdftotextコマンドでPDFからテキストを抽出 - HiiHahWIKI - making some notes for... -

    LinuxpdftotextコマンドでPDFからテキストを抽出 † apacheTikaをつかってPDFからテキストを抽出していたけど、縦書きPDFがどうもうまいこと抽出できない事象に遭遇。 いろいろ調べたところ、CentOS6系では、popplerというPDFソフトウェアのコマンドラインツールでPDFからテキスト抽出ができるらしいということが分かった。 popplerとは、xPDFというOSSからフォークしたソフトらしい。 xPDF:http://ja.wikipedia.org/wiki/Xpdf Poppler:http://ja.wikipedia.org/wiki/Poppler このPopplerはCentOS6系では標準で使用できるようです。 使えるかどうかはyumで確認できます。 # yum list poppler poppler-utils Loaded plugi

  • Ghostscript についてちょっとだけ - おがさわらなるひこのオープンソースとかプログラミングとか印刷技術とか

    明日某所でプレゼンしなきゃいけないんですがまだ自己紹介しかスライド書いてなくてどんぐらい喋ればいいかとか聞いてなくてスケジュール見たら1時間半もあるけどいったいオレにこの時間何をすればいいんだか教えてくれなおがさわらなるひこです。こんばんわ。 ネタは Linux 印刷ネタなんで、このブログ投影してダラダラ喋らせてもらえればラクなんですけど、さすがにそうもいかないわな。 ということで今日もこちらはさっさかやっつけるモードです。 昨日のエントリーで Ghostscript と Poppler という名前だけ出したんで、ちょっと説明しときます……とおもったら、GS だけで力尽きた。Poppler については明日。 よいこのみんなは各自調べてると思いますが、まあ、それはこのページなりの色を出しながら……。 Ghostscript とはなんぞや 知らん人はいないと思いますが……いや、印刷知らない人は

    Ghostscript についてちょっとだけ - おがさわらなるひこのオープンソースとかプログラミングとか印刷技術とか
  • iOS定番ファイラー5種の機能比較まとめ(GoodReader, Documents 5, iFiles, File Hub, FileExplorer)

    iPhoneユーザーが押さえておくべきというファイラーアプリを独断で選出し、それぞれの特徴をまとめてみました。 ここで扱うのは以下の5つ。 GoodReader Documents 5 iFiles File Hub FileExplorer もちろんこの記事で網羅できるものではないので、操作性などの感覚的な評価はせず、方向性や特徴で比較をしていきます。 ランキング常連の定番ファイラーアプリ。 ファイルの取り扱い ローカル型 iPhoneに取り込んだファイルを操作するものであり、サーバー上のファイルをいじるようには作られていません。 接続可能サーバー/プロトコル SMB, AFP, FTP, SFTP, WebDAV, Dropbox, OneDrive, Google Drive, box.com 重要とされるのはSMB(またはSMB/CIFS)と呼ばれるもので、これが記載されていれば追

    iOS定番ファイラー5種の機能比較まとめ(GoodReader, Documents 5, iFiles, File Hub, FileExplorer)
  • PayPalでリーダブルコード日本語版の電子書籍を購入してみた - むじん島

    mu2in.hatenablog.com 上記の執筆時にO'Reillyストアでリーダブルコードの日語電子版が購入できる事を知ったので、何も持ってない状態から購入してKindleに入れるまでを試してみました。 行った手順を簡単に記述しておきます。 バニラVisaを購入・登録 PayPalを登録後、上記クレジットを設定 O'Reilly Japan Ebook Storeで商品を選択 PayPalで支払う PDFでダウンロード Send-to-KindleKindleに転送 Kindle電子書籍リーダーで読む 手順を確認しながら進めたので、1時間くらいかかりました。 バニラVisaを使えばクレジットを持っていない方でもPayPalが使えるようになります。 ネット上でのクレジット決済は敷居が高い人にもこの方法はおすすめです。 分かったこと PayPalでバニラVisaが使える。 O'Rei

    PayPalでリーダブルコード日本語版の電子書籍を購入してみた - むじん島
    vcc
    vcc 2016/01/13
    素のPDFだとAndroid版Kindle電子書籍リーダーで読みづらい。PDFの余白カットはBRISSが使いやすいらしい。Send-to-Kindleを使えば、個人用ファイルでもKindleに転送できる。
  • 詳細PDF入門 ー 実装して学ぼう!PDFファイルの構造とその書き方読み方 - プログラムモグモグ

    PDFのファイル構造を理解すると、テキストエディタでも直接PDFファイルを作ることができるようになります。このエントリーではPDFファイルの基礎要素を説明し、簡単なPDFファイルを例にしてファイル構造を説明します。更に、テキストを渡すとPDFファイルを吐いてくれる簡単なプログラムや、PDFを読み込んで簡単な解析をするプログラムを書いてみます。 目次 目次 まえがき オブジェクト 間接参照 ファイル構造 Hello, world! ヘッダ トレーラ 相互参照テーブル PDFを生成するプログラム 日語の扱い方 日語を含むPDFを生成するプログラム グラフィックス PDFを読むプログラム あとがき まえがき 1990年代前半、アドビシステムズは、どのプラットフォームやデバイスでも文書を確実に表示・共有できることを目的としてPDFファイルフォーマットを開発しました。 PDFの表示ソフト

    詳細PDF入門 ー 実装して学ぼう!PDFファイルの構造とその書き方読み方 - プログラムモグモグ