話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握するPDFOpenAIChatGPTlangchain記事投稿キャンペーン_ChatGPT はじめに 本記事では、ChatGPT と LangChain の API を使用して、PDF ドキュメントの内容を自然言語で問い合わせる方法を紹介します。 具体的には、PDF ドキュメントに対して自然言語で問い合わせをすると、自然言語で結果が返ってくる、というものです。 ChatGPT と LangChain を使用することで、下記のような複数ステップの仕事を非常に簡単に実行させることができます。 PDF ドキュメントからテキストを抽出して複数に分割する 分割したテキストからテキスト間の関連を表すベクターデータを作成する 作成したベクターデータをベクターストアに格納しておく ChatGPT に外部から与
Markdown to PDF Markdownで書きたいけど、PDFで出力したい という機会はエンジニアはよく出くわすと思います。 「Markdown to PDF」といえばGitBook CLIが有名ですが、こちらはメンテナンスがストップされているため推奨されません(環境依存による不具合などが解決されない)。 GitBookほど多機能でなくても良いですが、綺麗にいい感じに出力したい…!と探し回っていたところ md-to-pdf が最も私の要件に合致したので使ってみました。 そんな私の要件はこちら。 CLIから出力したい ページ内リンクが作れる ページ分割ができる ページ数表示が簡単にできる 全体に対して簡単にテーマをCSSで適用できる いざという時にはHTML+CSSでカスタマイズができる それに対して md-to-pdf は以下のような機能があります。 ディレクトリ内のMarkdow
Docs.Zone is the simplest method to save web pages as PDF documents Updated: 20 January, 2024 Converting a website to PDF is a convenient way of saving its content for offline viewing. PDF is a great format for this purpose thanks to its compact size, ease of navigation, low memory consumption and compatibility with the majority of browsers, devices and operating systems. By default, browsers do n
2008.01.09 pisa (HTML から PDF への変換) (2) テーマ:プログラミング言語 Python を使う(336) カテゴリ:Python HTMLをPDFに直接変換するpisa と Python上でHTML2PDF「pisa」(MOONGIFT) を読む。最近 Python を扱う記事があちこちで地道に増えてきた。 次のような記事もあった。へぇ、こういう記事を書く人も出てきたんだと思ったら翻訳記事だった。 Pythonの技法:ZIPアーカイブを読む Pythonの技法:ZIPアーカイブへの書き込みと追記 Pythonの技法:Huffman符号化の実装 元に戻って、HTML から PDF の変換について、pisaの日本語サポート を見てみる。pica の HTML 解析は html5lib、PDF の出力は ReportLab を使っているらしい。pica の日本語サ
クリップリーダーポケット 1.1.2(無料) ビジネス, 仕事効率化 iClipReader project.(3.9 MB) こんなPDFリーダーが欲しかった。 217個目の原石アプリは「クリップリーダーポケット」。PDFで見ているページの一部を切り取ってEvernoteへポストできるアプリだ。 Evernoteにポストすると、PDFと同じタイトルのノートブックが新規で作られ、そこにデータが保存される アプリ内のスクラップブック上で、切り抜きを削除したり、まとめてEvernoteに送ったりもできる。 紹介する理由 いろいろなPDFリーダーアプリがあるなかで、Evernoteとの連携を前面に打ち出した点が新しい。 ページの一部をEvernoteに保存する機能は、多くのEvernoteユーザーに大歓迎されるはずだ。 きっと作者さんがEvernoteユーザーなんだろう。ユーザー視点から実用的な
ドキュメントを書くのが楽しくなるPython製ドキュメント作成ツール「Sphinx」で簡単にPDFを作成する方法を紹介します。 Sphinxは1つのテキストファイルからHTMLやPDF、ePub等々をあっという間に生成してくれる素敵なツールです。 SphinxでPDFを生成する方法としては、「SphinxでPDFファイル作成」や「Sphinx & blockdiag Advent Calendar(全部俺) : ATND」の「(8日目) Sphinx から PDF を生成してみよう (rst2pdf 編)」「(11日目) Sphinx から PDF を生成してみよう (LaTeX 編)」で「rst2pdf」や「LaTeX」を使用する方法が紹介されているのですが、実際に試してみると周辺ツールの導入が大変だったり、エラーが出たりでなかなか思うようにPDFを作成できませんでした。 そこで発想を変
これまで電子書籍(PDF)自炊のやり方やコツなどを書いてきましたが、今回はハナシをもう少し進めて、次のステップ、つまり、 できあがった PDF をどの iPad アプリで読めばいいの? << という点について書いてみようかと。 ただ、この問題、読書の仕方は人それぞれ、アプリに求める機能も人それぞれで、「このアプリで読んどけば OK」という解はないように思えたので、今回は「各アプリの特徴を簡単にまとめてみる」というアプローチをとってみました。 以下、参考にしていただいて、それぞれの好みや用途にあったアプリを見つけていただければと思います。 *0. アプリを選ぶときのポイント 各アプリの内容に入る前にアプリを選ぶときのポイントを少々。漠然といろんなアプリを試していると、途中でどれがどうだったかわからなくなってしまう可能性があるので、そんなときはポイントを絞ってみていくと良いかもしれません。 今
rst2pdfはPython製のオープンソース・ソフトウェア。reStructuredTextは幾つかあるマークアップ言語の一つで、ソースのままでも可読性が高いのが特徴となっている。ヘッダ、リスト、テキスト装飾、リンク、画像、ブロックなど多彩な記法をもっている。 変換された文書 そんなreStructuredTextは記法なので他のフォーマットへの変換が元々の目的にある。恐らくHTMLやLaTeX、テキストファイルなど様々な目的があると思われるが、PDFへの変換を行うならばrst2pdfを使ってみよう。 rst2pdfはコマンドラインで動作するソフトウェアで、reStructuredTextで書かれたテキストを指定してコマンドを実行すれば同じディレクトリ(指定は可能)にPDFファイルが生成される。最初に見出しの一覧が並び、クリッカブルな目次として使えるのが便利だ。 オプション 画像の埋め込
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く