PostgreSQL(pgvector) のベクトル検索による全自動PDF検索 : Blob Storage にアップロードしPDFをテキストに変換JavaPostgreSQLAdaOpenAIembedding 1. はじめに 先日、Azure OpenAI Embedding モデルを利用し最も関連性の高いドキュメントを見つける方法 について説明しました。これを利用する事で、最も関連性の高いドキュメントを見つける事ができます。 この記事では、この機能を利用し PDF ファイルを Azure Blob Storage にアップロードすると、自動的に PDF ファイルをテキストに変換し、Azure OpenAI Embedding モデルを利用して、ベクトル検索を行う方法について説明します。 このサービスを利用すると、社内ドキュメントも、各種論文も PDF ファイルであれば何でも、Azur
PDFKit A JavaScript PDF generation library for Node and the browser. Description PDFKit is a PDF document generation library for Node and the browser that makes creating complex, multi-page, printable documents easy. The API embraces chainability, and includes both low level functions as well as abstractions for higher level functionality. The PDFKit API is designed to be simple, so generating com
Salesforceで帳票を出力する際、VisualforceによるPDFを開発することが多いですよね。 しかし、VisualforceでPDFを出力する際は普通に作るだけでは日本語が表示できなかったりします。 久しぶりにVisualforceでPDFを開発した際に、日本語の表示方法を忘れていたのでメモです。 <apex:page id="Page" standardStylesheets="false" showHeader="false" sidebar="false" applyHtmlTag="false" renderAs="PDF" > <head> <style> @page { size: 8.27in 11.69in; padding: 0; } body { font-family: Arial Unicode MS; font-size: 10pt; text-ali
はじめに こんにちは植木和樹@上越妙高オフィスです。本日はSalesforceでのカスタムページ作成機能であるVisualforceを使って、ページの一部分だけを書き換える処理について調べてみました。 仕組みの解説 ページの部分書き換えでポイントとなるのは<apex:actionFunction>というタグになります。 apex:actionFunction | Visualforce 開発者ガイド | Salesforce Developers <apex:actionFunction>の属性である、name, reRender, status を用いることで、フォームへの値の入力などのイベントを受け取って、ページの一部を書き換えるという動きを作ることができます。 (青)チェックボックスを変更した際に <apex:actionFunction>のnameで指定した関数を呼び出す (緑)<
皆様、GWはいかがお過ごしでしたでしょうか?ゆっくりできた方、そうでなかった方いるかと思いますが気持ちを切り替えてがんばりましょう! 今回のブログですが、皆さんSalesforce(Visualforce)で帳票を作成する場合いろいろ制限もありお困りかと思います。GW中時間もあったのでSalesforce(Visualforce)でどうやって帳票(PDF化)に立ち向かったらよいのかについて調べてみました。いろいろできることもわかりましたので、皆様に共有できたらと思います。 ただし、ご理解いただきたいのは2017年5月11日現在の情報でありSalesforceのPDF化の仕様が変更された場合は、表示が崩れてしまったり、表示される内容が変わってしまう可能性があります。参考にされる場合、保証は出来ませんのでご理解ご了承ください。
今日は、Visualforceで作成したPDFファイルを、ボタン押下時に「メモ&添付ファイル」に保存する方法をご紹介。 ○PDFファイル まず、PDFファイルをVisualforceで作成します。 名前:PdfPage This is PDF File. ○添付ファイル保存Apex 次に、PDFファイルを「メモ&添付ファイル」に保存するApexを作成します。 カスタムボタンのJavaScriptから呼び出せるようにWebServiceメソッドにし、PDFファイルを保存するレコードのIDを引数で受け取るようにします。 Page.<Visualforceページ>.getContent()で、Visualforceページの本文のデータが取得できます。 global class PdfUtil { WebService static void create(ID id) { // 添付ファイルに登
あらゆるファイルを PDF に変換 CubePDF は、Windows の印刷機能を利用した仮想プリンター形式の PDF 変換・作成ソフトです。 それぞれのアプリケーションで印刷ボタンを押す際に CubePDF プリンタを選択することによって、 紙に印刷する代わりに PDF に変換されます。 印刷可能でさえあれば、変換元のファイル形式は問いません。 また、PNG や JPEG などの画像ファイルにも変換することができます。 便利なオプション CubePDF は、変換した PDF ファイルに対して様々なオプションが用意されています。 変換時に既存の PDF ファイルの先頭や末尾に結合する機能の他、 Web 表示用に最適化、埋め込み画像の JPEG 圧縮、カラー画像のグレースケール化やモノクロ化など用途に応じて柔軟に変更する事ができます。 安全性を重視 CubePDF は、変換した PDF フ
2015年12月23日23:17 AWS JavaScript AWS Lambdaを使ってサーバレスでテキスト抽出するぞ!という気持ち この記事は 今年もやるよ!AWS Lambda縛り Advent Calendar 2015 の23日目です。 「何か書くぞ!」と思いエントリーしてみたもののどうしよう、、と思っていたのですが、そういえば個人的に Apache Tika というのが最近気になっていたので使ってみることに。 Apache Tika これは、PDFやエクセル等のファイルから、テキストデータやメタデータを抽出してくれるという便利ライブラリです。これを使って、ファイルが登録されたら裏でテキストデータを抽出して、それを全文検索で引っかかるようにする…みたいなことが出来ると楽しそうです。 Apache Tika自体はJavaのライブラリなのですが、Node.jsから扱うためのライブラ
taraiok 曰く、 MIT、カリフォルニア工科大学、ハーバード大学らの合同研究チームは、基地局の追加や送信電力を増加させることなく無線ネットワークの速度を改善する技術を開発したと発表した。現在、無線ネットワーク通信に使用されているパケットの3%は、干渉や輻輳などが原因で廃棄されているという。さらに電車への乗車中など、高速移動する状況ではこのパケットロスは5%まで増加するとのこと。研究チームが開発した新技術「coded TCP」を使用すればこうしたパケットロスは皆無になるという(technology review、ExtremTech、元論文PDF、Gigazine、本家/.)。 MIT内のWi-Fiネットワークを使った実験ではパケットロスがなくなり、通信速度も通常1Mbpsのところ16Mbpsまで増加したとしている。また5%のパケットロスが発生していた電車内での通信では、接続速度は0.
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く