並び順

ブックマーク数

期間指定

  • から
  • まで

401 - 440 件 / 1965件

新着順 人気順

PDFの検索結果401 - 440 件 / 1965件

  • Elicit | The AI Research Assistant

    Automate time-consuming research tasks like summarizing papers, extracting data, and synthesizing your findings.

      Elicit | The AI Research Assistant
    • 新社会人に伝えておきたいプレゼンの極意 | DTP Transit

      社会人になると「プレゼン」という場はもちろん、ちょっとした報告や社内セミナーなど、人前で何かを喋る機会が生じます。その際に意識しておきたいことをまとめてみました。 なお、属している企業やコミュニティによって文化やしきたりが異なるため、あくまでもひとつの理想系として参考にしてください。 今回の記事はアドビ社のPR企画「みんなの資料作成」に参加して執筆しています。 この記事内の目次 1 | プレゼンの準備時間の理想的な配分 プレゼンの準備を効率良く進めるためには、準備に必要な工程を知り、時間配分を工夫する必要があります。 プレゼンは、次の3つに分解することができます。 シナリオ作成 スライド制作 トークを含めたリハーサル プレゼンに慣れない段階では、PowerPoint(やKeynote)を使ったスライド作りに没頭してしまいがちです。 しかし、時間をかけるべきなのは「シナリオ作り」。シナリオ作

        新社会人に伝えておきたいプレゼンの極意 | DTP Transit
      • アップル、157ページに及ぶ詳細なセキュリティガイドを公開

        印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Appleは、「プラットフォームセキュリティ」について詳しく説明した157ページの長大な文書を公開した。この文書では、ハードウェアと生体認証のセキュリティ、システムセキュリティ、暗号化、アプリのセキュリティ、サービスのセキュリティ、ネットワークのセキュリティに関する同社の取り組みが紹介されている。 この新しい文書は、新しいセキュリティ技術への投資や一般に開放されたばかりのバグ報奨金プログラムを含む、Appleのセキュリティ強化策の一環だ。これまで、同社のバグ報奨金プログラム(報奨金の最高額は150万ドル:約1億6400万円)でバグを報告できるのは、承認されたセキュリティ研究者だけだった。 同社は新しい文書で、セキュリティ分野のさまざまな

          アップル、157ページに及ぶ詳細なセキュリティガイドを公開
        • 技術書典 :技術書のオンラインマーケット開催中

          技術書典のオンラインマーケットです!推しの技術書を買って応援しよう!

            技術書典 :技術書のオンラインマーケット開催中
          • マイナンバーカードは高齢者の方が交付率が高い

            https://b.hatena.ne.jp/entry/s/www3.nhk.or.jp/news/html/20220922/k10013830501000.html マイナンバーカードと交付金を結びつけることの是非は置いといて、ブコメで散見される「高齢者は交付率が低い」というのは間違っている。何となくのイメージでコメントをつけるのではなくて、ちゃんとデータを当たるべきだし、こういうコメントがスターを集めているのはよろしくない。 年代別の交付率は公表されていて、極端な差ではないものの、高齢者の方が交付率は高い傾向にある。90歳以上のみ交付率がかなり低いが、この年代の人口は少ないため、全体の交付率に与える影響は小さい。 https://www.soumu.go.jp/main_content/000833940.pdf なお、都道府県別では、都会は地方よりも交付率が高いという傾向がやんわ

              マイナンバーカードは高齢者の方が交付率が高い
            • 〜AutoMLで実践する〜 ビジネスユーザーのための機械学習入門シリーズ 【第 3 回】 「積ん読」と「体重増」の悩みを AutoML で解決しよう | Google Cloud 公式ブログ

              〜AutoMLで実践する〜 ビジネスユーザーのための機械学習入門シリーズ 【第 3 回】 「積ん読」と「体重増」の悩みを AutoML で解決しよう 前回は、AutoML Tables による EC サイトの LTV 分析事例を紹介しました。今回は、同じ AutoML Tables を、より身近な課題の解決に使う方法を紹介します。 その課題とは、筆者自身が抱えていた 2 つの悩みです。ひとつは、スキャンして PDF で保管している書籍の「積ん読」を大量に抱えていたこと。もうひとつは、自宅作業ばかりで増え続けてしまっている体重です。 この 2 つの課題を一挙に解決するソリューションとして筆者が思いついたのが、「PDF 書籍をオーディオブックに変換する」という方法です。読みたかった書籍をオーディオブック化しておけば、ランニングしながら積ん読を解消できます。 この動画のように、Cloud Sto

                〜AutoMLで実践する〜 ビジネスユーザーのための機械学習入門シリーズ 【第 3 回】 「積ん読」と「体重増」の悩みを AutoML で解決しよう | Google Cloud 公式ブログ
              • PDFから「使える」テキストを取り出す(第1回) - golden-luckyの日記

                PDFからテキストを取り出すのは、意外と大変です。 それにはいくつかの理由があるのですが、もっとも根本的な点で真っ先に解決が必要になるのは、人間が雑に文字としてみなしている絵(「グリフ」)をコンピューターで扱えるような「文字」にする方法です。 これには2つのアプローチが考えられます。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る PDFファイルの中身を解析してテキストを抜き出す このうち2つめの話は明日以降にして、今日は1つめの話をします。 PDFビューワーでファイルを開いた状態から何とかしてテキストを読み取る方法 この方法は、言ってみれば、人間もしくは人間のように振る舞うソフトウェアによりPDFビューワーの表示を「視覚的に読む」ということです。 これはPDFの本来の使い道に即した手法です。 PDFというのは、グリフ(文字の形)をページ上に表示するための汎用の仕組

                  PDFから「使える」テキストを取り出す(第1回) - golden-luckyの日記
                • 【電子版】リットーミュージック4雑誌×1年分がフリーDL「無料で読んで弾く!叩く!打ち込む!」キャンペーン | リットーミュージック

                  楽器や音楽カルチャーに特化した専門誌「ギター・マガジン」「サウンド&レコーディング・マガジン」「ベース・マガジン」「リズム&ドラム・マガジン」の電子版が無料で読めます! 各2019年1月号~12月号の計48号分、PDFでダウンロード可能(2020年5月31日(日)23:59まで ※5/11から延長しました!)。 こんな状況だからこそ、少しでも皆様に楽しんでいただけたら幸いです。 ダウンロードは以下から。登録不要、無料です! STAY HOME, PLAY MUSIC <<ご注意>> ※この電子版はPDFで作成されており、PCやタブレットなど大きなディスプレイの端末で読むことに適しています。お手持ちのPDF閲覧ソフト(Adobe Acrobat Readerなど/Appから無料DL可能)でご利用ください。文字列のハイライトや検索などの機能は使用できません。 ※各号ともファイル・サイズが大きい

                    【電子版】リットーミュージック4雑誌×1年分がフリーDL「無料で読んで弾く!叩く!打ち込む!」キャンペーン | リットーミュージック
                  • https://www.fujitsu.com/downloads/JP/about/businesspolicy/tech/design/article/document/transformationbydesign-jp.pdf

                    • 【外貨を稼ぐ】 OSSきっかけでオーストリアの会社と仕事した話

                      自作のPDFライブラリがきっかけで、オーストリアの会社と仕事ができた。 とてもいい経験だったので振り返りを行いたいと思う。 自分について ・サラリーマン+個人事業主のWebエンジニア ・個人事業ではPDFを作成できるWebサービスを作っています ・サービスのPDF作成処理はライブラリとしてGithubでソースコードを公開しています そういえば過去にこんな記事を書いていました。この記事の続きとして見ても面白いかも。 このライブラリが今では268のスターを獲得し、なんとお仕事まで獲得してくれました! オープンソースをやりたい人のモチベーションやきっかけになれると嬉しいです。 ある日突然メールが届く オーストリアの会社からメールが届いた。電子カルテのサービスを作っている会社だそう。 PDFのデザインができる画面が必要とのこと。 そこで下記のような帳票のデザインページを開発してくれないか?と話が来

                        【外貨を稼ぐ】 OSSきっかけでオーストリアの会社と仕事した話
                      • 【ご報告】Colaboとその代表仁藤夢乃に対する深刻な妨害に関する提訴記者会見を行いました。 – 一般社団法人Colabo(コラボ)

                        「Colaboとその代表仁藤夢乃に対する深刻な妨害に関する提訴記者会見」に関するご報告 現在、Colaboと仁藤に対して、SNSやインターネット上での膨大なデマ、誹謗中傷、嫌がらせ等が行われています。実際の活動への実害も生じており、10代女性に対して食事や安心できる空間を提供するバスカフェの活動で使用しているバスが切り付けられたり、シェルターの場所を特定しようとするストーカー行為などの被害を受けています。 先日、Colaboとその代表仁藤夢乃に対するネット上の攻撃に関する弁護団声明を公開しました。 デマや誹謗中傷などの嫌がらせの投稿が膨大になされ、拡散されることによる影響は非常に深刻で、利用者の女性たちが恐怖を感じ、活動の存続が危ぶまれるほどの状況となっているため、この度、提訴することになりました。 本日、これに関する被害実態の報告、被害者の想い、および提訴に関する記者会見を行いました。

                        • ChatGPT(GPT-4)のAdvanced Data Analysis(旧Code Interpreter)、日本語フォントでグラフや画像、PDFファイルを出力する方法とTwitterの分析

                          ChatGPT(GPT-4)のAdvanced Data Analysis(旧Code Interpreter)、日本語フォントでグラフや画像、PDFファイルを出力する方法とTwitterの分析 はじめに 先週末にOpenAIの発表があり、ChatGPT(GPT-4)のCode Interpreterという機能が公開されました。内部でPythonが動いており日本語や英語で指示するだけでノーコードでデータの分析などを行うことができる便利なサービスです。 そのままではグラフ描画などで日本語の表示ができないのですが、「日本語フォント表示する方法を見つけ出した」のでこちらの記事でご紹介します。 ※8月29日にCode InterpreterからAdvanced Data Analysisに名称が変更になりましたが記事中ではCode Interpreterのまま記載しております この記事で学べること

                            ChatGPT(GPT-4)のAdvanced Data Analysis(旧Code Interpreter)、日本語フォントでグラフや画像、PDFファイルを出力する方法とTwitterの分析
                          • 上に出した報告書が何者かに改竄されてた。PDFで出したんだけど、ご丁寧に問題点が白塗りにされてた→監査ログを見てみたら闇が深かった話

                            がんぽん @ganpon714 アイコンは本人。職業はなんちゃってSE、自称研究者、アマチュア軍人。電子工作/電波(ELF,VLF)/C++/組み込み/ホイスラ/オーロラ/SDR/バイオインフォマティクス/GPGPU/カメラ/シンセ/ロシア/登山/ロリ/日本酒/居酒屋 エサ→https://t.co/l3Q3CkG4iA https://t.co/CPdkJm4N53 がんぽん @ganpon714 先週、俺が上に出した報告書が何者かに改竄されてた。 PDFで出したんだけど、ご丁寧に問題点が白塗りにされてた。 サーバー管理者なので監査ログを見てみたら誰が差し替えたか、誰が差し替えた後に開いて確認したかまで秒単位でわかって、数人関わってて思ったよりも会社の闇が深かった。驚いた。 がんぽん @ganpon714 Windows server のシャドーコピーから元に戻しておいてやろうかと思った

                              上に出した報告書が何者かに改竄されてた。PDFで出したんだけど、ご丁寧に問題点が白塗りにされてた→監査ログを見てみたら闇が深かった話
                            • 全ベンダーが泣いた!――改正民法のIT業界への影響を徹底解説

                              2017年5月に成立し、2020年4月から施行されている改正民法。明治29年の制定から120年ぶりの改正となる本件がIT業界に関連する項目は、主に以下の3つだ。 成果物の「瑕疵(かし)担保責任」という考え方がなくなる 請負契約において、約束した成果物を納めなくても、請負人が支払いを受けられる場合が出てくる 成果物の納品を前提とした準委任契約ができるようになる @IT eBookシリーズ 第98弾『「訴えてやる!」の前に読む IT訴訟 徹底解説 vol.4』は、上記3点の詳細とベンダーが心掛けるべきポイントを、ITトラブルが法的紛争となった事件の和解調停や裁判の補助を長年担当してきた細川義洋氏が詳しく解説する。 もちろん、皆さん大好物のIT訴訟解説も盛りだくさん。「プロジェクトが頓挫したので、18億円請求します」「その要件定義、有償だって言わなかったからタダですよね?」「アジャイルだか何だか

                                全ベンダーが泣いた!――改正民法のIT業界への影響を徹底解説
                              • #個人Webサービスシステム構成事典 v3 - @nabettu - BOOTH

                                「あのサービスの中身はこうなっていたのか!」 総勢31人の個人開発者が送る、35個のWebサービス・アプリの中身がどんな風に作られているのかわかるシステム構成事典がなんと無料で読める! - テレビで取り上げられたサービスや、Twitterトレンドに載るなど話題になったサービス - 広告収入や有料課金で収入を得ているサービス - リアルタイムなデータのやり取りやAIを活用など尖った技術を利用したサービス - シンプルな構成で高速開発に特化したサービス などなど、さまざまな種類のサービス・アプリについて、概要や使用技術を図&文章にして1枚にまとめています。 ・個人開発を始めてみたい方 ・フルスタックな構成を学びたい方 ・駆け出しエンジニアの方 色々な方におすすめの書籍となっております!無料ですのでぜひご一読ください!

                                  #個人Webサービスシステム構成事典 v3 - @nabettu - BOOTH
                                • PythonでPDFからテキスト/表情報の抽出精度を比較してみた - Taste of Tech Topics

                                  はじめに こんにちは。ついにジム通いを始めて四六時中筋肉痛を感じながら過ごしているイワツカです。 最近はLLM(大規模言語モデル)とRAG(検索拡張生成)を用いて企業内ドキュメントを活用する取り組みが多く見受けられます。 ドキュメントは基本PDFで保存されているため、PDFからテキストを抽出して、検索対象にすることが必要です。 そこで今回は、PythonでPDFからテキストを抽出するためのライブラリを比較して、どれが良いのか検証しました。 はじめに 概要 実装 PyMuPDF pdfplumber unstructured 比較結果 テキスト抽出 サンプル1のテキスト抽出結果 サンプル2のテキスト抽出結果 表の抽出 サンプル3の表抽出結果 サンプル4の表抽出結果 検証結果 まとめ 概要 今回はPDF読み取りライブラリとして、PyMuPDF、pdfplumber、unstructuredの3

                                    PythonでPDFからテキスト/表情報の抽出精度を比較してみた - Taste of Tech Topics
                                  • PDFファイルのテキストを人間にしか読めないようにする「Human Eyes Only」

                                    Adobeが1993年にリリースしたPDF(Portable Document Format)ファイルフォーマットは、「印刷レイアウトをそのままに保存できる」「Windows・Mac・LinuxといったOSやPC環境に関係なく閲覧したり印刷したりできる」「セキュリティー設定が可能である」というメリットがあり、広く使われていますが、PDFファイルに記載されるテキストは簡単にコピーできてしまいます。「Human Eyes Only」はPDFファイルのテキストを特殊なフォントに変換して人間にしか読めないようにしてしまう試みで、ベータ版が無料公開されています。 Human Eyes Only https://humaneyesonly.com/ Human Eyes Onlyにアクセスして左側に表示されている英文は、一見すると普通のテキストに見えますが、実は特殊なフォントで表示されています。この英

                                      PDFファイルのテキストを人間にしか読めないようにする「Human Eyes Only」
                                    • コロナワクチンの予診票をブラウザから出力できるWebアプリ、学生が開発 「手書きは面倒に感じた」

                                      新型コロナワクチンの1回目接種数が9月1日時点で50%を超えるなど、接種が全国で進む中、個人情報や健康状態を記入する予診票をブラウザから出力できる入力フォームを現役大学生が開発し、Webアプリとして公開した。 開発したのは、中央大学1年生の尾川史典さん(経済学部経済情報システム学科、Twitterアカウントは@mizphses)。小学校3年生からプログラミングを独学で学び始め、現在はWebフロントエンド開発やデザインを趣味でやっているという。学業の傍ら、週に1回、多摩市立の小学校で小学生にタブレット端末の使い方などを教えるICT支援員としても勤務しているという。 開発のきっかけは、自身が感じた不便さからだ。接種時は事前に手書きで記入した予診票を会場に持参する必要がある。ICT支援員をしていた関係で、教職員向けの職域接種を受けた際、尾川さんは予診票のPDFファイルを編集し、PC上で記入したも

                                        コロナワクチンの予診票をブラウザから出力できるWebアプリ、学生が開発 「手書きは面倒に感じた」
                                      • シェルスクリプトでゲームボーイプログラミング入門

                                        シェルスクリプトで ゲームボーイプログラミング ⼊⾨ ⼤神祐真 著 エアコミケ(2020 年春)新刊 2020 年 5 ⽉ 5 ⽇ ver 1.0 ■免責 本書は情報の提供のみを⽬的としています。 本書の内容を実⾏・適⽤・運⽤したことで何が起きようとも、それは実⾏・適⽤・運⽤した⼈⾃ ⾝の責任であり、著者や関係者はいかなる責任も負いません。 ■商標 本書に登場するシステム名や製品名は、関係各社の商標または登録商標です。 また本書では、™、®、© などのマークは省略しています。 はじめに 本書をお⼿にとっていただきありがとうございます! 本書では、アセンブラやコンパイラなどを使⽤せず、echo コマンドのバイナリ出⼒や dd コマンドなどを駆使して、シェルスクリプトでゲームボーイの ROM ファイルを⽣ 成します。 そのためには、ゲームボーイの CPU の各機械語命令について、そのバイナリ列

                                        • https://nemotos-office.sakura.ne.jp/Vsiongpdfkmz.html

                                          • 2023.05.13_ChatGPT講座_v2_共有用.pdf

                                            ログイン読み込んでいます…

                                            • 『データ分析のための統計学入門』PDFが無料に:今月のAIニュース8選 | Ledge.ai

                                              画像はUnsplashより 日々、目まぐるしく進化、発展を遂げるAI(人工知能)業界。さまざまな企業が新しいサービスを開始したり、実験に取り組んだりしている。 そこで本稿ではLedge.aiで取り上げた、これだけは知っておくべき、4月掲載のAIに関するニュースをお届けする。AIの活用事例はもちろん、新たな実証実験にまつわる話など、本稿を読んでおけばAIの動向が見えてくるはずだ。 Pythonの基礎やDXの事例を学べる講座が無料に 経済産業省は、AIやデータサイエンスなどのデジタルスキルを学べる、無料オンライン講座を紹介する「巣ごもりDXステップ講座情報ナビ」を公開している。 シスコシステムズ合同会社が提供する「IoT/DX入門」では、DX(デジタルトランスフォーメーション)とは何かを理解し、DXがいかに経済的成長機会を生み出しているか学べるという。具体的には、DXを支えるテクノロジーとして

                                                『データ分析のための統計学入門』PDFが無料に:今月のAIニュース8選 | Ledge.ai
                                              • pdf2txt.py 便利すぎる(PDF表をテキスト化) | ず@沖縄

                                                SARS-COV-2関連情報を集めていると、国や自治体、企業が公開している情報がPDFなのにムカついてしまう。ExcelをPDF化したものもあって、素直にxlsも出せよと思う。 (それでも画像データで公開している組織に比べればかなりマシなのが悲しい) 例えば、沖縄県のワクチン接種率の情報がPDFだ。「沖縄県のワクチン接種進捗状況/沖縄県」に掲載されている「県内市町村ごとの新型コロナワクチン接種件数」がPDFだ。タイトルは .xlsx になっているので、元々はExcelであったのだろう。 ご丁寧なことに情報が更新されると過去のPDFが消されてしまうので、接種率の変化を追っかけたい場合はPDFを手元に保存しておかないといけない。沖縄県の情報公開はこういうところがダメダメだと思う。消すなよ。 表から情報を抜き出す情報を抜き出すツールとしては adobeの【無料】PDFをExcelに変換 – Ad

                                                  pdf2txt.py 便利すぎる(PDF表をテキスト化) | ず@沖縄
                                                • (PDF)文化審議会 著作権分科会 法制度小委員会「AIと著作権に関する考え方について」|文化庁著作権課

                                                  • [PDF]GIGAスクール構想の実現標準仕様書 令和2年3月3日 文部科学省

                                                    GIGAスクール構想の実現 標準仕様書 令和2年3月3日 文部科学省 目次 はじめに ・・・・・・・ 1 1.学習者用コンピュータの標準仕様書 ・・・・・・・ 2 (1)学習者用コンピュータの標準仕様書について ・・・・・・・ 2 (2)学習者用コンピュータ等機器賃貸借標準仕様書例 ・・・・・・・ 3 (3) 「学習用ツール」について ・・・・・・・ 10 (4)LTE 通信でのネットワーク整備について ・・・・・・・ 15 2.校内 LAN 整備の標準仕様書 ・・・・・・・ 17 (1)校内 LAN 整備の標準仕様書について ・・・・・・・ 17 (2)校内 LAN 整備調達仕様書の作成方法 ・・・・・・・ 17 ① 用語の説明 ・・・・・・・ 17 ② インターネットへの接続構成 ・・・・・・・ 19 ③ 校内 LAN 配線 ・・・・・・・ 19 ④ 必要機器の数量及びスペック算定方法

                                                    • そろそろPDFの多用を止めませんか

                                                      IT・メディアThe write PDF in red 3D letters standing on a glossy black floor of a room, leaning at its blue wall - 3D rendering illustration PDFが大好きな人々がいる。総務省人事の報道発表には「1月15日付の総務省人事(2名)について、次のとおり発令しました。」とだけ書かれ、「次のとおり」をクリックするとPDFが表示され発令内容が読めるようになっている。 どうしてこんな面倒な方法を取っているのだろうか。 情報が変造されるのを防ぎたい、と説明する人がいる。しかし、世の中にはPDFの中身を書き換えたり、パスワードを消したりできるツールがいくらでもある。簡単なキーワード検索で無料ツールが入手できる。 どんなデバイスでも同じように表示したいため、と説明する人がいる。P

                                                        そろそろPDFの多用を止めませんか
                                                      • 統計学習の指導のために(先生向け)

                                                        PDF形式のファイルをご覧いただく場合には、Adobe Readerが必要です。 Adobe Readerをお持ちでない方は、バナーのリンク先から無料ダウンロードしてください。

                                                        • アジャイル開発実践ガイドブック | 内閣官房情報通信技術(IT)総合戦略室

                                                          • PDFが世界中で広く使われるようになった理由とは?

                                                            PDFとして知られるポータブル・ドキュメント・フォーマット(Portable Document Format)は、文書ファイルを扱う上で必要不可欠な文書形式です。そんなPDFの歴史について、ジャーナリストのロブ・ウォーカー氏が解説しています。 The Inside Story of How the Lowly PDF Played the Longest Game in Tech | by Rob Walker | Jan, 2021 | Marker https://marker.medium.com/the-improbable-tale-of-how-the-lowly-pdf-played-the-longest-game-in-tech-d143d2ba9abf PDFはソフトウェアメーカーのAdobeによって開発されたファイルフォーマット。Adobeによると、2020年だけで3

                                                              PDFが世界中で広く使われるようになった理由とは?
                                                            • [PDF]OSS の利活用及びそのセキュリティ確保に向けた管理手法に関する事例集

                                                              • 【PDF公開】Scrum Starter Guide

                                                                アジャイル開発に取り組むチーム向けのコーチングや、技術顧問、認定スクラムマスター研修などの各種トレーニングを提供しています。ぜひお気軽にご相談ください(初回相談無料) みなさんこんにちは。@ryuzeeです。 以前、「スプリント1を始める前にどんな準備をするか」という記事を公開したのですが、この記事に内容を加筆修正してPDF化したものを用意しましたので公開します。 スクラムは非常に軽量なフレームワークで、Howについてはほとんど触れられていないため、これから立ち上げるときにどんなことをやればよいのか困ってしまう人も多いようです。 何も準備せず、いきなりスプリントで開発を始めようとしたり、逆に何か月もかけて事前準備をしてしまい、ウォーターフォールと変わらないやり方をしている例も見かけます。 本書では、スクラムを始めるときにどんな準備をしてから始めればよいかを整理しています。あくまで筆者の経験

                                                                  【PDF公開】Scrum Starter Guide
                                                                • PPAPを何とかしたいがPHSも何とかしたい(PDF版)

                                                                  Professor at Colledge of Information Science and Engineering, Ritsumeikan University

                                                                    PPAPを何とかしたいがPHSも何とかしたい(PDF版)
                                                                  • PDF を Gyazo に展開して Scrapbox の記事にして全文検索する - Diary

                                                                    PDF を Gyazo に展開して Scrapbox の記事にして全文検索する という試みについてです。 まず PDF を Gyazo に展開して Scrapbox の記事にするということですが、これについてブラウザ上で簡単に動くツールを実装しました。 https://ssig33.github.io/pdftoscrapbox/ おそろしく素朴な見た目ですがとりあえず動きます。Chrome や Edge に Tamper Monkey (試してないけど Firefox と Greasemonkey でも動くんじゃないかな)を入れて、 input に Scrapbox のプロジェクト名を入れて user.js をインストールした上で赤いところに PDFをドラッグ&ドロップすると、 PDF.js で PDF でレンダリングした上で全てのページを Gyazo にアップロードして Scrapbo

                                                                    • ローカルで気軽にRAGを使って会話することが簡単すぎてビビった。 - Qiita

                                                                      今日は、ローカルにてRAG(Retrieval-Augmented Generation)を使って、あるPFDについて質問するチャットを作ろうと思う。 OpenAIを使うので、無料ではないので注意されたい。 今回のソースは LangChain 完全入門 という本を参考にしていて、とても勉強になるので購入をお勧めする。 行いたいこと ローカルでPDFを読み込ませて、内容を質問したり、要約させること。 大きな流れ 環境準備 チャットアプリの土台の作成 プロンプトを定義 アップロードされたPDFファイルを分割 内容をベクトル化し保存 入力された質問とPDFから抽出した適した文をOpenAIに送信 回答を得る。 詳細 環境準備 環境構築 Python : 3.11.6 pip ライブラリ chainlit==1.0.101 チャット画面を簡単に作るライブラリ chromadb==0.4.22 ベク

                                                                        ローカルで気軽にRAGを使って会話することが簡単すぎてビビった。 - Qiita
                                                                      • PythonでPDFファイルのテーブルデータを読み取る - Qiita

                                                                        PDFデータ 世の中の人はPDFが大好きなようで、嫌い嫌いと言っていても扱わざるを得ません。しかし、それに何時間もかけるのはちょっと・・・と思うのが人の常です。PDFの表データをしかないというケースもありますが、そのような際に便利なtabula-pyという超便利なライブラリがあったのでメモしておきます。 https://github.com/chezou/tabula-py tabulaにかんして tabulaはPDFの表を抽出するためのJavaのライブラリです。tabula-pyはそのラッパとなっております。そのため、利用するためにはJavaのインストールが必要です。 Javaをインストールした後、下のようにするとPythonのライブラリが利用できます。

                                                                          PythonでPDFファイルのテーブルデータを読み取る - Qiita
                                                                        • 「わたしをとりまく世界の話」尾崎 衣良(「人身取引問題とJICAの取り組み」小学館・JICA協働企画) | ニュース・メディア - JICA

                                                                          JICAウェブサイトでは、提供するサービス向上のため、クッキー(Cookie)を使用しております。 このバナーを閉じる、または継続して閲覧することで、プライバシーポリシーに記載されているクッキーの使用に同意いただいたものとさせていただきます。

                                                                            「わたしをとりまく世界の話」尾崎 衣良(「人身取引問題とJICAの取り組み」小学館・JICA協働企画) | ニュース・メディア - JICA
                                                                          • RAG構築のためのAzure OpenAI Serviceリファレンスアーキテクチャ詳解 | SIOS Tech. Lab

                                                                            こんにちは、サイオステクノロジー武井です。今回は、「RAG構築のためのAzure OpenAI Serviceリファレンスアーキテクチャ詳解」と題しまして、マイクロソフトが提供するRAG導入のためのリファレンスアーキテクチャについて解説します。 ※ 本記事の内容がベースとなっているオンラインセミナーのアーカイブが以下のYouTubeで配信されています。ぜひ見てね!! Azure OpenAI Service リファレンスアーキテクチャとは? マイクロソフトは、Azureでのシステム構築に役立つ様々な設計パターン(リファレンスアーキテクチャ)を提供しています。これらのパターンを参考にすれば、問題なく簡単にシステムを構築することが可能です。ゼロから設計を始める必要はありません。 https://learn.microsoft.com/ja-jp/azure/architecture/brows

                                                                              RAG構築のためのAzure OpenAI Serviceリファレンスアーキテクチャ詳解 | SIOS Tech. Lab
                                                                            • ガバメントクラウド先行事業(市町村の基幹業務システム等)の中間報告を掲載しました|デジタル庁

                                                                              〒102-0094 東京都千代田区紀尾井町1-3 東京ガーデンテラス紀尾井町 電話番号:(03)4477-6775(代表) 法人番号:8000012010038

                                                                                ガバメントクラウド先行事業(市町村の基幹業務システム等)の中間報告を掲載しました|デジタル庁
                                                                              • スライドやPDFをかんたん共有 | ドクセル

                                                                                スライドやドキュメントを リンクで簡単に共有! ドクセルは日本語でパワーポイントやPDF、 Wordファイルを共有できるサービスです。 あなたの知識を共有しましょう!

                                                                                  スライドやPDFをかんたん共有 | ドクセル
                                                                                • GitHub - Mega-Gorilla/Index_PDF_Translation

                                                                                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                                    GitHub - Mega-Gorilla/Index_PDF_Translation