タグ

PDFとTipsに関するobata9のブックマーク (8)

  • [解決!Python]PDFファイルからテキストや画像を抽出するには

    pdfminer.sixパッケージを用いて、PDFファイルからテキストや画像を抽出する方法を紹介する。 from pdfminer.high_level import extract_text from pathlib import Path # PDFファイルからテキストを抽出 source = Path('atmarkit_ebook116.pdf') text = extract_text(source) print(text) # extract_text_to_fp関数を使う from pdfminer.high_level import extract_text_to_fp dest = Path('out.txt') with open(source, 'rb') as fp_in, open(dest, 'wb') as fp_out: extract_text_to_fp

    [解決!Python]PDFファイルからテキストや画像を抽出するには
  • YAMLで履歴書を作る - Qiita

    はじめに 履歴書、書いてますか?>挨拶 僕もいま任期付きなもんで履歴書を書いては送る日々なわけですが、履歴書ってなんであんなに書きづらいんでしょうね? で、これまでは履歴書をLaTeXで書いて管理してたのですが、ちょっとスタイルを修正するのもすごく面倒だし、そもそもデータとスタイルの分離がよろしくないのがストレスでした。そんな時にこの【退職】履歴書をGit管理したかってん【しました】という記事を見て、僕も履歴書をもう少し扱いやすいフォーマットから作るスクリプトを書きました。ソースはGitHubに置いてあります。 (2020年7月19日追記) 2020年7月17日付で、日規格協会グループは、JIS Z 8303『帳票の設計基準』に掲載されていた「履歴書」の様式例を削除しました。2020年7月19日現在は「お知らせ」に記載されていますが、パーマネントリンクが無いようなので、そのうち消えるかも

    YAMLで履歴書を作る - Qiita
  • [常識にしたい]PDFにコメントするときの鉄則 - Qiita

    なぜかちゃんと知られていない、PDFへのアノテーション(=校正などで使用するツールやコメントなど)を使う時のエチケットをメモする。自由過ぎるアノテーションにお引き取りいただくために。 この鉄則は、今ならZeplinのようなツールにも応用できる。 作業前に アノテーション機能はPDFビュアーによって異なるけど、ここではAdobe Readerを前提とする。作業者のビュアーを全員同じにしておくこと。でないと無駄な争いが起きる。Mac/Win/Linuxで共通に使えるAdobe Readerにしておくのが無難。 鉄則1: バルーンは「絶対使うな」 例外はあるにせよ、ちょっと強い調子で書く。バルーンを使うと確実に嫌われる。 バルーンは、画面や文字列のどこを指しているのかが必ずあいまいになる。そしてそれが元で必ずや修正指示がい違う。 バルーンの利用が許されるのは、この特性を理解したうえで、最初のペ

    [常識にしたい]PDFにコメントするときの鉄則 - Qiita
  • PDFファイルにきれいにテキスト文字を書き込む3つの方法

    PDFファイルは元々Acrobatアプリで、Adobeが提供しているものでした。今や世界標準の電子的な情報配布の為に用いられています。情報の伝達・交換・蓄積に使われます。PDFおは、テキストのみならず図や表など印刷するようにレイアウトされたページの状態を維持するファイル形式でPortable Document Format(ポータブル・ドキュメント・フォーマット)の頭文字を取ったものです。市役所などで窓口に提出する事前にデータをダウンロードする申請書などはPDFで作成されているものがほとんどです。元々そのデータを作成するアプリはAcrobatなどの高額なものが一般的でしたが、昨今作成することは容易になりました。なぜなら、office(ワードなど)で作成したものをエクスポートすることでPDFにすることが出来るからです。基PDFはあくまで見るだけで編集は二の次でした。どのデバイスからも同じフ

    PDFファイルにきれいにテキスト文字を書き込む3つの方法
  • PDF ファイルにテキストを入力する方法 (Acrobat 8/9)

    この文書では、Adobe Acrobat 8/9 で PDF ファイルにテキストを入力する方法について説明します。 PDF ファイルへのテキストの入力には、TouchUp ツールを使用する方法、タイプライターツールを使用する方法、描画マークアップツールを使用する方法、注釈を利用して追加する方法の 4 つの方法があります。 TouchUp テキストツールを使用して、PDF ファイルの既存の文章を変更したり、テキストを追加・削除することができます。 注意 : PDF ファイルの既存のテキストを編集すると、PDF の内部情報が変更されたり、フォントの問題が発生する可能性があります。詳細は追加情報を参照してください。

  • PDFのリンクをクリックした時の挙動を選択する

    ネットを見ていて不用意にPDFをクリックしてしまい、PDFファイルを開くまでWebブラウザで何もできなくなってしまった経験を持つ人は多いだろう。そうでなくとも、急いでいる時にうっかりPDFをクリックしてしまうと、待たされている時間は非常に長く感じられる。その間ブラウザでは何の操作もできず、ただじっと待ちぼうけになってしまうわけで、時間が長く感じるのも当然だ。 PDFをブラウザのウィンドウ内で開きたくない場合、Adobe Readerであれば[環境設定]-[インターネット]にある「PDFをブラウザに表示」のチェックを外すのが基。こうしておけば、PDFをクリックした際に、いったんダウンロードしてからAdobe Readerで開くようになるので、ブラウザごと動かなくなってしまう事態は避けられる。 また、Firefoxでも設定できる。具体的には[ツール]-[オプション]-[コンテンツ]タブにある

    PDFのリンクをクリックした時の挙動を選択する
  • 画像内の文字をコピー&ペーストする

    資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。 資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。 クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ&ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。 この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを

    画像内の文字をコピー&ペーストする
  • Lifehacker Top 10:ちょっと便利なPDF Tipsトップ10 - ITmedi...

    PDFファイルでできることは思っているよりずっと多い。PDF文書を変換、編集、管理するテクニックをお届けする。(Lifehacker) PDFファイルフォーマットは、レイアウトを整えた文書を公開し、保存し、交換する最善の方法の1つだ。どんなデバイスやコンピュータでファイルを開いても、正確に同じに見える。履歴書、納税申告書、電子書籍、ユーザーガイド、Webページでも何でも、PDFを使えば間違いない。皆さんは既に無料のPDFリーダーをPCにインストールしているだろうが、PDFファイルでできることは思っているよりずっと多い。そこでPDF文書を変換、交換、共有、管理、編集するテクニックのトップ10を紹介する。 10. カスタムPDFメモ用紙を作る マイケル・ボツコ氏のPDFメモ用紙ジェネレータで自分だけのDIYメモ用紙をデザインしよう(日語の記事はこちら)。名前やプロジェクト名、パンチ穴などのテ

    Lifehacker Top 10:ちょっと便利なPDF Tipsトップ10 - ITmedi...
  • 1