タグ

2020年3月5日のブックマーク (2件)

  • PDFからテキストを抽出するのはなぜ難しいのか?

    PDFファイルは、どんな環境のPCでもテキストや画像の表示を崩すことなく見られるデータ形式です。しかし、PDFからテキストデータをコピーしようとすると、うまく選択できなかったり、テキストの内容がおかしくなってしまったりすることがあります。なぜPDFファイルからのテキスト抽出が難しいのかを、PDFファイルのテキスト化およびデータベース作成を行う団体、FilingDBが報告しています。 PDF text extraction | FilingDB https://www.filingdb.com/pdf-text-extraction ◆読み取り保護 PDFファイルの中には内容が保護されているものが存在します。テキスト自体は正しく表示されていても、テキストをコピーしようとすると「Copying text was denied (テキストのコピーが拒否されました)」といった内容が表示され、テキス

    PDFからテキストを抽出するのはなぜ難しいのか?
    mouki0911
    mouki0911 2020/03/05
    そろそろPDFの代替手段が欲しい
  • 客先常駐エンジニアだってテレワークしたい

    コロナ対策としてテレワークを実施する企業が増えている。 ギュウギュウ詰めだった通勤電車もずいぶん人が減った。なんならワンチャン座れんじゃね?ぐらいの勢いである。 オフィスに着いてもほとんど誰もいない。平時の1/3ぐらいの人数しかいないので、静かで快適だ。 そう、とっても快適に出勤できている…… いや違うだろ!!!!!!!!!!!!!!!なんで自分出勤してんだよ。プロパー社員の9割はテレワークしてんのに。 客先常駐だから無理だろうな〜とは思ってたけど、コロナが想像以上に大事になってきたから「もしかしたらテレワークできるんじゃ?」ってちょっとワクワクしてたんだよ。 で、出勤してみたらプロパー社員だけごっそり居ない。「来週からテレワークなのでこの作業お願いします〜」って言われた時点で嫌な予感はしてたけども…… いや、プロパーはなにも悪くないよ。客先常駐というビジネスがクソなだけで。 でもウイルス

    客先常駐エンジニアだってテレワークしたい
    mouki0911
    mouki0911 2020/03/05
    VR常駐開発不可避