タグ

2020年8月15日のブックマーク (5件)

  • xdoc2txt

    ■ 概要 xdoc2txtはPDF,WORD,EXCEL,一太郎などの各種バイナリ文書から、テキスト要素を抽出 する汎用テキストコンバータであり、Windowsのコマンドラインで動作します。 xdoc2txtは各種文書の構造を直接解析しているため、単独で変換できます。WORDや Acrobatなど、作成元のアプリケーションをインストールする必要はありません。 高速に動作するので、各種全文検索エンジンのフィルタに最適です。 ワープロ文書の種類は、拡張子から判別します。次の拡張子のファイルに対応してい ます。

  • プログラマーから見たPDFファイル - アンテナハウス PDF資料室

    更新日: 2020年8月14日 このページの目的 プログラマーは、クライアントから提供されたPDFファイルで、その要求を実現させようとしたとき、PDFのどんなところを見ているのでしょうか。このページでは、ちょっと珍しい視点でPDFファイルを解き明かしていきます。 自分でプログラムを書いてPDFファイルからテキストデータを取り出したいという人も、ぜひご一読ください。 はじめに PDFファイルをクリックすると、あたかも紙に印刷したかのように、どんなマシンでも同じような見た目で文章や画像がディスプレイに表示されます。 この単純な事実は、日常的にPDFファイルを利用していると当たり前に感じられるかもしれません。しかし、よくよく考えると驚くべきことです。 いったい、どのような仕組みがあれば、「過去から現在に至るさまざまな種類のコンピューターで見た目を変えずに同一の紙面を再現する」という目的を達成でき

    プログラマーから見たPDFファイル - アンテナハウス PDF資料室
  • 新型コロナ「正しく恐れて」 わかってきた特徴と対策 チャートで見る感染再拡大 - 日本経済新聞

    新型コロナウイルス感染症の患者が確認されてから8カ月が過ぎた。感染者は再び拡大に転じており、これまでのデータや研究から新型コロナの特徴の一端が分かってきた。確かな知識を持ち対策する「正しく恐れる」心構えが大切だ。日の感染再拡大のペースは、世界的には依然として緩やかだ。直近1週間(8月4~10日)の人口10万人あたりの新規感染者数は約7人にとどまる。100人以上が感染するブラジルや米国のおよそ

    新型コロナ「正しく恐れて」 わかってきた特徴と対策 チャートで見る感染再拡大 - 日本経済新聞
    kisiritooru
    kisiritooru 2020/08/15
    正しく恐れておじさん「新型コロナ。」
  • 田端信太郎氏「官邸から電通経由でステマ費用10億円受注」…官邸・電通内で問題視か

    万座温泉観光協会公式ホームページより 群馬県万座温泉のある旅館の夕の量に関し、オンラインサロン「田端大学」の公式メディア『BIG WAVE』編集長のよりかねけいいち氏が、Twitterに「多すぎて到底べきれない」「シニア層がメインターゲットのはずなので、つまり廃棄前提」などと投稿し、物議を醸している。 加えて、「田端大学」の代表・田端信太郎氏が突如議論に参加し、騒動が拡大しつつある。田端氏当人は「最近のTwitterは、みんな、心に余裕がなくていけません。Twitterなんて、大喜利ですよ! RTやファボはザブトンです」(原文ママ、以下同)と、この炎上騒動を満喫しているようだが、一方、心中穏やかではない人々がいるようだ。自民党と電通の関係者だ。 よりかね氏が10日に前出のように投稿したことに対し、批判的な意見が殺到し騒動が発生した。ここで収束していればよかったのだが、“ビッグウェーブ”

    田端信太郎氏「官邸から電通経由でステマ費用10億円受注」…官邸・電通内で問題視か
  • note執筆者のIPアドレスが漏洩 接続元IPアドレスが一致しても同一人物とは限らないが(楠正憲) - エキスパート - Yahoo!ニュース

    利用者が記事を配信・販売できるサービスnoteで8月14日、執筆者のIPアドレスを確認できてしまう不具合が見つかり、運営元は謝罪し同日中に修正しました。同社は「一般的なIPアドレスから、個人情報を特定することはできません」としていますが、ネットでは有名人のIPアドレスと一致する5ちゃんねる投稿が検索されるなど騒ぎは続いています。IPアドレスから個人を特定されたり、他の投稿との名寄せが行われるリスクはどの程度あるのでしょうか。 IPアドレスとはインターネットで通信を行う際に必要な差出人・宛先を示す住所のことです。現在IPv4、IPv6という2つの世代の技術が利用されており、note社のサービスはIPv4のみを利用しています。インターネットのIPv4アドレスは2011年に枯渇し、その後も利用者が増え続けたISPではCGNAT等の技術を用いることで数百人の利用者が同じIPアドレスを共用しています

    note執筆者のIPアドレスが漏洩 接続元IPアドレスが一致しても同一人物とは限らないが(楠正憲) - エキスパート - Yahoo!ニュース
    kisiritooru
    kisiritooru 2020/08/15
    IT系だから当然知ってるだろう。悪いなぁ。