tatsu-nのブックマーク / 2018年4月11日

tatsu-n id:tatsu-n

2018年4月11日のブックマーク (6件)

Python3でPDFのテキストを抽出する
PDFからテキストを抽出するにはPDFを開いてコピペでもできるけれど、一度に大量のPDFを処理するとか、抽出したテキストでさらに何かの処理をしたいときなどは、やはりプログラムでやりたい。というわけで、Python3でPDFからテキストを抽出する方法を調べてみた。見つけたのがPDFMinerというPDFの構造解析をするPythonライブラリ。これを使ってPDFからテキストを抽出できる。ただしPython2系用なので、Python3にはフォークバージョンのPDFMiner.sixを使う（Python3.4/3.5に対応）。PDFMiner.sixを使ってPDFからテキストを抽出するまでの手順をまとめた。環境 Raspberry Pi 3 Model B $ cat /etc/redhat-release CentOS Linux release 7.3.1611 (Core) $ pyth
tatsu-n 2018/04/11
リンク
Pマーク発行機関も「パスワード定期変更は不要」 - 日本経済新聞
個人情報を適切に扱う事業者に与えられる「プライバシーマーク（Pマーク）」を発行する一般財団法人の日本情報経済社会推進協会（東京・港）は10日、認定時の審査基準を改定し、インターネット利用時のパスワードの定期的な変更を不要にする方針を示した。総務省などの方針転換に対応した。Pマークを取得済みの約1万5千社・団体でも同様の動きが広がりそうだ。同協会が見直したのは企業が顧客らの個人情報を適切に扱って
tatsu-n 2018/04/11
プライバシーマーク（Ｐマーク）」を発行する一般財団法人の日本情報経済社会推進協会（東京・港）は10日、認定時の審査基準を改定し、インターネット利用時のパスワードの定期的な変更を不要にする方針を示した
リンク
総務省 | 国民のためのサイバーセキュリティサイト
tatsu-n 2018/04/11
日本においても、内閣サイバーセキュリティセンター（NISC）から、パスワードを定期変更する必要はなく、流出時に速やかに変更する旨が示されています
リンク
パスワード定期変更は不要だった！総務省の方針転換に「やっと見直された」 - エキサイトニュース
総務省が「国民のための情報セキュリティサイト」に記載されていた「パスワードを定期的に変更し、使い回さない」という記述を変更。「パスワードを複数のサービスで使い回さない（定期的な変更は不要）」としている。日本経済新聞電子版の記事をきっかけに、ネット上で話題になっている。総務省「パスワードを変更する必要はありません」総務省は同サイトで「利用するサービスによっては、パスワードを定期的に変更することを求められることもありますが、実際にパスワードを破られアカウントが乗っ取られたり、サービス側から流出した事実がなければ、パスワードを変更する必要はありません」と呼びかけた。さらに「むしろ定期的な変更をすることで、パスワードの作り方がパターン化し簡単なものになることや、使い回しをするようになることの方が問題となります。定期的に変更するよりも、機器やサービスの間で使い回しのない、固有のパスワードを設
tatsu-n 2018/04/11
リンク
日本もようやく……「パスワードの定期変更は危険」を報じた日経の記事が大きな話題に【やじうまWatch】
tatsu-n 2018/04/11
リンク
ソートアルゴリズムを極める！〜なぜソートを学ぶのか〜 - Qiita
NTT データ数理システムでリサーチャーをしている大槻 (通称、けんちょん) です。今回はソートについて記します。 0. はじめにデータ構造とアルゴリズムを学ぶと一番最初に「線形探索」や「ソート」が出て来ます。これらのテーマは応用情報技術者試験などでも頻出のテーマであり、アルゴリズムの Hello World とも呼ぶべきものです。特にソートは、計算量の改善 ($O(n^2)$ から $O(n\log{n})$ へ) 分割統治法ヒープ、バケットなどのデータ構造乱択アルゴリズムの思想といった様々なアルゴリズム技法を学ぶことができるため、大学の授業でも、アルゴリズム関連の入門書籍でも、何種類ものソートアルゴリズムが詳細に解説される傾向にあります。本記事でも、様々なソートアルゴリズムを一通り解説してみました。しかしながら様々な種類のソートを勉強するのもよいが、「ソートの使い方」や
tatsu-n 2018/04/11
リンク
- 2018年4月12日
- 2018年4月11日
- 2018年3月27日