タグ

ブックマーク / www.zukeran.org (3)

  • pdf2txt.py 便利すぎる(PDF表をテキスト化) | ず@沖縄

    SARS-COV-2関連情報を集めていると、国や自治体、企業が公開している情報がPDFなのにムカついてしまう。ExcelPDF化したものもあって、素直にxlsも出せよと思う。 (それでも画像データで公開している組織に比べればかなりマシなのが悲しい) 例えば、沖縄県のワクチン接種率の情報がPDFだ。「沖縄県のワクチン接種進捗状況/沖縄県」に掲載されている「県内市町村ごとの新型コロナワクチン接種件数」がPDFだ。タイトルは .xlsx になっているので、元々はExcelであったのだろう。 ご丁寧なことに情報が更新されると過去のPDFが消されてしまうので、接種率の変化を追っかけたい場合はPDFを手元に保存しておかないといけない。沖縄県の情報公開はこういうところがダメダメだと思う。消すなよ。 表から情報を抜き出す情報を抜き出すツールとしては adobeの【無料】PDFExcelに変換 – Ad

    pdf2txt.py 便利すぎる(PDF表をテキスト化) | ず@沖縄
  • さくらvpsに移行しました(自宅サーバーお亡くなりの巻) | ず@沖縄

    クーラーもないところで24時間動かしているせいか、うちの自宅サーバーは死ぬ率が高い。このブログを動かしているサーバーは 2009年に買ったものだが、満4年と4ヶ月ほどでお亡くなりに。症状からすると CPU がおかしくなったっぽい。 (このため 6/1未明から夕方にかけて、サイトにアクセスできませんでした。ごめんなさい) 旧サーバーの状況 久しぶりに分解すると、ケースやマザーボードがところどころ錆ついている。湿度の高い沖縄で24時間動かしているので仕方が無い。たまにしか使わないPC(2009年購入)はまだ元気に動いているので 使用状況の差だなあ。 旧サーバーは Athlon X2 5050e (Dual-Core, 2.6GHz, L2 1MB) + 6GB Memory という構成。これでも ブログ*2、Wiki、その他サイト複数を動かしていて、かなり負荷が高かった。 (CPUが死んだ

    さくらvpsに移行しました(自宅サーバーお亡くなりの巻) | ず@沖縄
  • ず's » google翻訳の挙動が理解できない…

    以前、海外サイトの記事を検索する方法として「さっぱりわからない言語のサイトを検索する方法」を書いたけど、その方法を使って遭遇したGoogle翻訳の謎挙動。 最近話題になったニュースが韓国のサイトでは、どのように掲載されているかを確かめるために韓国語で検索したわけですよ。検索結果が上図。私は韓国語は読めないのでこのままでは意味不明。10年ぐらい前に出張で訪韓したときに読みだけは覚えたはずなんだが、それも忘れてしまった。 検索結果ページを翻訳してみたGoogle翻訳のツールバーを使って、検索結果ページを丸ごと日語翻訳します。機械翻訳に頼ると「機械翻訳は我々の夢だったわけだが」にて紹介したようなトンデモ翻訳を掴まされる可能性もあるわけですが、それでも大雑把に検討をつけて調べるためには便利に使える。怪しい翻訳部分は辞書を引くなり、別のツールと併用するなりして正確さを高めればいいわけで。 ↑翻訳結

    ず's » google翻訳の挙動が理解できない…
  • 1