kimihitoのブックマーク / 2017年6月27日

PDFの表を表のまま読み取るには tabula - Qiita

自治体やお役所のオープンデータの取り組みは以前に比べて多くなってきているが、問題はその公開フォーマット。機械的に読み取って再利用したい側としては構造化されたテキストである JSON、あるいは XML、せめて CSV でほしいところだが、PDF でのみという場合も多い。文章を PDF から抽出するのはそれほど難しくはないが、表を表の形のまま、抽出するのはなかなか難しい。行やカラムがずれたり、セルの中の改行をうまく扱えなかったりする。これまで、自治体等が公開しているデータがどうしても PDF のみの場合に、コピー&ペーストしたり、入力しなおしたりと苦労してきたが、やっとうまく表データを抽出できるツールTabulaを見つけた。 Tabula は表の抽出に特化したツールではあるが、表の形を保ったままテキストを抽出できる。オフィシャルサイト： Tabula: Extract Tables f

kimihito 2017/06/27

リンク

Tabula: Extract Tables from PDFs

Tabula is a tool for liberating data tables locked inside PDF files. View the Project on GitHub tabulapdf/tabula Download for Windows Download for Mac View source on GitHub Current Version: 1.2.1 Other Versions: pre-releases & archives Need help? Open an issue on Github. Donate: Help support this project by backing us on OpenCollective. We'd love to hear from you! Say hi on Twitter at @TabulaPDF L

kimihito 2017/06/27

リンク

Ayanel & Company

kimihito 2017/06/27

リンク

Qiita Zine

イベントタイアップ「あなたのお仕事をちょっぴり豊かにする生成AI活用術」Qiita Conference 2024イベントレポート 2024年4月17日〜19日の3日間にわたり、日本最大級*¹のエンジニアコミュニティ「Qiita」では、オンラインテックカンファレンス「Qiita …

kimihito 2017/06/27

リンク

TechCrunch | Startup and Technology News

It’s that time of week again, folks. Welcome to Week in Review (WiR), TechCrunch’s regular digest of the past week in tech. New here? Not to worry — sign up here to get WiR in your i

kimihito 2017/06/27

リンク

masalog.site

kimihito 2017/06/27

リンク

ハッカーズチャンプルー 2017 の合宿 + カンファレンスに参加してきた & ボランティアスタッフもやった！ - アルパカ三銃士

凄く濃ゆい日々を久しぶりに過ごしたので、これは是非書こうと思いました。ハッカーズチャンプルーは合宿 + カンファレンス構成となっており、合宿に関しては Okinawa.rb, IT カレッジ沖縄がスポンサーとなってくれたおかげで、学生は合宿の宿泊代が無料といった形となっていました。そのため、今回は合宿 + カンファレンス参加、沖縄の IT コミュニティへの恩返しのつもりで、ボランティアスタッフとしても参加しました。合宿合宿は 3 泊 4 日でした。場所は「かりゆしコンドミニアムリゾート北谷マリーナベイ美浜」でした。コンドミニアムってなんだ!?ってなってて、別のコンドミニアムに着いたのは内緒 Day 1 Welcome Party 🎉 イベントページです。 hackers-champloo.doorkeeper.jp 沖縄地ビール酒場～Beer Rize 北谷というめっちゃ

kimihito 2017/06/27

#hcmpl

リンク

parallel_tests ではなく test-queue に乗り換えようと思う - Thanks Driven Life

みなさま、もうすぐ今年の 2/3 が終わる今日この頃、いかが並列にお過ごしでしょうか。私も快適に並列を生きていくために、今回 parallel_tests から test-queue に乗り換えようという気持ちになったということをご報告致します。経緯現在、PHP の Web アプリケーションを capybara + turnip でテストするお仕事をしており、最近ようやく富豪な Docker ホスト環境に触れるようになったということもあって、以前試した Selenium Grid + Docker でがりがり高速化に勤しんでいます。そんなこんなで RSpec の同時並列実行もしないとね、ということで、以前から触っていた parallel_tests を導入しました。これまでは全テストの完了まで約40分かかっていましたが、parallel_tests を導入するだけで約1

kimihito 2017/06/27

リンク

Launch School - Demystifying Rails

This book doesn't teach how to use Rails to build prototypes. Instead, this book dives one layer below the surface to expose how Rails is pieced together. We'll take common Rails conventions apart and study each component from the perspective of web development fundamentals. Significant programming, web development, and even basic Rails knowledge will be helpful prior to starting this book. This b

kimihito 2017/06/27

リンク

Eテレ「香川照之の昆虫すごいぜ！」特別編放送決定　「出動！タガメ捜査一課」が始動!?

Eテレで「香川照之の昆虫すごいぜ！」の第3弾として特別編「出動！タガメ捜査一課」が8月12日に放送されることが明らかになった。「香川照之の昆虫すごいぜ！」特設サイトにも第3弾の告知が 6月25日放送のNHK「ダーウィンが来た！生きもの新伝説」の「タガメ」回に合わせて制作決定が公開された。絶滅危惧状態にあるタガメにもう一度会いたいという、カマキリ先生こと香川照之さんの強い願いから設置された「タガメ捜査一課」が始動する。 6月25日はタガメでした（「ダーウィンが来た！生きもの新伝説」公式サイトより）関連キーワード昆虫 | Eテレ | 生物多様性 | NHK advertisement 関連記事なぜか“昆虫好き”まで魅了したCanCamの付録「自撮りライト」がまた登場！　男性にも使いやすいスタイリッシュな星型ツノゼミも盛れる。ヨーダみたい　新種のメガネザルがインドネシアで発見される

kimihito 2017/06/27

タガメにラブレター書いてたから良かった

リンク

はてなブックマーク

タグ

2017年6月27日のブックマーク (10件)

PDFの表を表のまま読み取るには tabula - Qiita

Tabula: Extract Tables from PDFs

Ayanel & Company

Qiita Zine

TechCrunch | Startup and Technology News

masalog.site

ハッカーズチャンプルー 2017 の合宿 + カンファレンスに参加してきた & ボランティアスタッフもやった！ - アルパカ三銃士

parallel_tests ではなく test-queue に乗り換えようと思う - Thanks Driven Life

Launch School - Demystifying Rails

Eテレ「香川照之の昆虫すごいぜ！」特別編放送決定　「出動！タガメ捜査一課」が始動!?

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス