[B! Ruby][ruby][pdf] Hashのブックマーク

Tカード個人情報提供先新着botを作りました - くりにっき

https://twitter.com/ccc_privacy_bot 作った経緯 Tカードが個人情報を提携企業に提供開始個人情報提供の停止手続きガイド｜CCC カルチュア・コンビニエンス・クラブ株式会社ツタヤTカード、勝手に個人情報を第三者へ提供？規約改定炎上騒動の真相　CCCに聞く | ビジネスジャーナル個人情報提供の中止はいつでもできるが、「提供先企業は随時増える」「提供先企業が増えてもCCCからは通知は来ない」「新規企業は何もしないとデフォルトで個人情報提供する設定」というユーザフレンドリーじゃない仕様毎日PDFをチェックしにいくほど暇じゃないのでボット作るかという感じボット自体は半月くらい前にはできてたのですが、2回目以降のCCCの更新が取得できるまで公開を控えていました。【追記】「個人情報」について語弊あったようなので捕捉「個人情報」とは言っても、個人情報そ

Hash 2015/03/03

リンク

Ruby で PDF と戯れるの巻 - Qiita

とちぎ Ruby 会議 05 の懇親会の LT で発表したネタですが、一部の方から関心を持って頂けたようなので記事にします。関心事の全体まず、下記のような流れをサーバーで定期的に自動で行いたいという目的があるとします。 WEB で公開されてる PDF を取得テキストを抽出テキスト整形データベースへ格納今回やること今回は PDF の取得やテキスト整形やデータベースへの格納は割愛します。 PDF からのテキスト抽出についての紹介だけをします。今回の題材今回は適当な go.jp サイトから文化庁の「敬語の指針」を選びました。この PDF を適当に開くと、１ページ目に「敬語の指針」「平成19年2月2日」「文化審議会答申」と書いてあるのが分かると思います。このテキストを Ruby で抽出してみましょう。なんかライブラリに喰わせればテキストがポンと出てくるでしょ色々調べた中で、P

Hash 2015/01/06

リンク

[pdf]Railsアプリケーション開発者のためのSolr入門株式会社ロンウイット

Rails Solr Solr 1.2 rel 1.0 • Rails Solr • Apache Solr 1.2 • Goal/Non-Goal • Goal – Apache Solr 1.2 Solr – Solr – Solr – Solr – Solr • Non-Goal – Solr – Solr – Solr Solr – 1. • • 2. Solr • Solr • Solr • Solr 3. example • example • example • • solr-ruby 4. • schema.xml • ANALYSIS 5. Rails • Rails • – – – UNIX grep SQL like • – – Solr Namazu Senna Google Yahoo! ID a) b) c) AND “ AND • • • • • • •UNI

Hash 2012/04/10

リンク

Unix修正主義

Hash 2012/02/07

リンク

2008-01-29

文献管理ソフトは、pdf ファイルの名前を pmid.pdf にするのが多そうだけど、手作業はめんどい。 => 誰か変換スクリプトを〜。 => ktkr http://www.geocities.jp/researcherinus/perl1 => うまく text 抽出できない場合がある => 自分で書けないもんだろうか？ => Ruby で pdf から text 抽出どうやるのか見つからなかったところが寝る前に HMDT3版を読んでいたら Ruby Cocoa*1 で pdf からの text 抽出が載っていたので、ちょっと Nature とかの pdf から text 抽出して doi を抜き出せるか試してみた。 #!/usr/bin/env ruby # # Created by mako on 2008-01-29. # What? # This_script.rb extr

Hash 2008/01/30

Cocoaを使うのか

リンク

はてなブックマーク

タグ

関連タグで絞り込む (0)

Rubyとrubyとpdfに関するHashのブックマーク (5)

お知らせ

今週のはてなブックマーク数ランキング（2025年12月第1週）

月間はてなブックマーク数ランキング（2025年11月）

今週のはてなブックマーク数ランキング（2025年11月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (0)

Rubyとrubyとpdfに関するHashのブックマーク (5)

Tカード個人情報提供先新着botを作りました - くりにっき

Ruby で PDF と戯れるの巻 - Qiita

[pdf]Railsアプリケーション開発者のためのSolr入門 株式会社ロンウイット

Unix修正主義

2008-01-29

お知らせ

今週のはてなブックマーク数ランキング（2025年12月第1週）

月間はてなブックマーク数ランキング（2025年11月）

今週のはてなブックマーク数ランキング（2025年11月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

[pdf]Railsアプリケーション開発者のためのSolr入門株式会社ロンウイット