タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

Rubyとrubyとpdfに関するHashのブックマーク (5)

  • Tカード個人情報提供先新着botを作りました - くりにっき

    https://twitter.com/ccc_privacy_bot 作った経緯 Tカードが個人情報を提携企業に提供開始 個人情報提供の停止 手続きガイド|CCC カルチュア・コンビニエンス・クラブ株式会社 ツタヤTカード、勝手に個人情報を第三者へ提供?規約改定炎上騒動の真相 CCCに聞く | ビジネスジャーナル 個人情報提供の中止はいつでもできるが、「提供先企業は随時増える」「提供先企業が増えてもCCCからは通知は来ない」「新規企業は何もしないとデフォルトで個人情報提供する設定」というユーザフレンドリーじゃない仕様 毎日PDFをチェックしにいくほど暇じゃないのでボット作るか という感じ ボット自体は半月くらい前にはできてたのですが、2回目以降のCCCの更新が取得できるまで公開を控えていました。 【追記】「個人情報」について 語弊あったようなので捕捉 「個人情報」とは言っても、個人情報そ

    Tカード個人情報提供先新着botを作りました - くりにっき
  • Ruby で PDF と戯れるの巻 - Qiita

    とちぎ Ruby 会議 05 の懇親会の LT で発表したネタですが、一部の方から関心を持って頂けたようなので記事にします。 関心事の全体 まず、下記のような流れをサーバーで定期的に自動で行いたいという目的があるとします。 WEB で公開されてる PDF を取得 テキストを抽出 テキスト整形 データベースへ格納 今回やること 今回は PDF の取得やテキスト整形やデータベースへの格納は割愛します。 PDF からのテキスト抽出についての紹介だけをします。 今回の題材 今回は適当な go.jp サイトから文化庁の「敬語の指針」を選びました。この PDF を適当に開くと、1ページ目に「敬語の指針」「平成19年2月2日」「文化審議会答申」と書いてあるのが分かると思います。このテキストを Ruby で抽出してみましょう。 なんかライブラリに喰わせればテキストがポンと出てくるでしょ 色々調べた中で、P

    Ruby で PDF と戯れるの巻 - Qiita
  • [pdf]Railsアプリケーション開発者のためのSolr入門 株式会社ロンウイット

    Rails Solr Solr 1.2 rel 1.0 • Rails Solr • Apache Solr 1.2 • Goal/Non-Goal • Goal – Apache Solr 1.2 Solr – Solr – Solr – Solr – Solr • Non-Goal – Solr – Solr – Solr Solr – 1. • • 2. Solr • Solr • Solr • Solr 3. example • example • example • • solr-ruby 4. • schema.xml • ANALYSIS 5. RailsRails • – – – UNIX grep SQL like • – – Solr Namazu Senna Google Yahoo! ID a) b) c) AND “ AND • • • • • • •UNI

  • Unix修正主義

  • 2008-01-29

    文献管理ソフトは、pdf ファイルの名前を pmid.pdf にするのが多そうだけど、手作業はめんどい。 => 誰か変換スクリプトを〜。 => ktkr http://www.geocities.jp/researcherinus/perl1 => うまく text 抽出できない場合がある => 自分で書けないもんだろうか? => Rubypdf から text 抽出どうやるのか見つからなかった ところが寝る前に HMDT3版を読んでいたら RubyCocoa*1 で pdf からの text 抽出が載っていた ので、ちょっと Nature とかの pdf から text 抽出して doi を抜き出せるか試してみた。 #!/usr/bin/env ruby # # Created by mako on 2008-01-29. # What? # This_script.rb extr

    2008-01-29
    Hash
    Hash 2008/01/30
    Cocoaを使うのか
  • 1