タグ

データとRに関するzmsgnkのブックマーク (2)

  • tabulizerパッケージによるPDF表データからのデータ取得

    tabulizerパッケージによるPDF表データからのデータ取得 👤 Shinya Uryu 📆 2016年8月24日(水曜日) ROpenSciの実験的パッケージリポジトリropenscilabsで、便利そうなパッケージを見つけた。 {tabulizer} というものだ。このパッケージは Tabula というオープンソースツールの機能を利用して、PDF中に含まれる表から、値を取り出すというもの。 政府や企業の報告書はPDFであることが多く(二次利用を想定していないのだろうが)、表としてデータが収められていることがしばしばある。PDFからのデータ取得方法として、Rでは {tm} を 使う方法 や {pdftools} を 利用する方法 がそれぞれあるが、 {pdftools} ではテキストベースでの抽出となるため、表データの抽出からRの特徴とも言えるデータフレーム形式への変換が困難であ

  • あなた好みの女性のタイプ、データマイニングで診断します | Business Data Studio - ビジネスデータスタジオ

    女の子「A君の好きな女の子のタイプは??」 A君「うーん・・・そうだなぁ・・・うーん・・・」 日常でよく遭遇するこのようなシーン。 うまく切り返し、出会いにつなげたいところですが、好みのタイプを表現するのはなかなかに難しいですよね。 そんな皆様の悩みを解決するために 【データマイニングを用いた診断ツール】 を作成いたしました!! 己の好みを客観的、かつ定量的に把握できます。※もちろん利用は無料です。 >>>さっそく診断する!<<< 使い方は非常に簡単です。 画像とプロフィールを見て、好みのタイプだったら「Good」ボタンを、 そうでなければ「Bad」ボタンを押して下さい。 当診断は「年齢」「身長」「体重」「スリーサイズ」のデータを使っての診断です。 なので、顔だけでなく、身体的特徴を総合的に加味し、判定をお願いいたします。 20人以上のデータが貯まると「診断する」ボタンが出てきます。 最

    あなた好みの女性のタイプ、データマイニングで診断します | Business Data Studio - ビジネスデータスタジオ
  • 1