2016年8月28日のブックマーク (4件)

  • MongoDBにCSVから大量のデータを流し込む - Qiita

    はじめに 業務用のアプリを作ってるとCSVファイルからデータベースに何かを入れたり更新するというのは日常的に出てくる要望です みんな大好きなMicrosoft Excelで編集できるというのが一番のメリットでしょうか MongoDBの場合、無加工でもいい状態ならmongoimportでもある程度はまかなえたりしますが通常何も考えずにExcelから書き出されるCSVファイルというのは文字コードがShift JISだったり文字列ゆえの日付や時刻データのハンドリング、あるいはアプリケーション固有のデータに落とし込むなどの何かしらの変換が必要で、そのためのプログラムを書くなんていうのもまたよくある話です 今回のお題 サンプルデータとしてなんちゃって個人情報さんから全フィールド入り5000件を6回生成して合体させた30000件のCSVわせてMongoDBに突っ込むというスクリプトを作ってみます

    MongoDBにCSVから大量のデータを流し込む - Qiita
    torinky
    torinky 2016/08/28
    MongoDBにCSVから大量のデータを流し込む
  • 縦書きも認識、日本語テキストの抽出に適したウェブサービス3選

    スキャンしてデータ化された書類からテキストを抽出できれば、再利用が容易になることで資料作成などの作業が捗る。これから新たに書類をスキャンするのであればスキャナ側の設定でOCRをオンにしておけばよいし、すでにスキャンした後であればOCR機能を持つソフトを用いてあらためて処理する方法もあるが、いずれの方法も使えない場合、オンラインサービスを使うのが手軽だ。 OCR機能を持つオンラインサービスといえば、かつては日語に対応しないケースがほとんどだったが、最近では日語固有の縦書きも認識できるなど、高い実用性を備えたサービスが増えつつある。今回は、スキャン書類から日語テキストを取り出すにあたって実用レベルの認識精度を備えた3つのオンラインサービスを、横書きおよび縦書きでの和英混じり文の認識結果とともに紹介しよう。 なお今回はPDF(単一ページ)のアップロードとTXTのダウンロードに対応し、縦書き

    縦書きも認識、日本語テキストの抽出に適したウェブサービス3選
    torinky
    torinky 2016/08/28
    縦書きも認識、日本語テキストの抽出に適したウェブサービス3選
  • PHP ソース改善Tips - Qiita

    日々の中でシンプルに出来たコードをメモ的に貼っておこうと思います パフォーマンス的な話もあるので採用するかはバランス次第 連想配列のKeyの有無でマージor追加 ある配列の内部に要素をマージしたいのですが、そのkeyがない場合があるのでその時には追加にしたい。 元のソース keyが存在しないためarray_mergeの第一引数に記述するとエラーになるのでifで分岐していました // $origin には $origin1 or $origin2 の2つのパターンが入ることがある(ユーザー入力など) $origin1 = array( 'key1' => array( 'originHoge' => 'originFuga', ) ); $origin2 = array( 'key2' => array( 'foo' => 'bar', ), ); // key1には追加で情報を付与したい

    PHP ソース改善Tips - Qiita
    torinky
    torinky 2016/08/28
    PHP ソース改善Tips
  • PHPでTCPDFを使ってHTMLをPDF化する - Qiita

    この記事の続きです。 環境 Mac OS X El Capitan 10.11.4 PHP 5.6.24 CodeIgniter 2.2.0(古い。が、他のFWでも参考になるかと思います) ライブラリのインストール composer require tecnickcom/tcpdf requireを付けてcomposer.jsonにも追加。 実装 // composerでインストールしたライブラリを参照する require_once('./vendor/tecnickcom/tcpdf/tcpdf.php'); // 用紙の方向、用紙サイズを指定する $tcpdf = new TCPDF('L', "mm",'A4'); $tcpdf->setPrintHeader(false); $tcpdf->setPrintFooter(false); $tcpdf->AddPage(); // C

    PHPでTCPDFを使ってHTMLをPDF化する - Qiita
    torinky
    torinky 2016/08/28
    PHPでTCPDFを使ってHTMLをPDF化する