タグ

2018年9月7日のブックマーク (3件)

  • Tesseract OCR 近況(2018/06) - 今日も微速転進

    オープンソースのOCRエンジン(正確に言うとOCR用のライブラリ)、Tesseract OCRの開発状況ウォッチング、です。 しばらくメーリングリスト、GitHubのリポジトリからの通知をチェックできていなかった時期があるので見落としがあるかも。 2017年秋ごろに下書きして、途中で興味が他の方向に行ったりして放置しているうちに半年以上経っていたという。 今年の3月頃、「5月中にバージョン4.00をリリースしたい」という話が出ていた……。 3.0x系 バージョン 4.0系 バージョン4.0系の注意点と新しい言語別データ 書字系(script)別データについて Japanese.traineddataを使う場合の注意点 LSTMベースの認識エンジンの学習について 従来式の画像とboxファイルからの学習 マルチスレッド ABI 変更状況 ここ最近の新しい動きなど Docker テストデータ T

    Tesseract OCR 近況(2018/06) - 今日も微速転進
  • DigdagとEmbulkを利用してBigQueryにRDS(Aurora、MySQL)のマスタデータを同期する - ZOZO TECH BLOG

    こんにちは、バックエンドエンジニアの塩崎です。 先日、会社の広報のためのインターン生紹介記事にメンターとして掲載していただきました。 大学四年生のインターン生と一緒に写真撮影を行ったのですが、見た目だけではどちらが年上かわからなかったので、「メンターの塩崎(右)」という表記をされてしまいました(笑) インターンでも実際のサービスに触れ、課題を解決!〜VASILY DEVELOPERS BLOGが公開されました〜 さて、VASILYではData WarehouseとしてGoogle BigQuery(BigQuery)を利用しています。 BigQuery内にはプロダクトのマスタデータとユーザーの行動ログが格納されています。 そして、それらに対する横断的なクエリを発行することでプロダクトの成長のためのKPIをモニタリングしています。 そのためAmazon Relational Database

    DigdagとEmbulkを利用してBigQueryにRDS(Aurora、MySQL)のマスタデータを同期する - ZOZO TECH BLOG
  • AWS Step Functionsでジョブ・ステータス・ポーリングを実装する | DevelopersIO

    AWS Step Functionsを使ってAWS Batchのジョブをキューイング→ジョブステータスをポーリング→ジョブ終了までを管理するジョブ・ステータス・ポーラーを10分でプロビジョンするチュートリアルが追加されていたため、実際にやってみました。 ステートマシン LambdaAWS Batch ジョブをキューイングし、ジョブのステータスが完了系になるまでポーリングします。 ポーリング間隔は Wait ステートを利用します。 やってみた 以下の手順でサンプルプロジェクトを実行します。 タスクタイマーをプロビジョン 後片付け 1. タスクタイマーをプロビジョン Step Function のダッシュボードから ”Create a state machine”を選択します Sample Projects -> Job Status Poller を選択し、"Create Sample

    AWS Step Functionsでジョブ・ステータス・ポーリングを実装する | DevelopersIO