Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

今回は、FessでオープンソースのOCRエンジン「Tesseract OCR」を利用する方法を紹介します。OCR(Optional Character Recognition:光学文字認識)とは、手書きや印刷された文字が含まれる画像をコンピュータで処理可能な文字コードの列に変換する技術です。OCRでは、パターン認識の技術などを用いて画像から文字情報を認識しています。 Fessでは、画像ファイルのメタデータで検索できるのですが、OCRを利用することで画像内の文字列でも検索できるようになります。 今回はFess 13.6.3とtesseract 4.1.1を使用し、画像内の文字列を検索するまでの手順を説明していきます。 Tesseract OCRの準備 まず、Tesseract OCRをインストールします。利用OSがMacOSの場合は、以下のコマンドを実行してください。 $ brew inst
先週日曜日に総額480円、プログラムコード200行、作業時間8時間で「給与明細.net」(http://www.給与明細.net)というWebサービスを作ってリリースをしました。これは給与支払明細書のPDFをWebで簡単に作れるWebサービスです。 シンプルな内容なので開発を開始してから8時間以内の作業でリリースできました。このエントリではサクッとサービスを開発してリリースするまでの僕なりの方法を紹介します。 特長 無料 会員登録不要 Excelから一括作成できる(CSVではない) オープンソース(MITライセンス) 目次 解決したい課題を見つける ドメインを取得する サイトマップとURLを決定する よいツールを集める まずデプロイ(公開)する そこそこのデザインにする 最低の機能をつけたらリリースする 広めるための準備をする おまけ:コードをかく 解決したい課題を見つける これがないとそ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く