タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

tipsとocrに関するlost_and_foundのブックマーク (2)

  • Logispec  EvernoteのOCRでテキスト化された文章をtxt形式で抽出する方法

    Evernoteには、画像ファイルにある文字を文字コードで認識するOCRの機能があります。英語のみならず、日語にも対応しています。 OCR処理は自動で行われ、画像をアップロードしてしばらくしてから同期を実行すると、画像中の文字を検索できるようになります。 これをテキストファイルに変換する方法が公式には存在していないようなので、手動で行う方法を探しました。 1)ノートをパソコンに保存 対象ノートを右クリック→「ノートのエクスポート」 enex形式で保存します。「ノートタグのエクスポート」にチェックを入れておきます。 2)テキストエディタで開く 正規表現で置換ができるテキストエディタ(例えばEmEditor Free)で開きます。 enexファイルの実体はxmlで、前半に画像ファイルのバイナリが入っています。この部分はいらないのでカットします。 画像データの後に、「<item h="25"

  • 漫画の電子化の方法

    漫画電子化 部屋がだらけでお困りの方におくる 電子化への道。 <漫画を見るなら回転機能付きディスプレイが便利> 必要な機材も揃ったことだし。 ここらで漫画のデジタル化指南の総まとめに入りたいと思います。 自分の作業に対するマニュアル化の意味も含めてあるので 今回のログは保存版となります。 では早速、題。 今からお話するのは漫画の電子化作業の説明になります。 早い話がコミックをスキャナでスキャンするというものです。 …でもこれが言うが安し。 実際、やってみると色々と下準備が必要なことがわかってきます。 たぶん、普通のスキャナでは1冊1週間のペースになるでしょう。 もちろん、そんなのは俺の性に合いっこありません。 なにせ動画のエンコード作業ですらちんたらしすぎて 我慢できない性質です。そのような理由から 一度としてまともな動画ファイルを作ったことがあ

  • 1