関連タグで絞り込む (1)

タグの絞り込みを解除

ocrに関するhonestreeのブックマーク (1)

  • Logispec  EvernoteのOCRでテキスト化された文章をtxt形式で抽出する方法

    Evernoteには、画像ファイルにある文字を文字コードで認識するOCRの機能があります。英語のみならず、日語にも対応しています。 OCR処理は自動で行われ、画像をアップロードしてしばらくしてから同期を実行すると、画像中の文字を検索できるようになります。 これをテキストファイルに変換する方法が公式には存在していないようなので、手動で行う方法を探しました。 1)ノートをパソコンに保存 対象ノートを右クリック→「ノートのエクスポート」 enex形式で保存します。「ノートタグのエクスポート」にチェックを入れておきます。 2)テキストエディタで開く 正規表現で置換ができるテキストエディタ(例えばEmEditor Free)で開きます。 enexファイルの実体はxmlで、前半に画像ファイルのバイナリが入っています。この部分はいらないのでカットします。 画像データの後に、「<item h="25"

    honestree
    honestree 2012/02/24
    改行認識できないと使えない
  • 1