タグ

scanとocrに関するxiaodongのブックマーク (6)

  • 凸版、精度99.99%以上で紙の文献を全文データ化するシステムを開発

    凸版印刷は、紙の文献や資料を、精度99.99%以上かつ短納期で全文テキストデータ化する「文献・資料の高精度全文テキスト化システム」を開発したと発表。7月下旬より、このシステムを用いたサービスの提供を開始する。 同システムは、凸版印刷の文字・テキスト処理技術と、IBM基礎研究所が開発した共同校正技術を組み合わせて作られたもの。印刷された文献や資料を光学文字認識(OCR)でテキストとして読み取り、そのデータの精度を統計処理などにより補完。さらに、共同校正により確認・修正を行ったのち、最後に目的に応じた文字・テキスト処理、各種フォーマットへの変換処理を行う。 このシステムによって、高品質化と作業時間の短縮を両立させることに加え、ルビや傍点、縦中横、和欧混植、割り注など、従来のOCRが苦手としていた複雑な日語組版にも対応する。難読文字を効率的に確認・修正するためのサポート機能を強化することで、従

    凸版、精度99.99%以上で紙の文献を全文データ化するシステムを開発
  • 読んでいる本の文章をすぐさまスキャンしてツイートできる「Kuote」

    日々の生活の中で触れる新聞・雑誌・・その他の印刷物について、読んでいる最中に「お!これは!」と思った文章やフレーズなどをその場でサクッとTwitter・Facebook・Dropboxなどに送信して共有してしまうコンセプトでデザインされたのがこの「Kuote」です。 red dot online: design concept Kuote Digital Reader And Sharing Device by Xu Tao, Wang Junfeng, Christina Yang & Gong Yanyan for Orange Labs Beijing » Yanko Design 使い方はこんな感じ。透明なので向こう側が透けて見えます。 くるくると回転させてカーソル移動するとそのままOCRでスキャンしてテキスト化 指でつつーっとなぞると選択 上方向へそのままスライドさせればワイヤ

    読んでいる本の文章をすぐさまスキャンしてツイートできる「Kuote」
  • 書籍を「裁断→スキャン」して電子書籍端末で読むメリットとデメリット

    Amazonの「Kindle」の国内発売、さらにAppleの「iPad」の登場もあって、2010年に入ってから電子書籍の話題がたけなわである。ニュースサイトはもちろん、個人サイトやブログでも、電子書籍の話題を見ない日は皆無と言っていい。すでに海外では多くのユーザーを取り込んで人気を博していることもあり、ここ日においても、新しい読書体験への期待は否応なく高まりつつある。 しかし現在の日国内の状況を見ていると、すべての書籍において紙とデジタルデータから個人が選択できるようになるのは、遠い未来のことになりそうだ。以前誌でインタビューした漫画家のうめ氏のように直接Kindle DTPから自費出版を試みたり、ePub形式のファイルをオンラインで販売するクリエイターが今後増加することは間違いないだろうが、今書店に並ぶすべてのがすぐに電子書籍で読めるようになるかと言われると、おそらくノーだろう。

    書籍を「裁断→スキャン」して電子書籍端末で読むメリットとデメリット
  • 橋本商会 » scansnapと裁断機を買って本を電子化しまくる

    を解体する為にこの裁断機を買った。14000円ぐらい。 大型ペーパーカッター 裁断機 まだ必要ないので買ってないけど、替え刃も発見した。 コピー用紙500枚らくらくカット/人気 商品大型ペーパーカッター用『替え刃』 ジャンプぐらいの厚い雑誌でも切れる。このサイズの裁断機では妙に安い(他の半額程度)だが、そのかわり届いた時点で油でぬるぬるしている。 軍手とぞうきんを用意しておいて、よく拭いた。 刃の部分には茶色い油?が付着しているので、試しにいらないを裁断してみて油の拭き残しが無いか確かめる必要がある。 油がついた。(古ぐらしは新しいのを持っているので、2003年版を試し切りに使った) ■裁断する まずスキャンできるようにをバラバラにする。 表紙を外す しっかり押さえる 切る 切る。裁断機の刃が超鋭いので、あんまり力はいらない。 バラバラにしたをscansnapに入れる iPhon

    橋本商会 » scansnapと裁断機を買って本を電子化しまくる
    xiaodong
    xiaodong 2010/01/04
    OCR機能については日英自動選択,縦書き認識ができるのでAcrobat Proがよいと思う。
  • MSN Japan - ニュース, 天気, メール (Outlook, Hotmail), Bing検索, Skype

    MSN はニュース、天気、エンタメ、マネー、スポーツ、ライフスタイル、自動車などの最新情報と、動画、Bing検索、メールの Outlook.com (旧 Hotmail)、Skypeなどを提供する Microsoft が運営するポータルサイトです。

    MSN Japan - ニュース, 天気, メール (Outlook, Hotmail), Bing検索, Skype
    xiaodong
    xiaodong 2009/11/16
    「蛍光ペンでマークした単語や文章を PDF のキーワード情報に自動追加できる「インテリジェント・インデックス機能」を備え、OS の検索機能で簡単に書類の検索が可能。」キーワード自動登録機能か,便利そう。
  • ペパレス - 本のスキャン、裁断しない本のスキャンやOCRテキスト化、エクセル名簿作成もできる総合スキャニングサービスです。

    事業概要 トップページ サービス更新履歴 スタッフご挨拶 お客様の声 お取引の流れ 書籍の発送と返送 電子化支援グッズ 電子化コラム 書籍電子化 高品質スキャン一覧 スキャンの用途 スキャン品質と見 解像度について 裁断スキャン 裁断しないスキャン 古書スキャン 書類スキャン 大型スキャン スキャン 料金表 自動見積フォーム テキスト化 入力業務一覧 OCR・テキスト化 名簿のエクセル化 テキスト化のご依頼 名刺電子化 名刺の電子化TOP 失敗にご注意! 名刺電子化タイプ 電子化名刺の使い方 名刺料金表 名刺電子化見積り 【夏季休暇のお知らせ】(2024/07/25) いつもご利用いただき、誠にありがとうございます。 8月9日(金)-8月19日(月)までの間は、夏季休暇となります。 業務はわずかに行っておりますが、問い合わせの回答など、若干遅れが発生します。 期間中は納期計算外となります

    xiaodong
    xiaodong 2009/10/19
    「テキスト化ではOCRという画像の文字化処理後に目視での処理ミス修正が必要」「業界では半値程度の価格ではありますが、それでも100円/頁からの処理費用が必要で、小説1冊程度で20000円程度がかかります。」
  • 1