「LINEヤフーDesign 公式note」 LINEヤフー株式会社のデザインに関連するさまざまな情報を発信するLINEヤフーDesign 公式noteです。
2019年11月20、21日の2日間、LINE株式会社が主催するエンジニア向け技術カンファレンス「LINE DEVELOPER DAY 2019」が開催されました。1日目は「Engineering」をテーマに、LINEの技術の深堀りを、2日目は「Production」をテーマに、Web開発技術やUI/UX、プロジェクトマネジメントなど、より実践的な内容についてたくさんのプレゼンテーションが行われました。「NAVER ClovaのOCR(光学的文字認識) 」に登壇したのはNAVER OCR Team AI ResearcherのHwalsuk Lee氏。深層学習を用いたOCR技術の仕組みについて語りました。講演資料はこちら LINEのOCR技術の仕組み Hwalsuk Lee氏:みなさま、こんにちは。Hwalsuk Leeと申します。NAVER Clova OCR Teamから参りました。今
Google Cloud Vison APIで 光学式文字認識(OCR)をかけたり、画像に含まれているものの解析ができるようになっていますので、以下で公開されている方法とスクリプトで国立国会図書館デジタルコレクションで公開されている画像データをOCRにかけてみました、のその1(気が向けば、いろいろと試してみたいので、引き続きやってみるつもり)。 ※2017/8/19 追記 このエントリでは、レイアウトの認識に難ありという話になってしまいましたが、レイアントを認識できる方法で改めて同じ画像をGoogleのOCRにかけたものを以下に紹介しています。 Google Cloud Vison APIでNDLのデジコレ画像をひたすらOCRをかけてみる(その1 再戦) 正確すぎる!Googleの画像認識APIで超ラクラクOCR(macOS・ていねい解説) : GOROLIB DESIGN – はやさはち
ちょっとした紙媒体の資料をテキスト化したいときってありませんか? 「ここテストに出ますよ~」と言われた時のように、「この部分だけ覚えておきたい(記録しておきたい)」場合、スマホがあれば、まず本の該当部分を写真に撮るのが簡単でしょう。しかし、このままでは画像としてしか扱えません。できればさらにテキスト化までしてしまったほうが便利ですよね。 そんなかゆいところに手が届くようなアプリをAndroidアプリのレビューサイト「TABROID」でご紹介しています。『ImageReader(イメージリーダー)』は写真内の活字を抽出し、テキスト化するOCRアプリです。この種のアプリでは珍しく日本語にも対応しています。 その実力はというと... 小文字が大文字に、よく判らない記号が入っていたりしましたが、意味や内容は汲み取れる程度にテキスト化されました。一度読んだことがあれば、大体の内容は思い起こすことがで
Evernoteには、画像ファイルにある文字を文字コードで認識するOCRの機能があります。英語のみならず、日本語にも対応しています。 OCR処理は自動で行われ、画像をアップロードしてしばらくしてから同期を実行すると、画像中の文字を検索できるようになります。 これをテキストファイルに変換する方法が公式には存在していないようなので、手動で行う方法を探しました。 1)ノートをパソコンに保存 対象ノートを右クリック→「ノートのエクスポート」 enex形式で保存します。「ノートタグのエクスポート」にチェックを入れておきます。 2)テキストエディタで開く 正規表現で置換ができるテキストエディタ(例えばEmEditor Free)で開きます。 enexファイルの実体はxmlで、前半に画像ファイルのバイナリが入っています。この部分はいらないのでカットします。 画像データの後に、「<item h="25"
顔のニキビを一刻も早く治す効果的な方法 大事な日が控えている時に限ってできてしまうこと、ありませんか? ニキビができてしまうと、それだけで気分も落ち込み、印象も大分変わってしまいますよね? 私も最近まではチョコチョコニキビができてしまうことがありました。 最近は以下の対策をすることで、劇的にニキビに悩むことが少なくなりました。 よかったら参考にしてみてください。 【YouTube】赤ら顔を治す方法こちら 顔のニキビの原因 まずはニキビができてしまった原因を特定しましょう。 ニキビの原因は様々です。 食生活の乱れ、角質の汚れ、メイクがきちんと落とせていない。 乾燥によるニキビ、または疲れが溜まっていたり、ストレスが溜まっている場合、ホルモンのバランスが崩れている場合などが挙げられます。 自分のニキビの原因が何なのかを知ることもとても大切です。 対処法その1 原因が分かったら、その原因を排除し
PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日本語に対応した。 米Googleは2月28日(現地時間)、昨年6月にGoogle Docsに追加したOCR(光学式文字認識)機能を、新たに日本語を含む29カ国語に対応させたと発表した。日本語のPDFやスキャナやデジカメで取り込んだ文字を含む画像をGoogle Docsにアップロードすると、ファイルがテキストデータに変換される。 使い方は、Google Docsの「アップロード」の画面で変換オプションを以下のように設定し、「アップロードを開始」をクリックする。変換が可能なファイル容量の上限は2Mバイトだ。 実際にやってみたところ、PDFではほぼ問題なくテキストに変換されたが、デジカメで撮影した画像からの変換の精度はまだ高いとはいえないようだ
Genius Scanが登場した時に叫んだ「スキャンアプリの価格破壊や!」という言葉をもう一度使いたいアプリ、CamScanner Freeをご紹介します。 基本機能は以下の通り。 名刺やホワイトボードを撮影した写真の加工機能 スキャンデータの整理機能 撮影した写真について、必要部分を切り取って拡大し、さらに2種類のフィルタで写真上の文字などを見えやすくする加工を行えます。 その上、スキャンアプリが苦手としている「ファイリング」機能も充実しています。パソコンや友人、さらにはGoogle Docs、BOX.net、Evernote、iDisk、Dropboxへのスキャンデータ転送もお手の物。 いやぁ、充実のアプリですよ。早速ご紹介していきます。
本日のお題: wordFromDictionary="false" さて、新年なので話題を変えて、OCRについて進めていきましょう。 OCRというのは、本名、Optical Character Recognitionですので、その名前が示すとおり、文字(Character)単位の認識(Recognition)をしていきます。ところが、こんなことを額面どおりに行っているソフトは、おもちゃOCRだけです。 ちゃんとしたOCRは、OCRという名前がついていても、実は、OWRとなっていて、Optical Word Recognitionという感じで、単語(Word)単位の認識(Recognition)をしていきます。 分かりやすくするために、例で見て行きましょう。 前(http://d.hatena.ne.jp/denshikA/20091010)にも書きましたが、OCRというのは、EとB、CとO
Googleドキュメントに新しい機能が追加されましたのでご紹介いたします。 新機能はPDF・画像内の文字を抽出できるというもの。Google ブックスで利用されているOCR技術を利用しています。なかなか精度もいいですよ。 以下に使ってみた様子を載せておきます。 まずGoogleドキュメントにアクセスします。 ファイルのアップロードを選択しますと、オプションで「PDF や画像ファイルからテキストを Google ドキュメントのドキュメントに変換する。」という項目があるので、チェックをいれます。 以下の画像を読み取ってみました。 Google Chrome Updates, Adds Integrated Flash Player アップロード後、しばらくすると変換が終了します。 変換後のドキュメントは以下のとおり。 一部文字が抜けたりしているところがありますが、おおよそ読み取ることができてい
出版社のネット戦略を中心に取材を進めてきた。取材を通して見えてきたのは、各社の考え方により相当な温度差があることだ。これまでを振り返りながら総括を試みる。 まずネット事業を真剣に画策する出版社は年々増えている。これは断言できることだ。ただ業界全体を見れば、各社の考え方により相当な温度差があることも事実だ。今回、紙面に登場していただいた出版社は8社。業界動向など周辺取材でお世話になった出版社は4社。合計12社の協力を得ることができた。これは大きな収穫だったが、いきなり楽屋話をすると、実は今回の件で30社以上に取材依頼を提出している。つまり20社以上に固辞されたわけだ。 プロ野球の世界でも打率3割なら御の字なのだし、まぁ善戦したほうだと考えてはいるが、いろいろ四苦八苦する場面もあった。「ネットなんてまったく興味ございません」と露骨に拒絶反応を示す編集長もいたし、「それを聞いてどうする」となぜか
Warning: include_once(/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-cache-phase1.php): failed to open stream: Permission denied in /home/users/0/lolipop.jp-dp16105308/web/wp/wp-content/advanced-cache.php on line 8 Warning: include_once(): Failed opening '/home/sites/lolipop.jp/users/lolipop.jp-dp16105308/web/wp/wp-content/plugins/wp-super-cache/wp-c
iPhone情報整理術 の話が続いて恐縮ですが、本が出て以来意外に反響があるのに、一方であまり信じてもらえなかったのが**「本や漫画を裁断して iPhone にいれてゆく」**というテクニックです。 「本大事にしろよ!」という意見もいくつかいただいたのですが、こうした極端な方法はなにもすべての本に対して行うのではなくて、「場所がないから捨てなくてはいけない、でも捨てるには惜しい」という一部の本に対して行うことを想定しています。特に私にとってはそれが漫画です。 私はちょうど4月に引っ越したばかりなのですが、引っ越しで書斎の面積が少し狭くなり、その分だけいくらか本を手放さなくては本棚が機能しないところまできていました。そこで、とても好きで惜しくはあるのですが一年に一度程度しか読まない漫画「三国志」の PDF 化に着手しました。 その一連の流れを以下に写真付きでまとめてみましたので、同様の「書籍
Correction Appended In several dozen nondescript office buildings around the world, thousands of hourly workers bend over table-top scanners and haul dusty books into high-tech scanning booths. They are assembling the universal library page by page. The dream is an old one: to have in one place all knowledge, past and present. All books, all documents, all conceptual works, in all languages. It is
ここで、次の話題(OCR)へ移る前に、ちょっとだけ、新聞電子化の工程について見てみましょう。 本日のお題 1日あたり10万画像 1月あたり300万画像 1年あたり3600万画像 現在の日本において、 平均的な電子化機器(スキャナなど)の性能・価格 平均的な人件費 平均的な家賃 平均的なスキャン価格相場 年間を通じた仕事量 などを考慮すると、普通のスキャン業者が1社で電子化できる最大量は、「10万画像/日」となるでしょう*1。 この「10万画像/日」というのは、マイクロフィルムからの電子化の場合であって、もし、紙ベースの資料からの電子化の場合、効率が1/8〜1/6くらいに落ちますので、「1.2万画像/日〜1.5万画像/日」となります。 さらに、さらに、上記の「10万画像/日」ないし「1.2万画像/日〜1.5万画像/日」というのは、OCR変換作業*2を含んでいません。もし、OCRまでを含めると
id:yaneurao:20091001でFUJITSU ScanSnap S1500 FI-S1500を買って書籍を裁断してスキャンした話を書いた。 「もうどうせ残りの本は売ってもたいしたお金にもならないし」と書いたが、取り込んだ書籍の数は3,000冊強。総スキャンページ数、262,845枚。消耗品のパッド交換4回。ローラー交換2回。1冊の平均価格は3,000円程度。全体でおおよそ1,000万円。今回は、気がついたらこれだけの本を切り刻んでいた。id:yaneurao:20060131の本棚に換算すると14個分である。 たぶんアマゾンで売れば、その1/3ぐらいのお金にはなっていただろうから、ちょっともったいない気もする。私も当初はそこまで本を徹底的に切り刻む気はなかったのであまり気にもかけてなかった。 そこで、どうしてこんなことになったのか、つらつら考えてみた。 ■ 切り刻まずに取り込ん
Googleが、PNGファイル、JPGファイルデータから文字を認識する「OCR API」と、認識された文字情報を元に翻訳する「Document Translation API」を公開したと発表しています。 どういったことが出来るのかについてはDocList API OCR Demoを試してみて下さい。 TagGoogle iPhone App Store (5139) アクセサリ (4274) 特価 (3345) レポート (2704) NEWS (2475) Rumor (1920) iPad App Store (1810) iTunes (1242) iPhone (1220) Apple Apps (1025) iOS (769) プロモーション (748) Apple (708) ソフトウェア (688) Apple Store (681) Mac App Store (671)
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く