[4ページ] ocrの人気記事 294件 - はてなブックマーク

121 - 160 件 / 294件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

ocrの検索結果121 - 160 件 / 294件

キャプチャー画像をOCRで素早くテキスト化　いざというとき便利なSnipping Toolの活用法【Windows 11】
- 35 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2024/06/14
Snipping Toolの便利な機能を紹介 Windows 11の標準スクリーンキャプチャーツール「Snipping Tool」には、スクリーンキャプチャーや画面の録画をするだけでなく、ちょっとした編集も可能になっている。本Tech TIPSでは、いつの間にか追加された「OCR機能」と「墨消し機能」の2つの使い方を紹介しよう。 Windows 11でスクリーンキャプチャーを撮る場合、［Windows］＋［Shift］＋［S］キーを使っている人も多いのではないだろうか。［Windows］＋［Shift］＋［S］キーを押すと、Windows 11の標準スクリーンキャプチャーツール「Snipping Tool」が呼び出される。このツールは、着々と進化しており、単純にスクリーンキャプチャーや画面の録画をするだけでなく、ちょっとした編集も可能になっている。本Tech TIPSでは、「Snippi
- Windows
- あとで読む
LLM時代におけるAI-OCR機能の開発戦略 / layerx-bakuraku-ocr-llm-lt-2024
- 34 users
- speakerdeck.com/yuya4
- テクノロジー
- 2024/01/24
2024年1月24日【オフライン限定開催】注目AIテックカンパニー4社が集うLT新年会〜LLM活用のリアルを語る〜(https://lapras.connpass.com/event/305577/) における発表資料です。
- OCR
- あとで読む
- AI
- 開発
Google Colabを用いたNDLOCRアプリの実行（Google Driveを用いた画像の入力と結果の保存） - デジタルアーカイブシステムの技術ブログ
- 34 users
- nakamura196.hatenablog.com
- テクノロジー
- 2022/04/29
概要ノートブック実行方法入力フォルダの準備ノートブックの実行：1.初期セットアップノートブックの実行：2.設定ノートブックの実行：3.実行まとめ追記 2022.05.02 2022.04.30 概要前回、Google Cloud PlatformのCompute Engineを用いたNDLOCRアプリの実行方法を共有しました。 nakamura196.hatenablog.com ただし、上記の方法は手続きが一部面倒で、かつ費用がかかる方法です。本番環境で使用するには適した方法ですが、小規模に、または試験的に使用するにはハードルが高い方法でした。この課題に対して、 @blue0620 さんがGoogle Colabを用いたNDLOCRアプリの実行方法を作成されました。 https://twitter.com/blue0620/status/151929433215901
- OCR
- google
- jupyter
- 画像
- あとで読む
- 技術
- ブログ
「OneNote」に統合された新しい「付箋」アプリ、すべてのユーザーが利用可能に／スクリーンショット、OCR（画像のテキスト認識）、ソースURLの自動追加などに対応
- 34 users
- forest.watch.impress.co.jp
- テクノロジー
- 2024/05/28

スーパーのチラシをOCRで読み取らせてAIに献立を提案してもらう | IIJ Engineers Blog
- 34 users
- eng-blog.iij.ad.jp
- テクノロジー
- 2024/09/26
クラウド本部クラウドソリューション部に所属(2024年入社) 主に社内向けのクラウド記事を書いてます。でかい鯉を見るのが好き。はじめにどうもこんにちは、好きな料理漫画は「ミスター味っ子」、クラウドソリューション部の立木です。ここ2か月間、おいしいので毎晩カレーを食べていましたが、流石に嫌気が刺してきたのでAIに献立を考えてもらうことにしました。ただ、それだけだと面白味がないので、近所のスーパーのチラシを用いてOCRを行い、読み取った情報を元に献立を考えてもらいます。それでは実際にやっていきましょう。 ※今回、たまたまいなげや様のチラシを使用していますが、本件はいなげや様とは無関係なのでお問い合わせされないようにお願いします。あくまで私個人が本ツールの検証として使用しただけです。構成今回の構成です。まず、チラシをWebサイトから入手し、そのときの形式がPDFなのでjpegに
- AI
- 技術
- あとで読む
- ネットワーク
- グルメ
- 料理
[スタパ齋藤の「スタパトロニクスMobile」] 最新macOS「Ventura」にアップグレードし痛い目に遭うも神アプリ使用開始でハッピーになった話
- 34 users
- k-tai.watch.impress.co.jp
- テクノロジー
- 2022/10/31
- mac
- PDF
- camera
- photo
- iphone
- あとで読む
バクラクのAI-OCRが扱う問題の複雑さ - LayerX エンジニアブログ
- 34 users
- tech.layerx.co.jp
- テクノロジー
- 2024/07/01
こんにちは。 LayerXのバクラク事業部機械学習チームのテックリードを務めております機械学習エンジニアの島越（@nt_4o54）です。最近、カジュアル面談や学会などで「AI-OCRってもうほぼ完成で、運用フェーズですよね」「やることあるんですか？」など頻繁に聞かれることがあります。「いやいや課題が山のようにあるんです」という話をいつもしているので、今回は我々が作っているAI-OCRがどれだけ複雑で難しい問題を扱っているか、という部分についてお話しさせていただければなと思います。少し、経理ドメインの話が多く恐縮ですが、お付き合いいただけると嬉しいです。 AI-OCRについて AI-OCRが扱う問題の複雑さドメインへの深い理解が必要同じ書類であってもコンテキストによって抽出したい値が異なるまとめ最後に AI-OCRについてまず、そもそも弊社のバクラクで提供しているAI-OC
What is Image-to-Text? - Hugging Face
- 33 users
- huggingface.co
- テクノロジー
- 2023/05/06
Image to text models output a text from a given image. Image captioning or optical character recognition can be considered as the most common applications of image to text. Use Cases Image Captioning Image Captioning is the process of generating textual description of an image. This can help the visually impaired people to understand what's happening in their surroundings. Optical Character Recogn
アノテーションにおけるUIの工夫 - CADDi Tech Blog
- 33 users
- caddi.tech
- テクノロジー
- 2024/04/22
こんにちは、MLOpsチームです。先日OCRモデルを学習するためのアノテーションにおいて、作業効率を検証するためのPoCとしてアノテーションUIを開発しました。本記事ではこのアノテーションUIにおける工夫について、試用によって得られた知見をまじえつつ紹介します。はじめにアノテーションUIを開発することとなった背景について説明します。アノテーションUIとはアノテーションUIは機械学習の学習データを作成するためのUIです。アノテーションUIはアノテーション作業の効率に強く影響し、アノテーション作業によって得られる学習データの量は機械学習の精度に大きく寄与します。したがって、アノテーションUIは機械学習において最も重要なコンポーネントのひとつといえます。 UIを開発した背景キャディではOSSツールなどのUIを用いてアノテーションが行われていましたが、ここに独自の工夫を導入すれば入力効率
- UI
- あとで読む
Claude 3.5 Sonnet、PDFの画像や表も理解する「Visual PDFs」
- 32 users
- www.watch.impress.co.jp
- テクノロジー
- 2024/11/05
- PDF
- あとで読む
- 人工知能
- AI
OCRは「マリオプラザーズ」の夢を見る | Colorful Pieces of Game
- 32 users
- www.highriskrevolution.com
- おもしろ
- 2023/06/10
『ちょっとは正しいゲームの歴史』…というか、ともかく「ゲームの歴史」を批判するシリーズで困らされたのがOCRだった。 Kindle本からテキストで全部コピー出来ればいいのだけど、Kindleは出版社それぞれがコピーできる量を規制していて（当たり前だ）、それを超える量はコピーのしようがない。そしていうまでもなく、ゲームの歴史批判シリーズは、死ぬほど引用するので、当然のことながら出版社の制限を超えることになる。なお、この膨大な引用を「これはいいのか？」と言っていた人がいたらしいが、全く問題ない。引用は認められた権利で、引用した内容ではなく、それを引用する意味があった本文があれば、なんの問題もない。そうじゃないと「引用して批判する」ことが出来ないことになってしまうでしょ？といって、画像引用にすると縦書きになってしまい、ウェブでは読みづらい事、この上ないので以下の方法でテキスト化した。
- OCR
- あとで読む
- game
- web
- ネタ
LINE、国⽴国会図書館のデジタル化資料247万点をテキストデータ化
- 32 users
- k-tai.watch.impress.co.jp
- テクノロジー
- 2022/09/07
- LINE
- net
- technology
- book
「Firefox 106」正式版リリース、画像内のテキスト抽出機能が追加
- 32 users
- gigazine.net
- テクノロジー
- 2022/10/19
ウェブブラウザ「Firefox 106」の正式版が公開されました。記事作成時点ではmacOS限定ながら画像内のテキストを抽出する機能が追加されるなど、ユーザーが直接触れる機会が多くなりそうな数々の機能が導入されています。 Firefox 106.0, See All New Features, Updates and Fixes https://www.mozilla.org/en-US/firefox/106.0/releasenotes/ ◆画像内のテキスト抽出 macOS 10.15(Catalina)以降で、選択した画像からテキストを抽出できるようになります。テキストの抽出を行うには、テキストを含む画像を右クリックし、表示されるポップアップメニューから「Copy Text from Image」を選択します。抽出されたテキストは共有・保存・検索するためにクリップボードにコピーされ
【マンガ】仕事が速い人と遅い人「超ムダなエクセル入力作業」への対応の差
- 30 users
- diamond.jp
- 政治と経済
- 2022/12/23
エクセルがめんどくさいのでラクするコツをまとめてみた「エクセルを使えば、仕事はこんなにラクになる」。今までめんどくさいけど我慢してやっていた事務作業、ミスしがちなポイントを解決するちょっとしたコツを、マンガとイラストでわかりやすく紹介します。バックナンバー一覧「自分は仕事が遅い……」「よくミスをする……」そんな悩みを抱える人ほど、実は“自己流”の仕事のやり方で損をしていることがあります。なかでも、知識がシェアされづらくブラックボックス化しがちなのが「エクセル」の使い方。この連載では、事務の仕事をよりラクに、よりミスなく進めるためのエクセルのちょっとしたコツを、事務職一筋の著者が、マンガでわかりやすくお伝えします。今回は、事務職あるあるの「アナログ作業」についての解決策。アプリを知っているか知らないかで、作業時間が大きく変わります。（マンガ：あきのあこ）【エクセルでラクするコツ：明
- Excel
- あとで読む
- 仕事
- ネタ
「ScanSnap Home」がライセンスフリー化、利用デバイスやユーザー数の上限を廃止
- 30 users
- internet.watch.impress.co.jp
- テクノロジー
- 2023/03/24
ワクチン接種券の読み取りトラブル多発　政府、撮影用スタンドを自治体に配布へ
- 30 users
- www.itmedia.co.jp
- 世の中
- 2021/05/12
「接種券のバーコードが読み取れない」「（カメラの）ピントが合わない」――新型コロナワクチンの接種を担う自治体からこうした声が出ている。タブレット端末を使った接種券の読み取り作業でトラブルが多発しているためだ。読み取り方法に問題があるとして、内閣官房IT総合戦略室（IT室）は5月11日、タブレット端末を固定し、スムーズに接種券を読み取るための専用スタンドを全国の自治体に配布すると発表した。各自治体では現在、高齢者や医療従事者を対象に接種券を配布し、接種を順次始めている。接種会場では接種券に記載された18桁の数字「OCRライン」をタブレット端末のカメラと専用アプリで読み取り、接種した回数や場所を識別するスキームだが、正しく読み取れないケースが相次いでいた。
- funny
- itmedia
- japan
- technology
- IT
- これはひどい
- 政治
- あとで読む
バクラクのドキュメント解析技術と実データにおける課題 / layerx-ccc-winter-2024
- 29 users
- speakerdeck.com/shimacos
- テクノロジー
- 2024/12/14
cvpaper.challenge Conference winter 2024の技術紹介セッションで「バクラクのドキュメント解析技術と実データにおける課題」と題して発表させていただきました。 https://research-p.com/event/1972 概要： LayerXは、…
- あとで読む
機械学習チーム立ち上げ前夜とその後の話 #バクラク #LayerX｜Shun Takagiwa
- 29 users
- note.com/shuntak
- テクノロジー
- 2022/09/13
こんにちは！バクラクエンジニアの高際です！ LayerXでは現在AI-OCRチームのマネージャーを担当しています。このnoteでは、機械学習チーム立ち上げ前夜の意思決定プロセスと、その後の進捗について報告したいと思います。いきなり昔話をしますが、LayerXは実は去年(2021年)までは機械学習に積極的に取り組んでいませんでした。クラウドコンピューティングと同様当然に利用する技術ではあるものの、自社のコア技術として積極投資するというよりは、あくまでツールのひとつとして利用するというスタンスでした。それが一転して2022年にはCEO福島から「機械学習を本気でやります。チームを10倍に拡大させる」という宣言を出しました。 ML本気でやります。MLチームを10倍に拡大させることを決めました。MLエンジニアの皆様ぜひLayerXをよろしくおねがいします。(私も5年のブランクを超え勉強し始め
「机の上にたまった書類をスマホアプリでPDF化したい」――急遽テレワークを導入した中小企業の顛末記（94）【急遽テレワーク導入！の顛末記】
- 28 users
- internet.watch.impress.co.jp
- テクノロジー
- 2022/04/11
GitHub - ndl-lab/ndlocr_cli: NDLOCRアプリケーションのリポジトリ（ソースコードを含む）
- 28 users
- github.com/ndl-lab
- テクノロジー
- 2022/04/26
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- OCR
- docker
- github
- tool
- book
iOSアプリで初めてテキスト画像認識で機密情報を読み取るマルウェアが発見される
- 28 users
- gigazine.net
- テクノロジー
- 2025/02/06
セキュリティ企業のKasperskyが、AndroidアプリとiOSアプリでテキスト画像認識機能を持つマルウェアを発見したと報告しています。「SparkCat」と呼ばれるこのマルウェアはユーザーが撮影したスクリーンショットの内容を読み取る機能を持っており、特に仮想通貨ウォレットのリカバリーフレーズを狙っていたとのことです。 SparkCat crypto stealer in Google Play and App Store | Securelist https://securelist.com/sparkcat-stealer-in-app-store-and-google-play/115385/ Malware With Screen Reading Code Found in iOS Apps for the First Time - MacRumors https://www.
spaCy(+GiNZA)でPDFテキスト抽出の改行位置をいい感じにする - OPTiM TECH BLOG
- 27 users
- tech-blog.optim.co.jp
- テクノロジー
- 2021/04/09
R&D チームの徳田（@dakuton）です。過去何回か、Tech Blog記事にてPDFやOCR、自然言語処理に関する手法を紹介してきましたが、今回もそちらに関連する内容です。過去記事 tech-blog.optim.co.jp tech-blog.optim.co.jp tech-blog.optim.co.jp やりたいこと PDFからテキストを抽出する際に含まれる、中途半端な位置にある改行を除去することが目的です。シンプルな方法としては、句点(。)の位置をもとに改行する方法ですが、今回はspaCy(とGiNZA)を併用した場合にどうなるかを試してみることにします。テストデータ今回は、下記記事のPDFを使用しました。財務省「ファイナンス」令和３年2月号の「ポストコロナ時代を形作る、コロナ禍で生まれるDX（デジタルトランスフォーメーション)」 1 メディア掲載情報: 財務
- pdf
- spacy
- nlp
- GINZA
- OCR
- Python
- 機械学習
より便利になったWindows 10・11用「PowerToys」- 阿久津良和のWindows Weekly Report
- 27 users
- news.mynavi.jp
- テクノロジー
- 2022/09/12
レポートより便利になったWindows 10・11用「PowerToys」- 阿久津良和のWindows Weekly Report 常に、WindowsとPowerToysは共に歩んできた。PowerToysはWindows単体では足りない機能を補うため、Microsoft自身が開発・利用していたツール群。その歴史はWindows 95の時代までさかのぼる。「PowerToys for Windows 95」は15種のツールを備えていたが、中でも人気だったのがTweakUIだ。本来はレジストリエントリーの編集を必要とするカスタマイズをGUIから操作できるため、TweakUIは個人でWindows 95 PCを使用するユーザーに欠かせないものだった。当時のユーザーにとっては、キーボードの再割り当てなどを行う「Windows 95 Kernel Toys」も懐かしいだろう。なお、Wind
- Windows
- PDF
- あとで読む
- article
Microsoft Azure、「Computer Vision API」のOCR機能が日本語に対応、パブリックプレビューとして
- 27 users
- www.publickey1.jp
- テクノロジー
- 2021/02/12
マイクロソフトは、Microsoft Azureの機械学習を用いた画像処理「Computer Vision API」の光学式文字認識（OCR）機能が日本語に対応したことを発表しました。 Computer VisionのOCR機能は、JPEG、PNG、BMP、TIFFなどの画像フォーマットもしくはPDFによるドキュメントファイルを入力することで、その内容からテキスト、手書きのテキスト（英語のみ）、数字、通貨記号などを読み取り、抽出することができます。ファイルサイズは50MB未満（Freeレベルの場合は4MB）、寸法は50x50ピクセル以上 1万x1万ピクセル以下である必要があり、 PDFファイルとTIFFファイルの場合は最大2000ページ（Freeレベルの場合は最初の2ページのみ）が処理されます。日本語への対応は最新の「Read 3.2」バージョンでパブリックプレビューとなりました。これ
Windowsでもついに画像内のテキストコピーが可能に！ | ライフハッカー・ジャパン
- 26 users
- www.lifehacker.jp
- テクノロジー
- 2022/09/20
MicrosoftのPowerToysに、画像からテキストをコピーできる新しいユーティリティが登場しました。誰かが名刺の写真や銀行口座のスクショを送ってきたら、PowerToysを使ってWindows上で素早くコピーすることができます。この新しいユーティリティは「Text Extractor」と呼ばれ、PowerToysのバージョン0.62で利用可能になりました。最新版のPowerToysはGitHubからダウンロードできます。インストールしたら、PowerToysを開き、左ペインの「Text Extractor」をクリックしましょう。 Windowsで「Text Extractor」を使用する方法PowerToysの右ペインに「Text Extractor」のキーボードショートカットが表示されるようになりました。デフォルトでは、このショートカットは「Windowsキー＋Shift
OCR PDFs and images directly in your browser
- 25 users
- tools.simonwillison.net
- テクノロジー
- 2024/04/04
This tool runs entirely in your browser. No files are uploaded to a server. It uses Tesseract.js for OCR and PDF.js to convert PDFs into images. Language: Drag and drop a PDF, JPG, PNG, or GIF file here or click to select a file
- ocr
- pdf
- あとで読む
- webservice
- tool
- webサービス
- デザイン
Windows版「OneNote」アプリに文字起こし機能～複数話者を識別、ペン入力と同期再生も／まずは「Office Insider」で。段階的に提供範囲を拡大
- 25 users
- forest.watch.impress.co.jp
- テクノロジー
- 2022/11/15
請求書から漫画まで！OCR+LLMで進化する文書データ構造化技術
- 25 users
- zenn.dev/mkj
- テクノロジー
- 2024/12/16
はじめにこんにちは、株式会社松尾研究所シニアデータサイエンティストの大西です。本記事は、松尾研究所 Advent Calendar 2024の記事です。松尾研究所では、多くの企業と協力し、AIの社会実装に向けた研究開発を行っています。本稿では、OCRとLLM技術を活用した文書データの構造化手法についてご紹介します。企業が保有するデータの多くは紙や非構造データとして保管されており、これを構造化するのは困難です。また、LLMを用いたRAG（Retrieval-Augmented Generation）システムを構築する際、元データが適切に構造化されていないと、正確な検索や参照が難しくなります。今回、最適な文章データ構造化を実現する方法を調査するため、複数のOCR, LLM手法を実験して性能を比較してみました。従来技術の課題と提案手法 OCRは、文字を認識しテキスト情報を抽出する技術で
- OCR
- llm
- データ
画面上の文字列をOCRで読み取り翻訳できる翻訳支援ツール「PCOT」
- 25 users
- gigazine.net
- アニメとゲーム
- 2021/07/11
日本語表示に非対応のゲームをプレイするとき、簡単なコマンド名や英単語であればなんとなくニュアンスをつかんだり、辞書を使って調べたりすることができますが、長いフレーズや文章単位になってくるとなかなか大変です。「PCOT」は、ゲーム画面をOCR(光学文字認識)で読み取ってくれるので、コピペできない文章でも翻訳してくれます。ヌルポインターストライク http://www.gc-net.jp/s_54/ 「PCOT」は「ProcessConnectOcrTranslator」の略だとのこと。公式サイトの「『PCOT』のダウンロードはこちら　→」の右にある「DL」をクリック。 OneDriveのページが開き、「PCOT.ZIP」が選択された状態になっていて、ちょっと待つとファイル保存ダイアログが開くので、「ファイルを保存する」にチェックを入れて「OK」をクリック。自動でダウンロードされない場合はP
- OCR
- 翻訳
- ツール
- language
- GIGAZINE
- あとで読む
- game
Mistral、PDF文書をマルチモーダルでAI対応ファイルに変換するOCRのAPI提供開始
- 25 users
- www.itmedia.co.jp
- テクノロジー
- 2025/03/07
仏AI企業のMistral AIは3月6日（現地時間）、PDFや画像から、マルチモーダルな要素を高精度で抽出し、構造化された形式で出力する新API「Mistral OCR」を発表した。有償で提供する他、AIチャットbot「Le Chat」で無料で試すこともできる。生成AIの基盤となるLLMは、プレーンなテキストデータに特化しており、PDFに含まれる画像や複雑なレイアウトを十分に理解することができない。Mistral OCRがPDFのようなマルチモーダルドキュメントを抽出、出力することで、PDFを直接理解するのが困難なLLMでも、PDFに含まれる情報を効果的に活用できるようになる。 Mistral OCRは、PDFの内容を単にテキスト化するのではなく、Markdown（リンクやヘッダなどの書式設定要素を追加するための書式設定構文）でフォーマットする。 PDFからデータを抽出するサービスは既
- 人工知能
- AI
- pdf
- techfeed
- api
- 企業
- 画像
ラズパイとAI-OCRで生産日報を電子化する（後編）
- 24 users
- monoist.itmedia.co.jp
- テクノロジー
- 2020/10/13
今回は、前回に引き続き、小型ボードコンピュータの「Raspberry Pi（ラズベリーパイ、略してラズパイ）」と、機械学習などのAI（人工知能）技術を活用したOCR（光学的文字認識）である「AI-OCR」を組み合わせた事例として「生産日報の電子化」をどのように実現するかについて具体的に解説します。 ⇒連載「ラズパイで製造業のお手軽IoT活用」バックナンバー生産日報の電子化は、以下の手順で進めます。手書きで日報を記入する手書き日報をラズパイで読み取り、テキストデータに変換するテキストデータに変換した日報データを現場画面に表示して内容の確認をする。誤認識している部分は手で修正する修正した箇所を機械学習して認識率を向上させる前回は1．と2．について説明しました。今回は3．と4．について解説します。 3．テキストデータに変換した日報データを現場画面に表示して内容の確認をする OCRは1
- OCR
- 機械学習
- 人工知能
- HotEntry
- データ
- あとで読む
- AI
- *あとで読む
PowerToys、画像から文字を抽出できる機能を開発中
- 24 users
- pc.watch.impress.co.jp
- テクノロジー
- 2022/08/18
- Windows
- Microsoft
- Software
- development
- 開発
- 画像
- あとで読む
Googleドキュメントを使って、2ステップで画像から文字起こしする方法【今日のワークハック】 | ライフハッカー・ジャパン
- 24 users
- www.lifehacker.jp
- テクノロジー
- 2023/10/18
仕事をしていると、いろいろな場面に出くわすものですが、“文書データ送りますね” と言われて届いたデータがPDFや画像だった、というようなことありますよね？もちろん目を通すだけでOKというものなら別に問題ないのですが、文書編集のベースに使う必要があったりすると、とりあえず “元データありませんか？” と聞きたくなるわけです。今日のワークハック：Googleドキュメントで画像から必要な情報を文字起こしするScreenshot: 田中宏和 via Google Docsこんなときに便利なのがOCR（光学的文字認識）ソフト。でも実は、Googleアカウントを持っている人なら、特にパッケージソフトやWebアプリを導入する必要はないのです。 Googleドキュメントには、画像内に含まれている文字をテキストデータ化してくれる機能が搭載されています。
- lifehack
- google
- データ
- 画像
- あとで読む
【Excel】PDF上の表は手入力しなくても簡単に取り込める！紙のスキャンデータでも大丈夫【いまさら聞けないExcelの使い方講座】
- 23 users
- forest.watch.impress.co.jp
- テクノロジー
- 2023/10/18
- excel
- PDF
- microsoft
- tips
- あとで読む
戦争史料、ＡＩでテキストデータ化へ…判読が難しい「くずし字」も学習・キーワード検索容易に
- 22 users
- www.yomiuri.co.jp
- テクノロジー
- 2025/04/25
【読売新聞】　日本軍の膨大な史料を収蔵する防衛省防衛研究所が、人工知能（ＡＩ）を用いて史料をテキストデータ化し、ネットで公開する事業に着手する。戦前・戦中の史料には、手書きの「くずし字」が含まれ、熟練者でなければ判読困難なものが多い
- AI
- あとで読む
- 軍事
- 技術
- 歴史
iOSで文字認識（Text Recognition）
- 22 users
- zenn.dev/shu223
- テクノロジー
- 2023/11/12
iOS 13以降で、待望だった「文字認識」機能が使えるようになりました。カメラなどで撮影した画像内にある文字を読み取る [1] ことができます。「文字検出」との違い文字認識は、Visionフレームワークの一機能として追加されました。一方、Core ImageのCIDetectorというクラスでは、CIDetectorTypeTextというタイプを指定でき、テキストを検出することができます。このCIDetectorTypeTextやCIFeatureTypeTextはiOS 9からあるものです。しかしこちらは文字の「領域」を検出する機能です。何が書いてあるか、までは認識できませんでした。またiOS 11で登場したVisionフレームワークでは VNDetectTextRectanglesRequest という文字領域を検出するクラスを当初から利用できましたが、これも文字の「領域」
【Excel】PDFや画像を見ながら表を手入力する時代は終わった！画像認識を活用しよう【再掲】【今すぐ読みたい！人気記事】
- 21 users
- forest.watch.impress.co.jp
- テクノロジー
- 2024/08/14
- Excel
- あとで読む
読み取り精度100%が不可能と認め、失敗に備えユーザー体験を磨き込む話 - LayerX エンジニアブログ
- 21 users
- tech.layerx.co.jp
- テクノロジー
- 2022/07/13
どうも！バクラクでOCRの開発を担当する高際 @shun_tak です！バクラクでは「圧倒的に使いやすいプロダクトを届け、ワクワクする働き方を。」というプロダクトビジョンを掲げて開発しています。バクラクビジョン note.com そんなバクラクでは文書のデータ化を支援するため、文書の読み取り機能＝OCR機能を提供しています。これにより、多様なレイアウト・大量の文書も瞬時にデータ化することができます。以下、瞬時に読み取られる様子 youtu.be OCRで読み取ってデータ入力されるだけでも使いやすいプロダクトになっているかなと思いますが、この記事ではさらに一歩踏み込んで、「圧倒的に」使いやすくするための工夫の一端をお見せしたいと思います。前提：請求書OCRで解きたい問題請求書OCRは、経理に届く支払請求書を読み取ってデータ化します。データ化したい項目は、「いつまでに、だれに、いくら
- OCR
- あとで読む
機械学習でハタラクをバクラクにするために LayerX に入社しました #LayerX｜yu-ya4
- 21 users
- note.com/yuya4
- テクノロジー
- 2022/09/14
こんにちは、2022年9月1日に LayerX にフルタイムの機械学習エンジニアとして入社した松村優也(@yu__ya4)と申します。バクラク事業部の AI-OCRチームに所属しています。チーム名の通り、請求書や領収書といった帳票の画像データを読み取り、人間が手入力せずとも必要な項目を自動で抽出してデータ化する OCR 機能の開発をメインのミッションに持つチームです。この note では、私がなぜ LayerX に機械学習エンジニアとして入社したのかを、転職のご報告に代えてお伝えします。めちゃくちゃ仲間を探していますので、少しでも気になった方は Meety や Twitter のDM からご連絡ください！略歴 - LayerXに入社するまでまず簡単に、LayerX に入社するまでの私について紹介します。より詳しい経歴やこれまでのアウトプットは以下の Wantedly のプロフィールを
OmniAI
- 21 users
- getomni.ai
- テクノロジー
- 2024/08/29
Backed by Combinator Automate complex document workflows.Omni turns documents, slide decks, websites and more into the data you need. You'll never need to copy + paste data into spreadsheets again.
- ocr
- web-service
- document
- slide
- data
- tool
- あとで読む