OCRの人気記事 11件 - はてなブックマーク

1 - 11 件 / 11件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

OCRの検索結果1 - 11 件 / 11件

さようなら、全てのエヴァーノート - 本しゃぶり
- 1786 users
- honeshabri.hatenablog.com
- テクノロジー
- 2024/04/14
2011年6月10日、Evernoteを使用開始。 2014年9月19日、有料プランに加入。 2024年3月23日、クソみたいなメールが届く。プラン、廃止いつも Evernote をご利用いただき、ありがとうございます。このたびは今後の Evernote 登録プランに関する変更についてご案内させていただきます。お使いの Evernote アカウントは Plus から Personal に移行されました。Evernote Plus など、一般のお客様に数年間ご利用いただけなかった従来の登録プランが廃止となったためです。この変更により、Personal プランで利用可能な機能すべてをご利用いただけます。今後はAnnualの登録プランが現在の Evernote Personal プランの料金 129.99 USD/Yearに合うように更新されます。この料金は次の更新日である2024/4/
- evernote
- obsidian
- webサービス
- あとで読む
- Notion
- ツール
- サービス
- AI
- メモ
- 生活
GPTが人知れず既存の名刺管理アプリを抹殺していた話 - Qiita
- 506 users
- qiita.com/watanabe-tsubasa
- テクノロジー
- 2024/02/27
抹殺は言い過ぎかもしれませんが簡易な名刺管理アプリであれば自作で十分という時代がきていたようですこれで紙の名刺からはきっとバイバイできるでしょう！この記事執筆以降claude3 opus, GPT-4oの発表があり、ますます途中でOCRを入れる意味が薄くなったものと思われます私もGPT-4oを早速試してみたいと思います！名刺管理アプリ作ってほしいといわれたそれは2/22のお話。ことの発端は別の部署からかかってきた一本の電話でした。新規事業の部署でいろいろな取引先様と付き合いがあるものの、紙の名刺が非常に多く管理に困っているとのことのことです。私は小売業に勤務しているしがない一社員で、現在Eコマースの戦略立案に関する部署に所属しています。電話先の方は、以前一緒の部署で勤務したことがある方です。現在新規事業のプロジェクト推進をしており、冒頭のような課題感を持っているため既存の
- ChatGPT
- あとで読む
- AI
- OCR
- python
- api
- アプリ
- GPT
- LINE
- プログラミング
pdfからtextを抜き出す試行錯誤のメモ｜Kan Hatakeyama
- 464 users
- note.com/kan_hatakeyama
- テクノロジー
- 2024/02/23
これは二段構えの構成を持っています。この二段構えを正確に検出し、テキストを理解することが望ましいです。 Unstructuredを使うPythonのライブラリであるUnstructuredを試してみましょう。参考記事導入は非常に簡単です。 pip install 'unstructured[pdf]' 実装も簡単です。解析コード： from unstructured.partition.pdf import partition_pdf pdf_elements = partition_pdf("pdf/7_71_5.pdf") 表示コード： for structure in pdf_elements: print(structure) 結果：残念ながら、2段組のカラムを正確に検出することはできませんでした。 Grobidを使うGrobidは、peS2oというオープンアクセス論文のコ
- PDF
- あとで読む
- python
- LLM
- AI
- テキスト
- ツール
- ドキュメント
- 自然言語処理
- メモ
PCの操作をすべて録画＆文字起こしして過去の操作を丸ごと検索可能にするアプリ「Windrecorder」
- 336 users
- gigazine.net
- テクノロジー
- 2024/05/06
PCを使っていると、過去の操作内容やブラウザで閲覧していた情報を思い出したくなるタイミングが頻繁に発生します。そんな時に役立ちそうなPC操作記録アプリ「Windrecorder」がオープンソースで開発されています。 GitHub - yuka-friends/Windrecorder: Windrecorder is a memory search app by records everything on your screen in small size, to let you rewind what you have seen, query through OCR text or image description, and get activity statistics. https://github.com/yuka-friends/Windrecorder I made an o
- PC
- あとで読む
- アプリ
- windows
- データベース
- セキュリティ
- tool
- 検索
- GitHub
- データ
熊本大学とTOPPAN、くずし字AI-OCRで未解読だった「細川家文書」約5万枚の解読に成功。検索システムも構築
- 309 users
- internet.watch.impress.co.jp
- テクノロジー
- 2024/07/29
- AI
- あとで読む
- 歴史
- 技術
- history
- 文化
- technology
- ocr
- 人工知能
- 学問／研究
GPT-4oをOCRとして使う - Re:ゼロから始めるML生活
- 297 users
- www.nogawanogawa.com
- テクノロジー
- 2024/06/09
OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか？さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね？」って思っちゃったわけです。ということで、今回はChatGPT-4oを使ってOCRを使うとどんなもんなのかやってみたいと思います。やりたいことやってみるとりあえずやってみる請求書名刺参考文献感想やりたいこと今回やりたいことはOCRです。早い話が画像ファイルを突っ込んでテキストを読み取りたいって感じです。ただ、当たり前のようにOCRって言葉を使用していますがOCRって結構奥が深いです。 mediadrive.jp 単純に画像から文字を見つけて対応するテ
- ChatGPT
- あとで読む
- AI
- OCR
- 人工知能
- 文章生成AI
- GPT
- 画像
- レイアウト
RAGの性能を改善するための8つの戦略 | Fintan
- 275 users
- fintan.jp
- テクノロジー
- 2024/02/09
近年、OpenAIのGPT-4やGoogleのGemini、MetaのLLaMAをはじめとする大規模言語モデル（Large Language Model：LLM）の能力が大幅に向上し、自然言語処理において優れた結果を収めています[1][2][3]。これらのLLMは、膨大な量のテキストデータで学習されており、さまざまな自然言語処理タスクにおいて、タスクに固有なデータを用いてモデルをファインチューニングすることなく、より正確で自然なテキスト生成や、複雑な質問への回答が可能となっています。 LLM-jp-eval[4]およびMT-bench-jp[5]を用いた日本語LLMの評価結果。Nejumi LLMリーダーボード Neoより取得。大規模言語モデルは近年急速な進歩を遂げていますが、これらの進歩にもかかわらず、裏付けのない情報や矛盾した内容を生成する点においては依然として課題があります。たとえ
- RAG
- LLM
- AI
- あとで読む
- ChatGPT
- 検索
- チューニング
- OCR
- 自然言語処理
- 人工知能
GPT-4oを使って2Dの図面から3DのCADモデルを作る
- 183 users
- zenn.dev/firstautomation
- テクノロジー
- 2024/05/19
はじめに株式会社ファースト・オートメーションCTOの田中(しろくま)です！先日、 OpenAIからGPT-4oがリリースされました。いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上しているようです。製造業という観点からすると、これは設計図面などに活かせるようになるのでは？と思いました。機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品本体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。このような図と文字の複合データにおいて、GPT-4oの進化は有効なのではないかと考えました。 ※画像元URL: http://cad.wp.xdoma
- ChatGPT
- あとで読む
- CAD
- 3d
- AI
- GPT
- 機械学習
- 設計
- 画像
OpenAIのGPT-4oを日本語OCRとして使ってみる
- 143 users
- zenn.dev/tomioka
- テクノロジー
- 2024/05/14
昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成（Text To Speech）の表現力について非常に興味を持っています。私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ
- AI
- あとで読む
- ChatGPT
- 日本語
- GPT
- OCR
- 人工知能
- api
Macで毎分スクリーンショットを撮って手元に貯めておくスクリプト - hitode909の日記
- 124 users
- blog.sushi.money
- テクノロジー
- 2023/12/03
書いてたテキストエリアがどっかいく、みたいなことがたびたびあって、スクショを定期的に取っていればこんなことにならないのに…と思っていた。先日、Redash用に、がんばって書いたSQLがどっかいってしまい、ものすごく悲しい、という出来事があったのであ、あまりに悲しさに、重い腰を上げてスクリプトを書いた。きのうがんばって書いたRedashクエリを保存せずに消してしまった悲しみから、Macの画面のスクリーンショットを撮り続けるスクリプトを書いて、xbar経由で毎分実行してキャプチャし続けている。Macに入ってるOCR機能も呼び出して検索できるようにしたい https://t.co/ibVVCLZszg— 趣味はマリンスポーツです (@hitode909) 2023年11月30日やっていること画面全体のスクショを撮って、デスクトップ内のフォルダに置いていく複数ディスプレイを使ってる場合も
- mac
- あとで読む
- ocr
- !!
- github
- article
- Ruby
- 画像
帝国議会会議録検索システムで全期間の本文テキストデータが利用できるようになりました（付・プレスリリース）｜国立国会図書館―National Diet Library
- 102 users
- www.ndl.go.jp
- 学び
- 2024/08/25
2024年8月23日帝国議会会議録検索システムで全期間の本文テキストデータが利用できるようになりました（付・プレスリリース）国立国会図書館は、帝国議会会議録検索システムにおいて、戦前・戦中期分（明治23（1890）年11月～昭和20（1945）年8月）の速記録の画像データ（合計約27万ページ）からOCR（光学的文字認識）処理により作成した本文テキストデータを、新たに公開しました。これにより、既に本文テキストデータを提供している戦後期分（昭和20（1945）年9月～昭和22（1947）年3月）と合わせて、帝国議会の全期間にわたり、速記録に掲載された質疑や議案本文などの全文検索とテキスト表示ができるようになりました。ぜひご利用ください。なお、今回公開した戦前・戦中期分の本文テキストデータは、人手による校正を行った戦後期分と異なり、OCR処理による文字の認識間違い（誤字・脱字）や認識不
- 検索
- あとで読む
- 歴史
- 図書館
- 日本