並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 140件

新着順 人気順

OCRの検索結果1 - 40 件 / 140件

  • 国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita

    はじめに 日本語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は意外に限られてます。最近ではGeminiなどにOCRさせることも試みてますが、縦書きに弱いのが欠点。加えて、私がやっているような著作権が切れた戦前の本のデジタル化の場合、認識率の低い旧字体が多いのが悩みの種。 そこで最近知ったのが、国立国会図書館が公開しているOCRライブラリ、NDLOCRです。国会図書館のデジタル資料(国立国会図書館デジタルコレクション)から全文テキストデータを作成するために開発されたとのこと。 NDLOCRは、現在ver2.1がGithubに公開されています。古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識してくれます。今回は、このライブラリを試してみました。基本、Githubサイトに書いてある通りなんですが、いくつか注意すべき点をメモ

      国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita
    • 国立国会図書館よ、永遠なれ

      この記事の3つのポイント 国立国会図書館のオンラインサービスの充実がすごい 新自由主義に侵された図書館のダメっぷりもすさまじい 「知りたいことが調べられる」が図書館の機能かつ使命 国会図書館という名称から、「国会議員向けの図書館で、自分には無関係」と思っている人はいないだろうか。“国会”図書館という名称は、そのルーツの一つが、1890年に開設された帝国議会の図書館があることに由来する。もう一つのルーツは大日本帝国時代の文部省・帝国図書館だ。 この2つが敗戦後、1948年の国立国会図書館法制定と共に統合されて、設立されたのが、現在の国立国会図書館である。その役割は、国立国会図書館法第2条に「国立国会図書館は、図書及びその他の図書館資料を蒐集し、国会議員の職務の遂行に資するとともに、行政及び司法の各部門に対し、更に日本国民に対し、この法律に規定する図書館奉仕を提供することを目的とする。」とある

        国立国会図書館よ、永遠なれ
      • なぜ、Difyなのか - Algomatic Tech Blog

        はじめに こんにちは!Algomatic ネオセールスカンパニーでエンジニアをしている末國と申します。 私たちが1月にリリースした営業AIエージェント「アポドリ」では、一部機能にDifyを組み込んでいます。 一部といっても、すでに100個近いワークフローが作られていたり、1日1万回呼び出したりするくらいには利用しています。 Difyはいわゆるローコードツールであり、「コードが書けない人が使うもの」「DifyはPoCで使って、本番はプログラムを書く」という印象もあるかもしれません。 しかし、私たちはむしろ積極的に「コードからDifyへの移行」を行ってきました。 この記事では私たちが「なぜDifyを利用しているのか」「何がそんなにいいのか」について書いていきます。 そもそもDifyとは何か 理由の話をする前に、そもそもDifyとは何か、特にワークフロー機能についておさらいしておきます。 すでに

          なぜ、Difyなのか - Algomatic Tech Blog
        • 江戸時代の言葉を話すAIチャット「からまる」 Sakana AIが公開 古文書の2500万文字を学習

          AIベンチャーのSakana AI(東京都港区)は4月1日、江戸時代の古文風テキストで会話できるAIチャットbot「からまる」を公開した。約2500万文字に及ぶ、江戸時代の文章で構成したデータセットを学習している。研究と教育を目的に、HuggingFaceで公開している。 例えば、からまるに「あなたの名前はなんですか」と聞くと「某が名はからまるにて候」と返答。「AIにとって大事なものはなんですか」と尋ねると「AIにとりて大切なるものはデータなりこれによりて己か身を成長せしむる所以也」と返し、「スマホはなんですか」という問いには「携帯する小箱にて候則ち其中に文字や画図をもつて遠所に在る人々へ伝達する道具也」と回答する。 からまるのベースモデルには、AIベンチャー・ELYZAのオープンモデル「Llama-3-ELYZA-JP-8B」を利用。江戸時代の書物などをAIくずし字OCRで楷書体に直した

            江戸時代の言葉を話すAIチャット「からまる」 Sakana AIが公開 古文書の2500万文字を学習
          • AIで経費精算業務60%削減!製品戦略と開発ロードマップを公開! - RAKUS Developers Blog | ラクス エンジニアブログ

            はじめに:経費精算業務の現状と課題 当社は、経費精算業務を効率化するプロダクト「楽楽精算」を提供しています。 現在、多くの企業が紙やExcelで経費精算業務を行っており、申請から承認までに膨大な時間を要しています。 特に手作業による申請チェックや書類不備の差し戻しが、経理担当者の業務負担を増大させる要因となっています。 このような状況では、経理担当者が業績管理や予算策定といったコア業務に集中することが難しくなります。 こうした問題を解決するため、「楽楽精算」ではプロダクトでのAI活用を一層推進することとしました。 プロダクト開発に関わるエンジニアの皆さんにとっても、AIを活用したプロダクトの提供価値向上は大きな関心事ではないでしょうか。 一方で、AI導入の際にはインパクトの見積もりや、不確実性の扱い方について悩む場面もあると思います。 そこで本記事では経費精算業務の効率化に向けた、AIを活

              AIで経費精算業務60%削減!製品戦略と開発ロードマップを公開! - RAKUS Developers Blog | ラクス エンジニアブログ
            • LayerXのバクラクAIエージェント事業についての解説|福島良典 | LayerX

              どうも、すべての経済活動を、デジタル化したい福島です。 LayerXのバクラク事業ですが今年の4月よりAIエージェント事業に参入します。 を書いていたので予想していた方も多いかもしれませんが、満を持してはじめます。 ただし、多くの会社がやるようなAIエージェントをエンドユーザーに提供するという形態ではなく、AI BPOという形で提供します。AI BPOとは「当社がBPO業者としてAIエージェントを活用し、エンドユーザーは今まで通りアウトプットだけ受け取る」というサービスの提供形態です。バクラクのAIエージェント事業はAI BPOという形で参入します。 もちろんAIエージェント自体をプロダクトに組み込んでいくこともやっていきます。そのプロダクトも絶賛開発中です。 この記事では、上記の記事やプレスリリースで伝えられなかった、狙いみたいな部分を解説していきます。 具体的に何やるの?バクラク関連事

                LayerXのバクラクAIエージェント事業についての解説|福島良典 | LayerX
              • Bet TechnologyからBet AIへ|Matsumoto Yuki

                こんにちは。LayerX CTOの松本です。 この2年と4ヶ月、LayerXとしてひたすらLLMに取り組んできました。2022年末にChatGPTが世界中を驚かせてから、私たちのビジネスや社会の在り方は急速に変化しています。私達が向き合うデジタル化も激しい変化の時が来ています。 そして今回、LayerXは創業以来初めての行動指針の根本的な変更を行うことになりました。これまでの6年間、私たちは「Bet Technology」という指針のもとで歩んできました。この6年の間にも行動指針の順序の入れ替えや副文の変更は何度か行われてきましたが、行動指針自体を変えるのは創業以来初めてのことです。これは単なる言葉の言い換えではなく、私たちの会社としての方向性と決意を明確に示す重要な転換点です。 新しくなった行動指針なぜ今このタイミングで変更するのか。それは、今まさに社会全体が生成AI・LLMによって変革

                  Bet TechnologyからBet AIへ|Matsumoto Yuki
                • 今週のはてなブックマーク数ランキング(2025年3月第5週) - はてなブックマーク開発ブログ

                  はてなブックマークのブックマーク数が多い順に記事を紹介する「はてなブックマーク数ランキング」。3月24日(月)~3月30日(日)〔2025年3月第5週〕のトップ30です*1。 順位 タイトル 1位 【保存版】親が亡くなったらやること全52項目を解説!一覧チェックシート付き - リハコ 2位 昨年入社した新人さんが、あまりにも助けを求めるのがうまくて、「こいつ人生二度目か?」と思った話。 | Books&Apps 3位 転職したら話し相手がいなかったんだけど 4位 なんか私のChatGPTだけ生成下手じゃない? なんでみんなそんなに上手にコントロールできるの? - posfie 5位 労働基準監督官だった頃の思い出 6位 ChatGPT『GPT-4o』の画像生成が大幅アップデート!新機能を徹底解説|ChatGPT研究所 7位 「ふつう」ではない人間が、なぜ金を貯められないのかを説明しよう |

                    今週のはてなブックマーク数ランキング(2025年3月第5週) - はてなブックマーク開発ブログ
                  • プログラミング入門書は、なぜ初心者に役立たないのか?|Ami Otsuka「生成AIに育てられた第1世代 | 研究者x SE」

                    ※カテゴリ。本全体では81位 文法学習がつまらないプログラミング入門書は、ほぼ例外なく最初に言語の文法やルールを説明する。変数、条件分岐、ループ、関数などの基本的な仕組みを覚えることからスタートする。 しかし、これが驚くほど退屈なのだ。英語学習にたとえてみるとよくわかる。文法のルールだけを暗記しても、実際に話したり聞いたりできるようになるわけではない。 プログラミングも同じで、文法知識だけでは実際に「自分の思ったもの」を作れるようになるはずがない。結局、頭に入れるだけ入れるものの役に立たず、挫折感だけが積もっていく。 さらに、文法パートが延々と続くことで、「プログラミング=面倒なルールの塊」という印象が刷り込まれてしまう。初心者が本当に必要なことは、簡単なプログラムでもいいから自分で動かしてみる楽しさだ。それなのに、プログラミングをやろうとしてすぐに文法の説明だけが続く本を読み進めるのは苦

                      プログラミング入門書は、なぜ初心者に役立たないのか?|Ami Otsuka「生成AIに育てられた第1世代 | 研究者x SE」
                    • Sakana AI

                      April 01, 2025 「からまる」はSakana AIが開発した江戸古文風チャットボットです。現代日本語で質問すると、江戸時代の世界観と当時の古文風テキストで回答してくれます。学術プロジェクトと協力して、江戸時代の書物から約2500万文字のデータセットを構築し、大規模言語モデルを継続学習しました。からまるのデモはこちらでお試しいただけます。 概要 Sakana AIは、江戸時代の古文風テキストで会話できるチャットボット「からまる」を公開します。現代のテキストを学習した大規模言語モデル(LLM)に対して、江戸時代の書物など数千点以上から構築した江戸テキストデータセットを継続学習させることにより、現代日本語で質問すると江戸時代の古文風テキストで回答できるチャットボットを開発しました。回答の内容には江戸時代の世界観が反映されているため、過去の文化への没入感がより高い会話を楽しめるようにな

                        Sakana AI
                      • Sarashina2-Vision: 日本語特化の大規模視覚言語モデルの公開 - SB Intuitions TECH BLOG

                        概要 SB Intuitionsでは、日本語や日本の文化・慣習に強い大規模視覚言語モデル(Vision-Language Model; VLM)の開発を進めており、2025年3月に弊社の日本語大規模言語モデル(Large Language Model; LLM)のSarashina2をベースに開発したVLMであるSarashina2-Vision (8B・14B)を公開しました。 Sarashina2-Visionは、日本に関連する画像に基づいた専門的タスクの処理能力を測るベンチマークや日本語の複雑図表の理解能力を測る内製ベンチマークなど、複数の日本語ベンチマークにおいて国内最高の性能を実現しています。 この記事ではVLM学習チームがSarashina2-Visionのモデル構成と学習の詳細について紹介します。評価については別記事をご参照ください。 使い方 Sarashina2-Visio

                          Sarashina2-Vision: 日本語特化の大規模視覚言語モデルの公開 - SB Intuitions TECH BLOG
                        • Here’s how I use LLMs to help me write code

                          11th March 2025 Online discussions about using Large Language Models to help write code inevitably produce comments from developers who’s experiences have been disappointing. They often ask what they’re doing wrong—how come some people are reporting such great results when their own experiments have proved lacking? Using LLMs to write code is difficult and unintuitive. It takes significant effort

                            Here’s how I use LLMs to help me write code
                          • 士業の方々へ。AI-OCRの勧め。|行政書士 辻󠄀 太輔

                            はい、こんにちは。 猫背とストレートネックのダブルパンチで、最近は逆腹筋にハマり中、目指せウエスト-6cm!(…って、いつ達成できるのやら…)な行政書士の辻です。 さてさて、しょうもない冗談は置いといて、本題に入りましょうか。 「ちょ、先生!まさか、その書類の山、全部手打ちするつもりじゃないですよね…?」 時は令和ですよ、令和。 士業の先生方、いまだに紙の書類とガチンコ勝負、本当にお疲れ様です…! お客さんから渡された手書きの申請書、役所の年季の入った資料…。 「デジタル化?なにそれ美味しいの?」状態になってませんか? もし、あなたが「OCR?…ああ、目の検査のやつね」とか思っちゃったなら、この記事は絶対に見逃しちゃダメです。 え?「OCRは知ってるけど、なんか難しそう…」って? だったら、なおさら必読ですよ。 実は、あのGoogle様が開発した天才AI「Gemini」を使えば、ビックリす

                              士業の方々へ。AI-OCRの勧め。|行政書士 辻󠄀 太輔
                            • 31日の日曜日|mri

                              LayerX バクラク事業部でプロダクトのデザインを担当しています森です。 突然ですが、どんな日付選択のUI(所謂Date Picker)を使っていますか? バクラクには内製したライブラリがあります。 内製した理由はいくつかあるのですが、その内の一つはカレンダーの第一週目の表示にあります。 カレンダーの第一週目どういうことかと言うと、第一週目の空いている部分に、前月の日付を表示させ、カレンダーを遷移させることなく、前月の月末を選択したいという要望からです。 空き部分に前月を表示シンの月末それっぽいことができるライブラリはあるのですが、第一週の空白を埋めているにすぎないので、1日が日曜であった場合、前月が表示されません。 第一週目に空きがないと前月は表示されないそしてもう一つ、この場合。 前月の31日は表示されているが…バクラクではこう表示しています。 前月をもう一週分表示する31日は確かに

                                31日の日曜日|mri
                              • Expert used ChatGPT-4o to create a replica of his passport in just 5 minutes bypassing KYC

                                The US Treasury’s OCC disclosed an undetected major email breach for over a year | U.S. CISA adds Gladinet CentreStack and ZTA Microsoft Windows Common Log File System (CLFS) Driver flaws to its Known Exploited Vulnerabilities catalog | WhatsApp fixed a spoofing flaw that could enable Remote Code Execution | Everest ransomware group’s Tor leak site offline after a defacement | Google fixed two act

                                  Expert used ChatGPT-4o to create a replica of his passport in just 5 minutes bypassing KYC
                                • 「あなた2号」は意識をもつのか?→「AI研究の世界的権威」の答えが正論過ぎて、ぐうの音も出ない

                                  1948年ニューヨーク生まれ。Google社で機械学習と自然言語処理の研究を率い、現在は同社の主任研究員兼AIビジョナリー。MIT在学中に20歳で起業。以来、数々の発明品を世に送りだしてきた。おもなものに、CCDフラットベッドスキャナー、オムニフォント式OCRソフト、視覚障碍者用の文章読みあげ機、オーケストラ楽器を再現できるシンセサイザー「Kurzweil K250」などがある。「MITレメルソン賞」やアメリカの技術分野で最高の栄誉とされる「国家技術賞」を受賞し、全米発明家殿堂入りした。音楽技術における優れた業績によりグラミー賞も受賞。21の名誉博士号をもつ。PBS(公共放送サービス)「アメリカをつくった16人の革命家」のひとりにも選ばれている。 ニュースな本 ビジネス・経済から、エンタメに教育、政治まで……。世の中には山のように書籍が存在する。その中から「読んでためになる」「成長できる」

                                    「あなた2号」は意識をもつのか?→「AI研究の世界的権威」の答えが正論過ぎて、ぐうの音も出ない
                                  • 一太郎Pad - スマホが万能の入力機器に変身!とりあえず入れておくべきAndroidアプリ - ウインタブ

                                    こんにちは、吟遊詩人です。これから何回かに分けておすすめアプリシリーズをお届けします。第一弾は「Android端末を買ったらとりあえずインストールしておくと幸せになる」一太郎Padです。ちなみにこのアプリは「一太郎」を名乗っていますが、いうほど一太郎ではないですw。往年の一太郎を期待してインストールしてはいけません。吟遊詩人がAndroid端末を買ったらひとまずこのアプリを入れるのは「OCRが使いやすいから」です。 つまり、印刷物とかの入力に使いまくれるんです。例えば、イオンモールで買い物して、もらった応募券の番号を応募サイトに手で入力するのめんどくさいですよね? そんな時には一太郎Padです!! 応募券を並べておいて、スマホで一太郎Padを起動し、カメラを選びます。

                                      一太郎Pad - スマホが万能の入力機器に変身!とりあえず入れておくべきAndroidアプリ - ウインタブ
                                    • 複雑なレイアウトや方程式、多言語も読み取れる「Mistral OCR」の実力とは

                                      Mistral AIは2025年3月6日(仏国時間)、OCR(Optical Character Recognition:光学的文字認識)API「Mistral OCR」を発表した。同社は以下のように紹介している。 Mistral OCRは、ドキュメント理解の新たな標準となる光学式文字認識APIだ。他のモデルとは異なり、Mistral OCRはドキュメントの各要素(メディア、テキスト、表、数式)をかつてない精度と認識力で理解する。Mistral OCRは画像やPDFを入力とし、テキストと画像を順序よくインターリーブしてコンテンツを抽出する。 Mistral OCRは、マルチモーダル文書(スライドや複雑なPDFなど)を入力とするRAG(検索拡張生成)システムと組み合わせて使用するのに理想的なモデルといえる。 当社では、対話型AIアシスタント「Le Chat」の数百万人のユーザーが文書を理解で

                                        複雑なレイアウトや方程式、多言語も読み取れる「Mistral OCR」の実力とは
                                      • AI博覧会カンファレンスに集まった「本気の企業」──参加者分析で見えた業種・関心分野とは?|AIを使う全ての人へ|WEEL

                                        生成AIを“使ってみる”段階から、“どう事業化するか”へ。 3月末に開催された「AI博覧会 Spring 2025」のカンファレンスには、500名以上の参加者が集まりました。 テーマは、「生成AIを軸とした新規事業開発」。 実際の事例を通じて、開発のリアルが語られました。 本記事では、参加者の属性データやセッションの様子をもとに、 今どんな企業が、どんな温度感で動き始めているのか?を整理しています。 「生成AIを活かした事業をしたいが、何から始めるべきか悩んでいる」 「他社はどんな領域に注目していて、どう形にしているのか知りたい」 そんな方にとって、ヒントになるはずです。 Noteをご覧になっている方、カンファレンスに参加できなかった方に向けて新規事業×生成AIに関するセミナーを開催します!この機会にぜひご参加ください! ✅ セミナーに参加する 1. 500名以上が参加。どんな人たちが来て

                                          AI博覧会カンファレンスに集まった「本気の企業」──参加者分析で見えた業種・関心分野とは?|AIを使う全ての人へ|WEEL
                                        • DifyでMistral OCRを利用する方法を解説! |kazu@生成AI×教育 | AI Academy

                                          Mistral OCRとはMistral OCR は、光学式文字認識(OCR)API です。PDFファイルや画像ファイルを受け取り、文字などを認識し抽出が可能です。Mistral OCRの特徴は、高精度かつ高速にOCRが可能です。 詳細:https://mistral.ai/news/mistral-ocr 今回は、Dify専用のMistral OCRプラグインが公開されたため、そちらを使っていきます。 機能としては以下のとおりです。 構造と書式(ヘッダー、段落、リスト、表)を保持したままテキストを抽出 結果をマークダウン形式で返す 複雑なレイアウトを処理(複数カラムのテキスト、混合コンテンツ) 様々なフォーマット(PDF、画像)を高い精度で処理 https://marketplace.dify.ai/plugins/inlei/mistral_ocr今回作成するワークフロー Difyの基

                                            DifyでMistral OCRを利用する方法を解説! |kazu@生成AI×教育 | AI Academy
                                          • ケネディ大統領暗殺事件の陰謀論を公開文書から探る|七誌

                                            ケネディ大統領暗殺に関する陰謀論を決定的に証明するような証拠が公開文書に含まれるのかを探ります。 出典データの出典は以下の記事を参照してください。 AI による分析を翻訳して引用します。 ソビエトJFK暗殺事件の文脈では、ソ連が特にKGBを通じて関与または影響力を持つ可能性が懸念されるため、ソ連は重要な位置を占めている。文書は、CIAがソ連の活動を積極的に監視し、暗殺事件に関連する人物や事件との潜在的なつながりを調査していたことを示唆している。ソ連からの亡命者とKGBによる潜在的な個人の採用に焦点を当てていることは、この時期に継続されていた防諜活動の取り組みを浮き彫りにしている。 重要性この文書は、ヘルシンキにおけるオズワルドの活動の時系列と、ソビエト領事館との接触について明らかにしており、これは、彼の旅行中の潜在的なつながりや影響力を理解する上で関連している。 104-10004-101

                                              ケネディ大統領暗殺事件の陰謀論を公開文書から探る|七誌
                                            • 日本語特化OCR&文章画像解析エンジン「YomiToku」解説!日本語ポスターや漫画を解析してみた | WEEL

                                              YomiToku以外にもOCRでテキストを読み取るものはありますが、日本語特化のOCRは初めてなのではないでしょうか。本記事ではYomiTokuがどういったものなのか、google colaboratoryでどのように実装するのかをお伝えします。 また、OCRの精度も検討してみたいと思いますので、ぜひ最後までお読みください! 日本語の文書画像解析、OCRに対応したPythonパッケージ「YomiToku」を公開しました。 独自に学習したAIが搭載されており、ローカルサーバーでPDFや文書画像の解析、OCRや表の構造解析、レイアウト解析が可能です。結果はHTMLやCSV, JSON, Markdownといった形式でエクスポート可能です。… pic.twitter.com/d7cYXWjAUo — Kotaro Kinoshita (@KINOCOAI) November 26, 2024 Y

                                              • 「AI履歴書読み取り機能」開発の舞台裏 ── ぜんぶ見せます! - SmartHR Tech Blog

                                                こんにちは、AIインテグレーションユニットの木村です。 この記事では、AIインテグレーションユニットで行ってきた「AI履歴書読み取り機能」開発の舞台裏を、検証プロセスや得られた知見を中心に紹介します。 目次 目次 「AI履歴書読み取り機能」の開発理由 「AI履歴書読み取り機能」のコンセプト 「AI履歴書読み取り機能」の技術検証 技術検証のやり方 各LLMモデルへの期待値と検証後の評価 GPT-4o ── 高い期待値で始めたものの、思ったほどの精度が出ず GPT-4o mini ── 画像を添付した際にトークン数が跳ね上がり、そこまで安くならなかった Gemini 1.5 Pro ── PDFをそのまま添付できるのが便利。サーバー高負荷エラーがしばしば Gemini 1.5 Flash ── 十分な精度と速度と使い勝手、圧倒的なコストパフォーマンス Claude 3.5 Sonnet ──

                                                  「AI履歴書読み取り機能」開発の舞台裏 ── ぜんぶ見せます! - SmartHR Tech Blog
                                                • AIエージェント開発のバカな失敗、技術と体験からAIをデザインする|en.

                                                  こんにちは!Nulogic という会社で AIプロダクトのデザインやプロトタイプ開発をしている en. (@ysk_en)です。 以前にも増して、生成AIやAIエージェントのニュースが滝のように流れてきます。 フルスタックのコード生成ツールが3ヶ月で30億の売上を立てた。とか OpenAIのOperatorがAmazonでは買い物できるのに楽天ではできなかった。とか そんなニュース記事のリンクとともに経営者の方から「ChatGPTだけでなく社内専用のAIエージェントを導入したい」「AIを活用した新サービスで市場を開拓したい」といった相談をいただきます。 「AI による付加価値は本当にあるのか?」「具体的にどんなユースケースがあるのか?」「実装コストや ROI はどう考えるのか?」など、クリアすべき課題が山積みです。 さらに、実際にAIを組み込んだとしても ユーザー体験 (UX) の設計 が

                                                    AIエージェント開発のバカな失敗、技術と体験からAIをデザインする|en.
                                                  • OCR調査(簡易版)

                                                    OCRに関する技術調査(簡易版) 0. はじめに お疲れ様です。STARAI社員の中岸です! 最近仕事柄OCR(光学文字認識(こうがくもじにんしき、英: Optical character recognition):活字、手書きテキストの画像を文字コードの列に変換する技術)に触れることが多かったので、色々と調査してものまとめてみました。 本記事は、今回触ってみた様々なモデルについてまとめていくわけですが、 それぞれの技術単体を深く調査してまとめたようなものではなく、 シンプルにまとめて(1モデル1セクション:概要、サンプルコード(処理対象は日本語、デフォルトでの使い方のみ、オプションや精度向上のための前処理などには踏み込まない)、所感くらいの構成)、カタログみたいな感じで後々使えたらいいなくらいの感じを目指して書いておりますので、その点ご理解ください(また、今回のサンプルであまりうまくいか

                                                      OCR調査(簡易版)
                                                    • 新たな問いを生み出しお客様と共創していくRICOH BIL TOKYOの挑戦 - 日経ビジネス電子版 Special

                                                      リコーの技術を結集し、お客様との共創で社会課題を解決していく場である「RICOH BUSINESS INNOVATION LOUNGE TOKYO(以下RICOH BIL TOKYO)」。RICOH BIL TOKYOを立ち上げた菊地英敏氏にこの場所が生み出す価値創造について話を伺った。 OAメーカーから デジタルサービスの会社へ コロナ禍を機に働き方も大きく変わった。ハイブリットワークが浸透し、デジタルで付加価値を提供することがより求められる世の中において、リコーはオフィスでの複合機などのビジネスを中心としたオフィスオートメーション(OA)の会社から脱皮し、お客様のタスクを減らすだけでなく、創造力の発揮を支えるデジタルサービスを提供する会社への変革の途上にある。その一環で、リコーのデジタルサービスを体感できるお客様とともに新たな価値を創出する場所として開設されたのがRICOH BIL T

                                                        新たな問いを生み出しお客様と共創していくRICOH BIL TOKYOの挑戦 - 日経ビジネス電子版 Special
                                                      • 【文理融合】「AIと歴史学」〜古文書の「くずし字」を高精度で読み、江戸時代の価値観に迫る 稲葉継陽さん(Science Portal) - Yahoo!ニュース

                                                        延べ日数わずか20日間で読みましたから、とんでもない速さですよね。人間が1枚1枚めくりながら読んでいくと、どれだけの年月がかかることか……。ただ、「くずし字AI-OCR」は、人間が史料を写真に撮って画像データにしてあげないと読めませんけれど。そして、文脈で読むのは苦手です。例えば、「跡目」ときたら「息子」と続くだろう、人名で「永」ときたら家臣の「永良」だろうと、私たちは予測して読んでいます。それがAIには難しいので、人間ではありえない読み間違いをすることも。

                                                          【文理融合】「AIと歴史学」〜古文書の「くずし字」を高精度で読み、江戸時代の価値観に迫る 稲葉継陽さん(Science Portal) - Yahoo!ニュース
                                                        • 2025/03/27(木)の出来事 - My Bookmark

                                                          琵琶湖にある有人島・沖島に伊勢大神楽が来る日 【洗濯初心者向け】洗濯機の使い方から干し方までわかりやすく紹介【新生活】 | Lidea(リディア) by LION 『スペースコブラ』のアクションゲームが8月26日に発売決定!ストーリーはアニメ版の12エピソードをなぞる。おなじみのサイコ・ガンや“博物館入りのシロモノ”「パイソン77マグナム」も登場し、2人協力プレイモードも実装。PC(Steam)、PS5、Xbox、Nintendo Switchに向けて GPT-4oとGemini-2.0の画像生成能力はいかにして作られているのか 独身時代はビビットな感覚があったが、出産を機に頭にモヤがかかったような状態になってしまい、アイデンティティが崩れてずっと苦しむ→友人に救われた話 書籍関係者たちが「ヤバい」と声を揃える『大人も知らない みのまわりの謎大全』、300pにおよぶゲーム攻略本みたいな情報

                                                            2025/03/27(木)の出来事 - My Bookmark
                                                          • AI時代のオペレーション再設計 —— 「AI BPR」について|numashi/LayerX バクラクVPoP

                                                            このnoteは、【#日めくりLayerX】と題して発信するブログリレーの2025年4月9日の記事として投稿しています。 前回8日はfurubayashiさんの「最高の一振りを作る刀鍛冶になりたい〜仕事に対するスタンスの話〜」でした。ぜひ合わせてご覧ください! https://note.com/yumafurubayashi/n/ne8e28b1794b7 このnoteについて今取り組んでいる新しいオペレーション設計の考え方、「AI BPR(AI Business Process Re-engineering)」についてご紹介します。 そして、それを実行する上でキーパーソンとなる「AIオペレーションマネージャー」という新しい職種についても、この記事を通じてお伝えできればと思っています。 自己紹介LayerXでVP of Productをしているnumashiといいます。最近は社内向けの営業生

                                                              AI時代のオペレーション再設計 —— 「AI BPR」について|numashi/LayerX バクラクVPoP
                                                            • Anthropic prepares Harmony, AI agent to work with local files

                                                              Anthropic is actively developing Harmony, a new feature designed to let users integrate a local directory of files into Claude’s context. This will enable users to interact with their files seamlessly, allowing the AI to read, index, and analyze content within the directory. BREAKING 🚨: Early preview of the upcoming Harmony feature for Claude. Harmony will allow users to give Claude FULL access t

                                                                Anthropic prepares Harmony, AI agent to work with local files
                                                              • 料金体系の一部改定について(改定日:2025年2月1日および6月1日) | マネーフォワード クラウドの料金・プラン管理サポート

                                                                平素よりマネーフォワード クラウドをご利用いただきまして、誠にありがとうございます。 このたび、2025年2月および2025年6月に、料金体系の一部を改定させていただくことになりましたので、お知らせいたします。 2025年6月1日(日)以降における法人向け有料プランの概要やポイントについては、専用の案内ページを別途ご用意しております。 本お知らせとあわせてご確認ください。 新しい法人向け有料プランのご案内 改定の目的 より多くのお客さまへのサービス提供を安定的に可能とする開発体制の構築と、利用状況や会社規模に応じたプランをご提供するため、料金体系の一部改定を実施いたします。 一部のお客さまにはご負担をおかけすることとなり申し訳ございませんが、何卒ご理解賜りますようお願い申し上げます。 改定スケジュール このたびの料金改定につきましては、以下スケジュールでの実施を予定しています。 改定予定日

                                                                  料金体系の一部改定について(改定日:2025年2月1日および6月1日) | マネーフォワード クラウドの料金・プラン管理サポート
                                                                • Computer useでサブスクの解約をほぼ自動化してみた話

                                                                  はじめに 最近、多くのサービスがサブスクリプション方式になっていますよね。Netflix、Spotify、Amazon Prime、各種SaaSツールなど、私たちの生活や仕事を便利にするサービスが月額や年額で提供されています。これらは確かに便利である一方、気づかないうちに毎月の固定費が増えてしまい、「これ、何の支払いだったっけ?」と明細を見て驚くことも少なくありません。 さらに厄介なのが解約手続きです。サービスごとに解約方法が異なり、以下のような問題が生じています: 「解約ページがどこにあるのか見つからない」 「解約手順が複雑で、途中で諦めてしまう」 「解約しようと思っても後回しにしてしまい、無駄な出費が続いてしまう」 「解約ページに辿り着いても、引き止めの策略に引っかかってしまう」 このような悩みをAIの力と最新の自動化技術を使って完全に解決したいと考え、本プロジェクトを立ち上げました。

                                                                    Computer useでサブスクの解約をほぼ自動化してみた話
                                                                  • えっ、もう働かなくていいの?「AI研究の世界的権威」が予測する「10年後の世界」が想像の斜め上だった

                                                                    1948年ニューヨーク生まれ。Google社で機械学習と自然言語処理の研究を率い、現在は同社の主任研究員兼AIビジョナリー。MIT在学中に20歳で起業。以来、数々の発明品を世に送りだしてきた。おもなものに、CCDフラットベッドスキャナー、オムニフォント式OCRソフト、視覚障碍者用の文章読みあげ機、オーケストラ楽器を再現できるシンセサイザー「Kurzweil K250」などがある。「MITレメルソン賞」やアメリカの技術分野で最高の栄誉とされる「国家技術賞」を受賞し、全米発明家殿堂入りした。音楽技術における優れた業績によりグラミー賞も受賞。21の名誉博士号をもつ。PBS(公共放送サービス)「アメリカをつくった16人の革命家」のひとりにも選ばれている。 ニュースな本 ビジネス・経済から、エンタメに教育、政治まで……。世の中には山のように書籍が存在する。その中から「読んでためになる」「成長できる」

                                                                      えっ、もう働かなくていいの?「AI研究の世界的権威」が予測する「10年後の世界」が想像の斜め上だった
                                                                    • Paperless-ngx

                                                                      Paperless-ngx is a community-supported open-source document management system that transforms your physical documents into a searchable online archive so you can keep, well, less paper. Get started Demo Features Organize and index your scanned documents with tags, correspondents, types, and more. Your data is stored locally on your server and is never transmitted or shared in any way. Performs OCR

                                                                      • キャディ機械学習勉強会: Qwen2-VL - CADDi Tech Blog

                                                                        こんにちは、Data&Analysis部(D&A)です。 D&Aでは週1回、機械学習の勉強会を開催しており、本記事は、勉強会の内容を生成AIを活用して記事にまとめたものものです。 ※勉強会内容公開の経緯はこちら ※過去の勉強会は「社内勉強会」タグからもご覧いただけます。 概要 Qwen2-VL の概要 技術的な特徴 主なベンチマーク結果と性能 関連モデル モデルの利用とライセンス 結論と感想 参考リンク 概要 今回の勉強会ではAlibaba Cloud が開発した Vision-Language Model (VLM) である Qwen シリーズ、特に Qwen2-VL の特徴、性能、関連モデルについて話しました。 調査した動機は、Qwenシリーズは日本語の性能が高いとされており、そのマルチモーダルモデルが画像解析を扱う我々の事業領域にマッチしていることです。またDeepSeek R1の蒸

                                                                          キャディ機械学習勉強会: Qwen2-VL - CADDi Tech Blog
                                                                        • 講義動画における生成 AI を活用した字幕生成 - スタディサプリ Product Team Blog

                                                                          こんにちは、『スタディサプリ』の iOS エンジニアのヴァンサンです。 先日、『スタディサプリ』の一部の講座の動画に日本語字幕が追加されました。音声と同じ言語の字幕は、聴覚に障がいのあるユーザーだけでなく、音声が聞こえづらい環境や、イヤホンが手元になく音を出せない環境でも有用です。さらに、字幕データ自体も検索や内容のまとめなど、さまざまな用途での活用が期待できます。そのデータがなければ、せっかく制作したコンテンツをフル活用できないでしょう。 この記事では、私たちが自動生成を選んだ経緯や字幕生成のプロセスを紹介します。私の生成 AI に関する知識はまだ浅く、改善の余地は多分にあります。また、AI 技術は急速に進化しているため、ここで紹介する方法はすぐに時代遅れになる可能性もあります。それでも、この取り組みが何かの参考になれば幸いです。 字幕 まず、生成について説明する前に、字幕の基本的な概念

                                                                            講義動画における生成 AI を活用した字幕生成 - スタディサプリ Product Team Blog
                                                                          • 最上あいシングルマザーだった 18歳の時に未婚のまま出産し母子支援施設に : ハムスター速報

                                                                            最上あいシングルマザーだった 18歳の時に未婚のまま出産し母子支援施設に Tweet カテゴリ話題 0 :ハムスター速報 2025年03月14日 11:28 ID:hamusoku ◆裁判資料に残されていた「母子の記録」 宇都宮地方裁判所栃木支部に残る裁判記録によると、高野容疑者が配信を見て佐藤さんを知ったのが2021年の冬。2022年には佐藤さんが勤務する飲食店を高野容疑者が訪ねたことで、2人は急速に距離を縮めていった。いつしか高野容疑者は、佐藤さんの要求に応じて、定期的に金銭を貸す関係になった。 裁判で返却を求めた総額は「2514800円」だった。2023年の頭に佐藤さんが3万円を返してから、2人は連絡が取れなくなったという。 この資料には、2人が出会う際の佐藤さんの状況についても記されていた。 佐藤さんは2021年、18歳の時に第1子を出産。当時は未婚だったと見られる。2023年時点

                                                                              最上あいシングルマザーだった 18歳の時に未婚のまま出産し母子支援施設に : ハムスター速報
                                                                            • 【Dify】Mistral OCRプラグインの設定方法/使い方〜実際の性能に関しても詳細に解説〜|Dify Base

                                                                              はじめに今回の記事では、Difyで利用可能になった「Mistral OCRプラグイン」の使い方や活用例、最後には、Difyのテキスト抽出機能との比較など、実際の性能評価もご紹介します。 Mistral OCRは、最新のAI技術を活用し、PDFや画像から文字情報だけでなく、文書の構造やレイアウトまで高精度に読み取ることができるサービスです。 先日、Difyでも、Mistral OCRの機能を使うことができるプラグインが公開されました。 この記事では、Mistral OCRプラグインの基本的な使い方から、APIキーの設定、読み取った結果の整形方法まで、Difyユーザー向けに分かりやすく解説します。 Mistral OCRとは?Mistral OCRは、AI技術開発企業であるMistral AI社が提供する、画像やPDFファイルから情報を高精度に読み取るためのクラウドサービス(API)です。 D

                                                                                【Dify】Mistral OCRプラグインの設定方法/使い方〜実際の性能に関しても詳細に解説〜|Dify Base
                                                                              • 専門用語を正しく検索するRAG最適化手法「Golden-Retriever」

                                                                                はじめに こんにちは、Wanderlustの森安です。 近年、生成AIと情報検索の融合が急速に発展し、専門分野や社内ナレッジの活用がますます重要になっています。しかし、従来のRAGでは専門用語やドメイン特化情報、社内独自の知識を正しく検索・活用できないという課題がありました。 そこで、2024年夏に登場したのが「Golden-Retriever」です。従来のRAGに質問や知識ベースの前処理プロセスを追加することで、専門知識や社内文書の検索精度を大幅に向上させ、より正確で実用的な回答を提供できるようになりました。特に、検索前にクエリから専門用語を抽出し、専門用語辞書(Jargon Dictionary)による説明を加えることで、曖昧なクエリでも適切な情報を取得できる点が特長です。 企業のナレッジ管理から医療・法律・金融といった専門領域まで、幅広い分野での活用が進んでいます。 この記事でわかる

                                                                                  専門用語を正しく検索するRAG最適化手法「Golden-Retriever」
                                                                                • ”お客様の声”を圧倒的な効率で分析する|生成AI×テキストマイニング講座①|データ分析ラボ | 生成AI 最新トレンド

                                                                                  続きを書く励みになります!ぜひ「フォロー」と「スキ」をお願いします! テキストマイニングとは、大量のテキストデータを分析し、有益な情報を抽出する手法です。SNSの投稿、アンケート結果、レビューコメントなど、テキストデータはさまざまな場面で活用されています。この記事では、Excelを使って手軽にテキストマイニングを始める方法を解説します。 テキストマイニングの基本テキストマイニングでは、以下のような手法が一般的に用いられます。 頻出語の分析:文章の中でよく使われる単語を抽出し、データの傾向を把握 共起分析:単語の組み合わせの関係を調べ、関連性を分析 感情分析:ポジティブ・ネガティブといった感情を分類 スーパーマーケットの壁面に貼られた「お客様の声」をスキャンし、OCRを使ってテキストデータに変換したとします。このデータをExcelに取り込み、頻出語を分析すれば、以下のように顧客の関心や要望を

                                                                                    ”お客様の声”を圧倒的な効率で分析する|生成AI×テキストマイニング講座①|データ分析ラボ | 生成AI 最新トレンド