並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 142件

新着順 人気順

OCRの検索結果1 - 40 件 / 142件

  • なぜ、Difyなのか - Algomatic Tech Blog

    はじめに こんにちは!Algomatic ネオセールスカンパニーでエンジニアをしている末國と申します。 私たちが1月にリリースした営業AIエージェント「アポドリ」では、一部機能にDifyを組み込んでいます。 一部といっても、すでに100個近いワークフローが作られていたり、1日1万回呼び出したりするくらいには利用しています。 Difyはいわゆるローコードツールであり、「コードが書けない人が使うもの」「DifyはPoCで使って、本番はプログラムを書く」という印象もあるかもしれません。 しかし、私たちはむしろ積極的に「コードからDifyへの移行」を行ってきました。 この記事では私たちが「なぜDifyを利用しているのか」「何がそんなにいいのか」について書いていきます。 そもそもDifyとは何か 理由の話をする前に、そもそもDifyとは何か、特にワークフロー機能についておさらいしておきます。 すでに

      なぜ、Difyなのか - Algomatic Tech Blog
    • 江戸時代の言葉を話すAIチャット「からまる」 Sakana AIが公開 古文書の2500万文字を学習

      AIベンチャーのSakana AI(東京都港区)は4月1日、江戸時代の古文風テキストで会話できるAIチャットbot「からまる」を公開した。約2500万文字に及ぶ、江戸時代の文章で構成したデータセットを学習している。研究と教育を目的に、HuggingFaceで公開している。 例えば、からまるに「あなたの名前はなんですか」と聞くと「某が名はからまるにて候」と返答。「AIにとって大事なものはなんですか」と尋ねると「AIにとりて大切なるものはデータなりこれによりて己か身を成長せしむる所以也」と返し、「スマホはなんですか」という問いには「携帯する小箱にて候則ち其中に文字や画図をもつて遠所に在る人々へ伝達する道具也」と回答する。 からまるのベースモデルには、AIベンチャー・ELYZAのオープンモデル「Llama-3-ELYZA-JP-8B」を利用。江戸時代の書物などをAIくずし字OCRで楷書体に直した

        江戸時代の言葉を話すAIチャット「からまる」 Sakana AIが公開 古文書の2500万文字を学習
      • デスクトップを囲ってOCR ~「Snipping Tool」キャプチャーバーにテキスト抽出ボタン/Canary/Devチャネルよりテスト開始

          デスクトップを囲ってOCR ~「Snipping Tool」キャプチャーバーにテキスト抽出ボタン/Canary/Devチャネルよりテスト開始
        • 多くの企業が「RAGの精度が出ない問題」に悩む中、ガートナーが「次のアプローチ」を予言

          ガートナージャパンは2025年4月10日、企業のAIモデル活用に関する見解を発表した。汎用(はんよう)大規模言語モデル(LLM)は言語処理能力の点で強力であるものの、特定のビジネス領域での文脈を必要とするタスクでは応答の正確性が低下する傾向にあると指摘。このため、「企業は2027年までに汎用LLMよりも、小規模でタスクに特化したAIモデルを導入するようになる」と予測している。 Gartnerのスミット・アガルワル氏(バイスプレジデント アナリスト)は「小規模でタスク特化型のモデルは、応答が迅速で、計算リソースも少なくて済むため、運用や保守のコストを抑えられる。ビジネスワークフローでのタスクの多様性と、より高い正確性へのニーズが、そうしたタスク特化型モデルへの移行を促している」と述べている。 特化型モデルの主な構築方法としてはファインチューニングと検索拡張生成(RAG)がある。こうしたプロセ

            多くの企業が「RAGの精度が出ない問題」に悩む中、ガートナーが「次のアプローチ」を予言
          • LayerXのバクラクAIエージェント事業についての解説|福島良典 | LayerX

            どうも、すべての経済活動を、デジタル化したい福島です。 LayerXのバクラク事業ですが今年の4月よりAIエージェント事業に参入します。 を書いていたので予想していた方も多いかもしれませんが、満を持してはじめます。 ただし、多くの会社がやるようなAIエージェントをエンドユーザーに提供するという形態ではなく、AI BPOという形で提供します。AI BPOとは「当社がBPO業者としてAIエージェントを活用し、エンドユーザーは今まで通りアウトプットだけ受け取る」というサービスの提供形態です。バクラクのAIエージェント事業はAI BPOという形で参入します。 もちろんAIエージェント自体をプロダクトに組み込んでいくこともやっていきます。そのプロダクトも絶賛開発中です。 この記事では、上記の記事やプレスリリースで伝えられなかった、狙いみたいな部分を解説していきます。 具体的に何やるの?バクラク関連事

              LayerXのバクラクAIエージェント事業についての解説|福島良典 | LayerX
            • Bet TechnologyからBet AIへ|Matsumoto Yuki

              こんにちは。LayerX CTOの松本です。 この2年と4ヶ月、LayerXとしてひたすらLLMに取り組んできました。2022年末にChatGPTが世界中を驚かせてから、私たちのビジネスや社会の在り方は急速に変化しています。私達が向き合うデジタル化も激しい変化の時が来ています。 そして今回、LayerXは創業以来初めての行動指針の根本的な変更を行うことになりました。これまでの6年間、私たちは「Bet Technology」という指針のもとで歩んできました。この6年の間にも行動指針の順序の入れ替えや副文の変更は何度か行われてきましたが、行動指針自体を変えるのは創業以来初めてのことです。これは単なる言葉の言い換えではなく、私たちの会社としての方向性と決意を明確に示す重要な転換点です。 新しくなった行動指針なぜ今このタイミングで変更するのか。それは、今まさに社会全体が生成AI・LLMによって変革

                Bet TechnologyからBet AIへ|Matsumoto Yuki
              • トーマス・ロックリー氏が黒人侍の弥助を「旗手」と評したことを、民主主義をたいせつにするかぎり否定することはできない - 法華狼の日記

                約1年前に、仏国のゲームシリーズ新作『アサシンクリード シャドウズ』の主人公として歴史に残る黒人が選ばれたという情報が流され、多数の誤解や誤認とともに反発された。 そこで日本での黒人の活躍が誇張されている原因として逆算的に名指しされ、今も産経新聞などに非難されているのが*1、弥助の資料をまとめて一般向けのノンフィクション書籍も発表したトーマス・ロックリー氏だ。 黒人「弥助」英雄説は行き過ぎたDEI 歴史的虚偽を広める人物は第二の吉田清治氏だ https://t.co/fp5EPDHdws 日大准教授ロックリー氏の著書の影響と「多様性・公平性・包括性(DEI)」が結びつき、欧米の人文学界にはすでに、弥助英雄説に対する批判を許さない空気があると指摘する。— 産経ニュース (@Sankei_news) 2025年4月19日 黒人「弥助」英雄説は行き過ぎたDEI 歴史的虚偽を広める人物は第二の吉田

                  トーマス・ロックリー氏が黒人侍の弥助を「旗手」と評したことを、民主主義をたいせつにするかぎり否定することはできない - 法華狼の日記
                • 今週のはてなブックマーク数ランキング(2025年3月第5週) - はてなブックマーク開発ブログ

                  はてなブックマークのブックマーク数が多い順に記事を紹介する「はてなブックマーク数ランキング」。3月24日(月)~3月30日(日)〔2025年3月第5週〕のトップ30です*1。 順位 タイトル 1位 【保存版】親が亡くなったらやること全52項目を解説!一覧チェックシート付き - リハコ 2位 昨年入社した新人さんが、あまりにも助けを求めるのがうまくて、「こいつ人生二度目か?」と思った話。 | Books&Apps 3位 転職したら話し相手がいなかったんだけど 4位 なんか私のChatGPTだけ生成下手じゃない? なんでみんなそんなに上手にコントロールできるの? - posfie 5位 労働基準監督官だった頃の思い出 6位 ChatGPT『GPT-4o』の画像生成が大幅アップデート!新機能を徹底解説|ChatGPT研究所 7位 「ふつう」ではない人間が、なぜ金を貯められないのかを説明しよう |

                    今週のはてなブックマーク数ランキング(2025年3月第5週) - はてなブックマーク開発ブログ
                  • Vision Language Modelの統合で汎用化はできるのか?タスク横断マージを試す - Sansan Tech Blog

                    こんにちは。研究開発部のMengsay Loemです。 現在は、帳票などの文書画像から情報を抽出・構造化する「データ化技術」の研究開発に取り組んでいます。 本記事ではその中でも、視覚言語モデルを活用したアプローチに注目し、特に異なる情報抽出に特化したVLM(Vision-Language Model)を統合する方法に関する実験と考察を共有します。 ※ ここで紹介する実験の内容は、実際の当社サービスで用いている技術とは異なります。 背景:帳票情報抽出へのVLM活用とその課題 帳票からの情報抽出には、近年VLMを VQA(Visual Question Answering)形式に適用する方法が注目されています。簡単に説明すると、VQAとは画像に対して質問を自然言語で与え、それに対する答えをモデルが自然言語で返すというタスクです。以下のようなイメージです。 VLMによる情報抽出における入出力帳票

                      Vision Language Modelの統合で汎用化はできるのか?タスク横断マージを試す - Sansan Tech Blog
                    • Sakana AI

                      April 01, 2025 「からまる」はSakana AIが開発した江戸古文風チャットボットです。現代日本語で質問すると、江戸時代の世界観と当時の古文風テキストで回答してくれます。学術プロジェクトと協力して、江戸時代の書物から約2500万文字のデータセットを構築し、大規模言語モデルを継続学習しました。からまるのデモはこちらでお試しいただけます。 概要 Sakana AIは、江戸時代の古文風テキストで会話できるチャットボット「からまる」を公開します。現代のテキストを学習した大規模言語モデル(LLM)に対して、江戸時代の書物など数千点以上から構築した江戸テキストデータセットを継続学習させることにより、現代日本語で質問すると江戸時代の古文風テキストで回答できるチャットボットを開発しました。回答の内容には江戸時代の世界観が反映されているため、過去の文化への没入感がより高い会話を楽しめるようにな

                        Sakana AI
                      • サスケ みたい な アスレチック「オブスタクル」に挑戦してみたのでレポートします! - たつやの株主優待&配当金・分配金で まったりライフ!

                        サスケ みたい な アスレチック「オブスタクル」に挑戦してみたのでレポートします! オブスタクルスポーツとは 体験したのはリソルの森 リソルの森「オブスタクルスポーツ施設の案内」👇 体験方法 ■会場 ■対象 ■内容 ■持ち物 ◆料金 利用誓約書 チャレンジの様子と感想 一番簡単な障害物 最後に サスケ みたい な アスレチック「オブスタクル」に挑戦してみたのでレポートします! この記事では。あの人気番組「サスケ(SASUKE)」みたいなスポーツ、アスレチックに挑戦できる「オブスタクルスポーツ」競技に挑戦してみたので紹介します。 オブスタクルスポーツとは 「オブスタクル」(obstacle)は、英語で「障害物」や「妨害」を意味します。 「オブスタクルスポーツ」は、様々な障害物をクリアしながらタイムを競うスポーツです。「走る」「跳ぶ」「登る」「つかむ」などの動作を通じて、身体的・精神的な挑戦

                          サスケ みたい な アスレチック「オブスタクル」に挑戦してみたのでレポートします! - たつやの株主優待&配当金・分配金で まったりライフ!
                        • 31日の日曜日|mri

                          LayerX バクラク事業部でプロダクトのデザインを担当しています森です。 突然ですが、どんな日付選択のUI(所謂Date Picker)を使っていますか? バクラクには内製したライブラリがあります。 内製した理由はいくつかあるのですが、その内の一つはカレンダーの第一週目の表示にあります。 カレンダーの第一週目どういうことかと言うと、第一週目の空いている部分に、前月の日付を表示させ、カレンダーを遷移させることなく、前月の月末を選択したいという要望からです。 空き部分に前月を表示シンの月末それっぽいことができるライブラリはあるのですが、第一週の空白を埋めているにすぎないので、1日が日曜であった場合、前月が表示されません。 第一週目に空きがないと前月は表示されないそしてもう一つ、この場合。 前月の31日は表示されているが…バクラクではこう表示しています。 前月をもう一週分表示する31日は確かに

                            31日の日曜日|mri
                          • Microsoftが二度の延期を経てついにCopilot+ PC向けにRecallのリリースプレビュー版を展開

                            ユーザーのPC操作を細かく画面撮影し、光学式文字認識(OCR)で情報をスキャンして後からAIで検索できるようにする機能「Recall(回顧)」が、ついにWindows Insider Programのリリースプレビューチャネルに実装されたことが明らかになりました。 Releasing Windows 11 Build 26100.3902 to the Release Preview Channel | Windows Insider Blog https://blogs.windows.com/windows-insider/2025/04/10/releasing-windows-11-build-26100-3902-to-the-release-preview-channel/ Microsoft is about to launch Recall for real this ti

                              Microsoftが二度の延期を経てついにCopilot+ PC向けにRecallのリリースプレビュー版を展開
                            • Expert used ChatGPT-4o to create a replica of his passport in just 5 minutes bypassing KYC

                              SECURITY AFFAIRS MALWARE NEWSLETTER ROUND 41 | Security Affairs newsletter Round 519 by Pierluigi Paganini – INTERNATIONAL EDITION | China admitted its role in Volt Typhoon cyberattacks on U.S. infrastructure | Symbolic Link trick lets attackers bypass FortiGate patches, Fortinet warns | Attackers are exploiting recently disclosed OttoKit WordPress plugin flaw | Laboratory Services Cooperative dat

                                Expert used ChatGPT-4o to create a replica of his passport in just 5 minutes bypassing KYC
                              • ByteDanceのByteSpider BotがAI悪用ボット攻撃の54%を占める:ウェブトラフィックの過半数が危険に - イノベトピア

                                Last Updated on 2025-04-16 10:33 by admin 2025年4月15日に発表された「Imperva Bad Bot Report 2025」によると、2024年のウェブトラフィックの51%が自動化されたボットによるもので、人間によるトラフィックを上回った。特に悪質なボットは全体の37%を占め、前年の32%から増加している。 AI技術の進化により、悪質なボットは人間の行動を模倣しやすくなり、検知が困難になっている。主要な攻撃には、APIを狙った高度な攻撃やCAPTCHA突破が含まれる。特にByteDance社(TikTok運営元)の「ByteSpider Bot」がAI対応型攻撃の54%を占め、Applebot(26%)、ClaudeBot(13%)、ChatGPT User Bot(6%)が続いている。 業界別では、小売業界(59%)や旅行業界(41%)が

                                  ByteDanceのByteSpider BotがAI悪用ボット攻撃の54%を占める:ウェブトラフィックの過半数が危険に - イノベトピア
                                • 【文理融合】「AIと歴史学」〜古文書の「くずし字」を高精度で読み、江戸時代の価値観に迫る 稲葉継陽さん(Science Portal) - Yahoo!ニュース

                                  延べ日数わずか20日間で読みましたから、とんでもない速さですよね。人間が1枚1枚めくりながら読んでいくと、どれだけの年月がかかることか……。ただ、「くずし字AI-OCR」は、人間が史料を写真に撮って画像データにしてあげないと読めませんけれど。そして、文脈で読むのは苦手です。例えば、「跡目」ときたら「息子」と続くだろう、人名で「永」ときたら家臣の「永良」だろうと、私たちは予測して読んでいます。それがAIには難しいので、人間ではありえない読み間違いをすることも。

                                    【文理融合】「AIと歴史学」〜古文書の「くずし字」を高精度で読み、江戸時代の価値観に迫る 稲葉継陽さん(Science Portal) - Yahoo!ニュース
                                  • 日本語未対応ゲームの翻訳にも役立つ無料ツール「PCOT」が更新。Geminiとの連携でより広範なフォントが認識可能に|ゲームメーカーズ

                                    無料の翻訳支援ツール「PCOT」が更新され、Geminiとの連携が可能に 「PCOT」は、ゲーム画面やWebページからOCRで認識し、テキスト化するツール Geminiとの連携により文字認識・翻訳の精度が向上。フォントにかかわらず翻訳でき、利便性が向上 2025年4月11日(金)、翻訳支援ツール「PCOT」が更新され、Googleの生成AI「Gemini」との連携が可能となりました。 PCOTを更新しましたぁ!!詳しくはサイトで!! 「翻訳支援ツールPCOT」https://t.co/j6WEmKVsoi ついにPCOTにGeminiが搭載されました! 5年に渡る開発期間の中で、間違いなく最高の更新です!正に革命と言ってもいいでしょう! 過去のPCOTを以てしても遊べなかったゲームが、今なら必ず遊べます!! pic.twitter.com/w703Y4B5FY — ぬるっぽ (@PcotN

                                      日本語未対応ゲームの翻訳にも役立つ無料ツール「PCOT」が更新。Geminiとの連携でより広範なフォントが認識可能に|ゲームメーカーズ
                                    • 一太郎Pad - スマホが万能の入力機器に変身!とりあえず入れておくべきAndroidアプリ - ウインタブ

                                      こんにちは、吟遊詩人です。これから何回かに分けておすすめアプリシリーズをお届けします。第一弾は「Android端末を買ったらとりあえずインストールしておくと幸せになる」一太郎Padです。ちなみにこのアプリは「一太郎」を名乗っていますが、いうほど一太郎ではないですw。往年の一太郎を期待してインストールしてはいけません。吟遊詩人がAndroid端末を買ったらひとまずこのアプリを入れるのは「OCRが使いやすいから」です。 つまり、印刷物とかの入力に使いまくれるんです。例えば、イオンモールで買い物して、もらった応募券の番号を応募サイトに手で入力するのめんどくさいですよね? そんな時には一太郎Padです!! 応募券を並べておいて、スマホで一太郎Padを起動し、カメラを選びます。

                                        一太郎Pad - スマホが万能の入力機器に変身!とりあえず入れておくべきAndroidアプリ - ウインタブ
                                      • 国交省は行政文書のデータ化へ生成AI活用、AWSの実用化推進プロジェクト成果発表

                                        生成AI(人工知能)活用は官公庁やエンタープライズ企業でもスタンダードになりつつある。アマゾンウェブサービスジャパン(AWSジャパン)が2024年7月から提供した「生成AI実用化推進プログラム」には150社を超える企業や団体が参加した。中には国土交通省など公共機関も含まれる。2025年4月16日、AWSジャパンが開催したプログラムの成果発表会で各社の取り組みが明らかになった。 AWSジャパンが2024年に提供した生成AI実用化推進プログラムは、独自の生成AIモデル開発に取り組むモデル開発者向けと、既存のモデルを利用して実用化を進めるモデル利用者向けの2つのコースを備える。当初全体で50社の参加を想定していたというが、開発者向けコースには30社以上、モデル利用者コースには120社以上が参加した。 参加企業はAWSジャパンから学習環境構築やデータセット整備、モデルの選定などの技術的な支援の他、

                                          国交省は行政文書のデータ化へ生成AI活用、AWSの実用化推進プロジェクト成果発表
                                        • Microsoftの「Recall」はファイルを暗号化するなど改良が加えられているがPINだけで実行できるため機密データ保護措置はまだ信頼できないとの指摘

                                          ユーザーのPC操作を細かく画面撮影し、光学式文字認識(OCR)で情報をスキャンして後からAIで検索できるようにするWindowsのAI機能「Recall(回顧)」が試験的に提供され始めたため、テクノロジー系メディア等がその仕様を確認してレビューしています。その中で、Recallを起動する際に求められる生体認証が話題となりました。 Microsoft Recall on Copilot+ PC: testing the security and privacy implications | by Kevin Beaumont | Apr, 2025 | DoublePulsar https://doublepulsar.com/microsoft-recall-on-copilot-pc-testing-the-security-and-privacy-implications-ddb296

                                            Microsoftの「Recall」はファイルを暗号化するなど改良が加えられているがPINだけで実行できるため機密データ保護措置はまだ信頼できないとの指摘
                                          • 複雑なレイアウトや方程式、多言語も読み取れる「Mistral OCR」の実力とは

                                            Mistral AIは2025年3月6日(仏国時間)、OCR(Optical Character Recognition:光学的文字認識)API「Mistral OCR」を発表した。同社は以下のように紹介している。 Mistral OCRは、ドキュメント理解の新たな標準となる光学式文字認識APIだ。他のモデルとは異なり、Mistral OCRはドキュメントの各要素(メディア、テキスト、表、数式)をかつてない精度と認識力で理解する。Mistral OCRは画像やPDFを入力とし、テキストと画像を順序よくインターリーブしてコンテンツを抽出する。 Mistral OCRは、マルチモーダル文書(スライドや複雑なPDFなど)を入力とするRAG(検索拡張生成)システムと組み合わせて使用するのに理想的なモデルといえる。 当社では、対話型AIアシスタント「Le Chat」の数百万人のユーザーが文書を理解で

                                              複雑なレイアウトや方程式、多言語も読み取れる「Mistral OCR」の実力とは
                                            • AI博覧会カンファレンスに集まった「本気の企業」──参加者分析で見えた業種・関心分野とは?|AIを使う全ての人へ|WEEL

                                              生成AIを“使ってみる”段階から、“どう事業化するか”へ。 3月末に開催された「AI博覧会 Spring 2025」のカンファレンスには、500名以上の参加者が集まりました。 テーマは、「生成AIを軸とした新規事業開発」。 実際の事例を通じて、開発のリアルが語られました。 本記事では、参加者の属性データやセッションの様子をもとに、 今どんな企業が、どんな温度感で動き始めているのか?を整理しています。 「生成AIを活かした事業をしたいが、何から始めるべきか悩んでいる」 「他社はどんな領域に注目していて、どう形にしているのか知りたい」 そんな方にとって、ヒントになるはずです。 Noteをご覧になっている方、カンファレンスに参加できなかった方に向けて新規事業×生成AIに関するセミナーを開催します!この機会にぜひご参加ください! ✅ セミナーに参加する 1. 500名以上が参加。どんな人たちが来て

                                                AI博覧会カンファレンスに集まった「本気の企業」──参加者分析で見えた業種・関心分野とは?|AIを使う全ての人へ|WEEL
                                              • GitHub - maurymarkowitz/101-BASIC-Computer-Games: Type-in programs from the original 101 BASIC Computer Games, in their original DEC and Dartmouth dialects. No, this is *not* the same as BASIC Computer Games.

                                                This folder contains the programs found in the March 1975 3rd printing of David Ahl's 101 BASIC Computer Games, published by Digital Equipment Corp. You can download all of the programs in a single archive using the Releases link to the right. Contrary to popular belief, 101 is not the same as the later and more famous BASIC Computer Games (BCG) published by Ahl through Creative Computing. A numbe

                                                  GitHub - maurymarkowitz/101-BASIC-Computer-Games: Type-in programs from the original 101 BASIC Computer Games, in their original DEC and Dartmouth dialects. No, this is *not* the same as BASIC Computer Games.
                                                • DifyでMistral OCRを利用する方法を解説! |kazu@生成AI×教育 | AI Academy

                                                  Mistral OCRとはMistral OCR は、光学式文字認識(OCR)API です。PDFファイルや画像ファイルを受け取り、文字などを認識し抽出が可能です。Mistral OCRの特徴は、高精度かつ高速にOCRが可能です。 詳細:https://mistral.ai/news/mistral-ocr 今回は、Dify専用のMistral OCRプラグインが公開されたため、そちらを使っていきます。 機能としては以下のとおりです。 構造と書式(ヘッダー、段落、リスト、表)を保持したままテキストを抽出 結果をマークダウン形式で返す 複雑なレイアウトを処理(複数カラムのテキスト、混合コンテンツ) 様々なフォーマット(PDF、画像)を高い精度で処理 https://marketplace.dify.ai/plugins/inlei/mistral_ocr今回作成するワークフロー Difyの基

                                                    DifyでMistral OCRを利用する方法を解説! |kazu@生成AI×教育 | AI Academy
                                                  • OCRすぐできる君 - k本的に無料ソフト・フリーソフト

                                                    画像や画面内に写っている文字列を読み取り、プレーンテキストとして出力してくれる OCR ツール。 指定した画像ファイル / フォルダ内の画像 / クリップボード内の画像 / マウスドラッグで囲んだ矩形領域内 に写っている文字列を、コピー可能なプレーンテキストとして出力できるようにしてくれます。 OCR 対象の画像を回転 / ノイズ除去 / シャープ / 拡大 / 色反転 / 白黒化 して認識精度を向上させる機能や、OCR 結果のテキストを整形(半角スペース削除、空行削除 等)する機能 なども付いています。 OCRすぐできる君は、画像や画面内の文字列を読み取ってテキスト化してくれる OCR ツールです。 ドラッグ&ドロップで放り込んだ画像(BMP / JPEG / PNG / GIF / TIFF) クリップボード内にコピー中の画像 マウスドラッグで囲んだ矩形領域内 指定したフォルダ内の画像

                                                      OCRすぐできる君 - k本的に無料ソフト・フリーソフト
                                                    • 政治とカネの新データベースが誕生!全国会議員の団体データを一発で検索。無料なのに「持続可能」な仕組みで提供|SlowNews | スローニュース

                                                      政治とカネの問題が後を絶ちません。それなのに、「透明化」は遅々として進んでいないのが現状です。そんな中で、新たなデータベースが誕生しました。 それが一般社団法人 政策推進機構が本日(4月14日)ローンチした『政治資金収支報告書データベース』です。 現時点でデータベース化されている政治資金収支報告書は以下のもので、総ページ数は約6万5千、データレコード件数は約50万件という膨大なものになっています。 衆参両院の全国会議員の関係団体(総務省届出分、地方選管届出分) 主要五政党(自民・公明・立憲民主・維新・国民民主)の政党本部・政党支部(都道府県・国政選挙区レベル) 政治資金団体など 政治家名や政治団体名、寄付やパーティー券を購入した企業名などのキーワードで検索が可能で、収入や支出をランキングにして一覧で表示できるのが最大のメリット。これを個人でやろうと思うと大変な作業になります。 「政治活動が

                                                        政治とカネの新データベースが誕生!全国会議員の団体データを一発で検索。無料なのに「持続可能」な仕組みで提供|SlowNews | スローニュース
                                                      • OCR調査(簡易版)

                                                        OCRに関する技術調査(簡易版) 0. はじめに お疲れ様です。STARAI社員の中岸です! 最近仕事柄OCR(光学文字認識(こうがくもじにんしき、英: Optical character recognition):活字、手書きテキストの画像を文字コードの列に変換する技術)に触れることが多かったので、色々と調査したものまとめてみました。 本記事は、今回触ってみた様々なモデルについてまとめていくわけですが、 それぞれの技術単体を深く調査してまとめたようなものではなく、 シンプルにまとめて(1モデル1セクション:概要、サンプルコード(処理対象は日本語、デフォルトでの使い方のみ、オプションや精度向上のための前処理などには踏み込まない)、所感くらいの構成)、カタログみたいな感じで後々使えたらいいなくらいの感じを目指して書いておりますので、その点ご理解ください(また、今回のサンプルであまりうまくいか

                                                          OCR調査(簡易版)
                                                        • AIエージェント開発のバカな失敗、技術と体験からAIをデザインする|en.

                                                          こんにちは!Nulogic という会社で AIプロダクトのデザインやプロトタイプ開発をしている en. (@ysk_en)です。 以前にも増して、生成AIやAIエージェントのニュースが滝のように流れてきます。 フルスタックのコード生成ツールが3ヶ月で30億の売上を立てた。とか OpenAIのOperatorがAmazonでは買い物できるのに楽天ではできなかった。とか そんなニュース記事のリンクとともに経営者の方から「ChatGPTだけでなく社内専用のAIエージェントを導入したい」「AIを活用した新サービスで市場を開拓したい」といった相談をいただきます。 「AI による付加価値は本当にあるのか?」「具体的にどんなユースケースがあるのか?」「実装コストや ROI はどう考えるのか?」など、クリアすべき課題が山積みです。 さらに、実際にAIを組み込んだとしても ユーザー体験 (UX) の設計 が

                                                            AIエージェント開発のバカな失敗、技術と体験からAIをデザインする|en.
                                                          • 新たな問いを生み出しお客様と共創していくRICOH BIL TOKYOの挑戦 - 日経ビジネス電子版 Special

                                                            リコーの技術を結集し、お客様との共創で社会課題を解決していく場である「RICOH BUSINESS INNOVATION LOUNGE TOKYO(以下RICOH BIL TOKYO)」。RICOH BIL TOKYOを立ち上げた菊地英敏氏にこの場所が生み出す価値創造について話を伺った。 OAメーカーから デジタルサービスの会社へ コロナ禍を機に働き方も大きく変わった。ハイブリットワークが浸透し、デジタルで付加価値を提供することがより求められる世の中において、リコーはオフィスでの複合機などのビジネスを中心としたオフィスオートメーション(OA)の会社から脱皮し、お客様のタスクを減らすだけでなく、創造力の発揮を支えるデジタルサービスを提供する会社への変革の途上にある。その一環で、リコーのデジタルサービスを体感できるお客様とともに新たな価値を創出する場所として開設されたのがRICOH BIL T

                                                              新たな問いを生み出しお客様と共創していくRICOH BIL TOKYOの挑戦 - 日経ビジネス電子版 Special
                                                            • ChatGPTをランニング用のパーソナルトレーナーとして使い倒す - yasuhisa's blog

                                                              3行まとめ Apple Watchのランニングデータを半自動でスプレッドシートに集約する仕組みをChatGPTで作りました ChatGPTプラグインとGAS(Google Apps Script)連携で、データ分析や練習メニューを相談をしています Looker Studioでの可視化や、ChatGPTのDeep Research機能も活用しています 3行まとめ 背景: Apple Watchでのランニング記録と課題 やりたいこと: ChatGPTによるランニングデータ管理の自動化と活用 実際にやったこと Apple Watchからのデータ抽出とtsv出力 ChatGPTによるデータ分析と練習メニュー作成 Looker Studioダッシュボードによる可視化 その他の活用: Deep Research 補足 他ツールとの比較とChatGPTプラグインの利点 パートナルトレーナー化するための仕

                                                                ChatGPTをランニング用のパーソナルトレーナーとして使い倒す - yasuhisa's blog
                                                              • AIを「AIカルテ」として使う際の注意〜ガイドライン抵触にならない使い方〜|EARLの医学&AIノート

                                                                この報道では,クリニックがAIでカルテを自動作成する工夫を紹介している.記事の下の方には動画も見ることができる. これは大問題であると思われる.ローカル環境のAIか,もしくはセキュリティが万全で個人情報が外に出ないAIホストサービスを使っているならまだしも,使用しているのはClaudeそのものである. 報道の動画より 要するに,Claudeに患者個人情報をダイレクトに入力していることに他ならず,これは医療情報関連のガイドラインに抵触している可能性が高い. 病院などではAI導入に関しては医療安全部門や診療録管理委員会などでの精査・承認を経て,安全性の高いAIシステムを導入するというプロセスが組めるが,開業医が独断でAIをカルテに導入するとなると,(医療情報にも詳しいコンサルタントに委託しないのであれば)その開業医個人のセキュリティ関係のAIリテラシーが相当必要である. 開業医が個人でAIを扱

                                                                  AIを「AIカルテ」として使う際の注意〜ガイドライン抵触にならない使い方〜|EARLの医学&AIノート
                                                                • AI時代のオペレーション再設計 —— 「AI BPR」について|numashi/LayerX バクラクVPoP

                                                                  このnoteは、【#日めくりLayerX】と題して発信するブログリレーの2025年4月9日の記事として投稿しています。 前回8日はfurubayashiさんの「最高の一振りを作る刀鍛冶になりたい〜仕事に対するスタンスの話〜」でした。ぜひ合わせてご覧ください! https://note.com/yumafurubayashi/n/ne8e28b1794b7 このnoteについて今取り組んでいる新しいオペレーション設計の考え方、「AI BPR(AI Business Process Re-engineering)」についてご紹介します。 そして、それを実行する上でキーパーソンとなる「AIオペレーションマネージャー」という新しい職種についても、この記事を通じてお伝えできればと思っています。 自己紹介LayerXでVP of Productをしているnumashiといいます。最近は社内向けの営業生

                                                                    AI時代のオペレーション再設計 —— 「AI BPR」について|numashi/LayerX バクラクVPoP
                                                                  • 2025/03/27(木)の出来事 - My Bookmark

                                                                    琵琶湖にある有人島・沖島に伊勢大神楽が来る日 【洗濯初心者向け】洗濯機の使い方から干し方までわかりやすく紹介【新生活】 | Lidea(リディア) by LION 『スペースコブラ』のアクションゲームが8月26日に発売決定!ストーリーはアニメ版の12エピソードをなぞる。おなじみのサイコ・ガンや“博物館入りのシロモノ”「パイソン77マグナム」も登場し、2人協力プレイモードも実装。PC(Steam)、PS5、Xbox、Nintendo Switchに向けて GPT-4oとGemini-2.0の画像生成能力はいかにして作られているのか 独身時代はビビットな感覚があったが、出産を機に頭にモヤがかかったような状態になってしまい、アイデンティティが崩れてずっと苦しむ→友人に救われた話 書籍関係者たちが「ヤバい」と声を揃える『大人も知らない みのまわりの謎大全』、300pにおよぶゲーム攻略本みたいな情報

                                                                      2025/03/27(木)の出来事 - My Bookmark
                                                                    • AIと共に進化するエンジニアへ:モバイルアプリチームが目指す「AI First」と「越狂」な働き方 - LayerX エンジニアブログ

                                                                      こんにちは!LayerXでモバイルアプリチームのEM(エンジニアリングマネージャー)をしているyoheiです。 最近、子どもが唐揚げを食べてる写真のTシャツを買ってテンション上がってます。 LayerXでは、全社的にAI活用を推進する「Bet AI」という行動指針があり、私たちモバイルアプリチームも、AIを前提とした開発スタイル「with AI」を模索しています。 参考:LayerX、全社的なAI活用を推進する「BetAI」を開始 参考:LLMと共に歩む アプリチームwith AI開発戦略 今日は、AIの進化がエンジニアの働き方や求められるスキルをどう変えていくのか、そして私たちアプリチームがどのような未来を目指しているのかについて、EMとしての視点、そして一人のエンジニアとしての考えを交えながらお話ししたいと思います。 AIが変えるエンジニアリングの風景 GitHub Copilot,

                                                                        AIと共に進化するエンジニアへ:モバイルアプリチームが目指す「AI First」と「越狂」な働き方 - LayerX エンジニアブログ
                                                                      • GoogleドライブのOCR機能で名刺や書類の整理がはかどります - 【磐田,浜松,袋井】パソコンサポートと出張修理 はてな版

                                                                        普段からGoogle Workspaceを使っていることもあり、、Googleの各サービスはよく利用していますが、その中でいちばん使っているのが皆さんご存知のGoogleドライブです。 Google Appsのときから使っているので、すでに10年近く使っているような気もしますが、特に大きな障害や事故もなく安心して日々使っています。 Googleドライブの便利な機能の1つとしてOCR機能があるのですが、今さらとも言えますが、これがなかなか便利だったりします。 OCR機能は、簡単に言うと紙や画像に書かれている文字を、コンピュータが読める文字データに変換する機能です。 紙の名刺や書類はどんどん溜まる一方ですが、保管場所にも困りますし、後から「~~さんの名刺はどれだっけ?」「あの書類のここの箇所はどんな内容だったかな?」と探そうと思っても、探すだけで時間がかかってしまいます。 そういうときにはGo

                                                                          GoogleドライブのOCR機能で名刺や書類の整理がはかどります - 【磐田,浜松,袋井】パソコンサポートと出張修理 はてな版
                                                                        • Computer useでサブスクの解約をほぼ自動化してみた話

                                                                          はじめに 最近、多くのサービスがサブスクリプション方式になっていますよね。Netflix、Spotify、Amazon Prime、各種SaaSツールなど、私たちの生活や仕事を便利にするサービスが月額や年額で提供されています。これらは確かに便利である一方、気づかないうちに毎月の固定費が増えてしまい、「これ、何の支払いだったっけ?」と明細を見て驚くことも少なくありません。 さらに厄介なのが解約手続きです。サービスごとに解約方法が異なり、以下のような問題が生じています: 「解約ページがどこにあるのか見つからない」 「解約手順が複雑で、途中で諦めてしまう」 「解約しようと思っても後回しにしてしまい、無駄な出費が続いてしまう」 「解約ページに辿り着いても、引き止めの策略に引っかかってしまう」 このような悩みをAIの力と最新の自動化技術を使って完全に解決したいと考え、本プロジェクトを立ち上げました。

                                                                            Computer useでサブスクの解約をほぼ自動化してみた話
                                                                          • 二度手間じゃん~ハンターカブのナンバー変更完了~☆ - Mitiru's Diary

                                                                            はい、今日は休暇でナンバー変更の為に動いていました。 事前に要るものを下調べして、ルートを確認して動きましたが大失敗w まあそれは後で書きます。 まずは ①市役所でナンバー返納 今日はDUKEで動きます。 市役所とかでの駐車場を考えなくて良いし、移動も速いので^^; まずは市役所でナンバー返納をしました。 登録票とナンバーと身分証明証が必要。 ※マイナンバーカードを持ってこれば良かっと後で後悔 はい、ここで既にやらかしてます(--;) ②ホンダで自賠責清算と再加入 次にホンダに向かいますが、10:30からしかやってないのでホムセンで時間潰し。。。 で、ホンダで原付二種の自賠責を解約して清算、軽二輪の自賠責に再加入しました。 軽二輪は車体番号が有れば加入出来るので、事前にやっておくと良いです。 ここで市役所で貰った返納証明書がディーラーに引き取られて、控えのみ返して貰えます。 さて・・・ここ

                                                                              二度手間じゃん~ハンターカブのナンバー変更完了~☆ - Mitiru's Diary
                                                                            • 言語処理学会第31回年次大会(NLP2025)に行ってきました

                                                                              はじめに こんにちは、ナウキャストで LLM エンジニアをしている Ryotaro です。 2025 年 3 月 10 日から 3 月 14 日まで出島メッセ長崎で開催されていた、言語処理学会第 31 回年次大会(NLP2025)に参加しました。 言語処理学会は年に一回開催される学会であり、NLP 系の学会では日本では最大規模です。研究者だけでなく企業の方も参加しており、昨今の LLM の発展により学会に参加する参加障壁が低くなったこともあり、発表者は増加していて今年はなんと過去最大の 777 件の発表数だったそうです。去年が 599 件、一昨年が 579 件なので、LLM の発展により発表者が増えていることがわかりますね。 初日は招待講演やチュートリアル、企業ブースの展示がメインで、真ん中の三日間では、各分野ごとに学会に提出した論文の口頭発表やポスター発表が主に行われました。最終日にはワ

                                                                                言語処理学会第31回年次大会(NLP2025)に行ってきました
                                                                              • Paperless-ngx

                                                                                Paperless-ngx is a community-supported open-source document management system that transforms your physical documents into a searchable online archive so you can keep, well, less paper. Get started Demo Features Organize and index your scanned documents with tags, correspondents, types, and more. Your data is stored locally on your server and is never transmitted or shared in any way. Performs OCR

                                                                                • Unstructuredを試してみる

                                                                                  Unstructuredはオープンソースと商用サービスの両方を提供している様子。 エンタープライズ向けプラットフォーム(Coming soonっぽい) サーバレスAPI 今回はオープンソース版で。 Unstructured オープンソース unstructuredライブラリは、画像やPDF、HTMLファイル、Word文書などのテキストベースの文書など、多様なデータ形式の取り込みと事前処理を簡素化するように設計されたオープンソースのツールキットを提供している。unstructuredは、大規模言語モデル(LLM)のデータワークフローの最適化に重点を置いており、モジュール機能とコネクタをシームレスに連携させる。この統合システムは、非構造化データを構造化フォーマットに効率的に変換することを保証し、同時にさまざまなプラットフォームやユースケースへの適応性も提供する。 主な機能 正確な文書抽出: U

                                                                                    Unstructuredを試してみる