並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 300件

新着順 人気順

OCRの検索結果201 - 240 件 / 300件

  • 安祥城址公園(安祥文化のさと)を散策した - 🍉しいたげられたしいたけ

    久しぶりの散策ネタである。初めての場所で人と会う約束があり、遅れちゃいけないと少し早めに出た。落ち合う場所には余裕を持って着いたので、待ち時間を利用して周辺をうろうろした。大寒の期間であるにもかかわらず、春とまごう暖かな日だった。ありがたいけど少し気味が悪い。 安祥城址公園とブログタイトルしたが、あとで出てくる絵地図によれば歴史博物館、市民ギャラリー、公民館などの施設とまとめて「安祥文化のさと」と称しているらしかったのでカッコに入れた。 安城市は拙宅から近いにもかかわらず、名古屋鉄道南安城駅の西側にある同市中心部の方ばかり行って城址公園のある東側には行ったことがなかった。 安城市歴史博物館の電柱広告。初めての場所なので、こういうものがあると助かる。 さらに少し歩くと、看板が出ていた。 安城市歴史博物館の石刻門標。あとでGoogleマップで確認したところ、このあたりが敷地のほぼ北端のようだっ

      安祥城址公園(安祥文化のさと)を散策した - 🍉しいたげられたしいたけ
    • AdobeのOCR機能付きiPhone用スキャナーアプリ「Adobe Scan」でAIを利用し見開き書籍の歪みを補正する新機能のBetaテストが開始。

      AdobeのOCR機能付きスキャナーアプリ「Adobe Scan」でAIを利用し見開き書籍の歪みを補正する新機能のBetaテストが開始されています。詳細は以下から。 Adobeは日本時間2024年02月22日、iPhoneやiPadのカメラを利用し、撮影した書類や領収書、書式、身分証明書、ホワイトボードなどをテキスト検索可能なPDFに変換してくれるOCR機能付きスキャナーアプリ「Adobe Scan」をバージョン24.02.22へアップデートし、新たにAIを利用した見開き書籍の歪み補正機能を追加したと発表しています。 新機能 – 書籍モードでページの歪みを補正 書籍モードでページをスキャンしながら、AI を利用した新しい歪み補正機能を使用できるようになりました (Beta)。この機能を有効にすると、書籍の曲がったページを検出して滑らかにし、スキャンをより平坦で読みやすくすることができます。

        AdobeのOCR機能付きiPhone用スキャナーアプリ「Adobe Scan」でAIを利用し見開き書籍の歪みを補正する新機能のBetaテストが開始。
      • クラスメソッド データアナリティクス通信(機械学習編) – 2024年1月号 | DevelopersIO

        2023年12月分のAWSおよびGoogle Cloudの機械学習関連サービスのアップデート情報をお届けします。 データアナリティクス事業本部 インテグレーション部 機械学習チームの鈴木です。 クラスメソッド データアナリティクス通信(機械学習編) の2024年1月号です。2023年12月分のアップデート情報をお届けできればと思います。 はじめに AWSでは、SageMakerのトレーニングジョブへのログインや、コンテナビルド・動作検証のためのStudio Local Mode機能の提供がありました。コンテナを使うことで実行環境に依存せずSageMakerで機械学習処理を実行できていましたが、一方でトラブルシュートがしにくいという難点がありました。これらの機能を使うことにより、大きくSageMakerでのコンテナ利用がしやすくなりました。 Google Cloudでは、LLMの強力なアップ

          クラスメソッド データアナリティクス通信(機械学習編) – 2024年1月号 | DevelopersIO
        • 物件仕入管理サービス「TASUKI TECH LAND」生成AIとOCRを組み合わせた新機能がソフトウェア関連発明特許を取得

          物件仕入管理サービス「TASUKI TECH LAND」生成AIとOCRを組み合わせた新機能がソフトウェア関連発明特許を取得~ 非定型フォーマットのOCR読取りを実現し登録工数を削減 ~ 株式会社タスキ(本社:東京都港区、代表取締役社長:柏村 雄、証券コード:2987)の子会社である「株式会社ZISEDAI(本社:東京都港区、代表取締役社長:柏村 雄)」が物件仕入管理サービス「TASUKI TECH LAND」に実装した生成AIとOCRを組み合わせた新機能「生成AI-OCR読取」は、ソフトウェア関連発明特許を取得いたしました。 ◆ 特許概要 特許番号   :特許第7430437号(P7430437) 発明の名称  :印刷物に印刷された文字情報を収集する方法、プログラム及び情報処理装置 特許権者   :株式会社ZISEDAI ◆特許取得機能について OCR(Optical Character

            物件仕入管理サービス「TASUKI TECH LAND」生成AIとOCRを組み合わせた新機能がソフトウェア関連発明特許を取得
          • 『AI博覧会 Summer 2024』生成AIやLLMなど注目の講演を紹介 NVIDIA・Google Cloud・PFN・AWS・住友生命・戸田市・横須賀市ほか - ロボスタ ロボスタ - ロボット情報WEBマガジン

            AIポータルメディア「AIsmiley」を運営するアイスマイリーは、2024年8月29日(木)~8月30日(金)に『AI博覧会 Summer 2024』を開催する。 「AI博覧会 Summer 2024」は、AI・人工知能に焦点を当てた展示会。生成AIや大規模言語モデル、最新のAI技術やAI活用、プロジェクト、業界のトレンドにフォーカスしている。日本国内のAI関連企業や専門家が集まり、展示、講演(カンファレンス)、デモンストレーション等が行われる。 そのカンファレンスのスピーカーが続々と公開されている。ビジネスを変革させるカギとなる最先端のAIトレンド情報を収集できる絶好の機会となる。出展社は約100社、約150製品以上が展示される予定。 会場はベルサール渋谷ファースト。参加は無料、参加登録受付中。事前登録はこちらから。 概要と出展対象品目 生成AI、LLM、RAG構築、ファインチューニン

              『AI博覧会 Summer 2024』生成AIやLLMなど注目の講演を紹介 NVIDIA・Google Cloud・PFN・AWS・住友生命・戸田市・横須賀市ほか - ロボスタ ロボスタ - ロボット情報WEBマガジン
            • カラクリ、AIエージェントとして使える国産LLMを一般公開 外部ツールを活用して作業代行

              カラクリは、Function callingとRAGに対応した国産LLM「KARAKURI LM 8x7B Instruct v0.1」を公開した。 KARAKURI LM 8x7B Instruct v0.1は、様々なアプリケーションを人間に代わって操作するAIエージェントとしての活用が可能。そのため、生成AIをビジネス実装をする際に、従来の国産モデルであれば必要だった「業界・企業特有のタスクのプログラミング」など、導入の手間やコストを削減できるという。 同モデルは、Function callingを学習させていることから、外部ツールを活用できる点が特徴。ユーザーの指示から「どのドキュメントを、どのデータベースから検索するのが最適か」をLLM自身が自動的に選択でき、幅広い領域での自動化を促進するという。 カスタマーサポート業界のAIエージェント活用例 高度な顧客対応:顧客から問い合わせに

                カラクリ、AIエージェントとして使える国産LLMを一般公開 外部ツールを活用して作業代行
              • 快活CLUBをお得に使う料金表を作ってみた - 43号線を西へ東へ

                車でPC作業すると腰が痛むので、最近は駐車場が完備されたコメダや快活CLUBを活用するようになりました。 また夏場の車内はエアコンを動かすために、ハイブリッド車と言えどもエンジンが頻繁に回ります。温暖化のためにも車で仕事するより、人のいる涼しいところにいるのは地球のためにも良さそうです。 とは言いつつ、快活CLUBなどのネットカフェ系は、従量制料金とパック料金の組み合わせで料金が発生します。何分いればパック料金にした方が安いのか、計算してみました。 計算方法 用意するもの ChatGPTへの指示 1. 画像内テキストのOCR 2. 料金の計算を指示 結果:1時間30分以上いるなら3時間パックとほぼ同じ まとめ 計算方法 今回は国道2号西宮店の料金表を使用し、平日の料金表を拡張します。Excelで計算式を書けば簡単にできる作業です。今回はあえてChatGPTを使って作業いたしました。 用意す

                  快活CLUBをお得に使う料金表を作ってみた - 43号線を西へ東へ
                • OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる

                  先日のOpenAI DevDayで、GPT-4 Turbo with visionというものが発表されました。Chat Completions APIで画像ファイルをインプットとして渡して、画像解析をしてくれるAPIです。 私は以前、「Azure Computer Vision APIの日本語OCR機能を使ってみる」や「Google Cloud Vision APIの日本語OCR機能を使ってみる」で、各クラウドの画像認識APIの日本語OCR機能を検証するエントリーを書きました。OpenAIも画像認識APIが使えるようになったので、まったく同じ検証方法で評価してみました。 GPT-4 Turbo with vision OCR機能の利用 OpenAIのAPI Keyを準備します。API Keyを取得されていない方は、「OpenAI API Key取得」で検索してください。 今回の検証コードは

                    OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる
                  • Google CloudでOCR!Document AIとGoogle Cloud Vision APIを触ってみた | DevelopersIO

                    先日、猫が右腕に乗り4.5kgの負荷をかけたままゲームをやり続けました。 右腕だけがムキムキになった気がします。 ▲ こんな可愛い感じなら良かったんだけど こんにちは。データアナリティクス事業本部 インテグレーション部 機械学習チームのShirotaです。 この記事は、ブログリレー『Google CloudのAI/MLとかなんとか』の8本目の記事になります。 今回は、Google CloudでOCR(光学式文字認識)を行えるサービスのうち『Document AI』と『Cloud Vision』を中心に触ってみたのでまとめてみようと思います。 Google Cloudで利用できるOCRについて まずは簡単にOCRについて説明します。 OCRは「Optical Character Recognition/Reader」の略で、画像や物理媒体のドキュメントをカメラやスキャナを用いて画像データとし

                      Google CloudでOCR!Document AIとGoogle Cloud Vision APIを触ってみた | DevelopersIO
                    • 経費精算を変革しながら容易に 外資から国産SaaSへ移行し実現

                      「担当者が年間900時間も費やしていた利用方法の問い合わせへの対応業務がほとんどなくなった。使い勝手にこだわった結果だ」。こう話すのは、花王ビジネスアソシエ ビジネスサポートセンター・会計サービスグループ部長兼花王会計財務部門・経営企画部の上野篤氏だ。 花王はグループ従業員2万人が利用する経費精算システムを刷新した。経費精算システムは通勤費以外の交通費や出張旅費、物品購入といった経費の支払い業務を支援する。 UI(ユーザーインターフェース)をシンプルにすることで使い勝手を追求し、利用者への操作説明を不要にした。加えてAI-OCR(人工知能を活用し光学式文字読み取り)による領収書の自動読み取りや自動入力といった、AI(人工知能)を使った最新技術を取り込んだ機能を実装した。「経費精算業務のDX(デジタル改革)の基盤となるシステムだ」(上野部長)。新たな経費精算システムは、システム開発やクラウド

                        経費精算を変革しながら容易に 外資から国産SaaSへ移行し実現
                      • 経営の「次の柱」を作る上で必要なコト──ARR200億円超えを果たしたマネーフォワード・辻庸介の実践知

                        ALL STAR SAAS FUNDのメールマガジン「ALL STAR SAAS NEWSLETTER」購読登録受付中ALL STAR SAAS FUNDがお届けする 最新SaaSニュース、ブログ記事情報を配信するSaaS業界にいる方は必見のメールマガジン! 2023年11月期の決算において、ついにARR200億円を突破したマネーフォワード。M&Aを含めた新規ビジネスを次々と取り込みながら、非連続的成長と連続的成長を実現し続けてきた、日本でも稀有な一社とも言えるでしょう。 このような強大な成長戦略のためには、何が必要なのでしょうか?「新しいビジネスが生まれる仕組みづくり」や「次の世代を生み出す取り組み」など、思い浮かぶ言葉はあっても、その実践知はまだ見知らぬ人が多いものでしょう。 多くのSaaS起業家が成長の過程でいずれぶち当たる壁。フレームワークもなく、ルールさえない領域で戦い続けるリー

                          経営の「次の柱」を作る上で必要なコト──ARR200億円超えを果たしたマネーフォワード・辻庸介の実践知
                        • ようやく2023年分の確定申告を終えました - やね日記

                          今年に入ってからの2ヶ月は公私共にバタバタでしたが、ようやく確定申告を終えることができました。 サラリーマンの私にとって、確定申告の際に必要なデータは源泉徴収票と医療費、そしてふるさと納税のデータですが、今年はいずれも楽に入手することができました。 源泉徴収票 まずは源泉徴収票ですが、今回の電子申告からあらかじめマイナポータルで紐付けることで、源泉徴収票の情報が申告書作成時に反映されるようになりました。 これまでは、源泉徴収票の現物をiPhoneカメラのOCR機能で読み込んでいましたが、誤認識が多かったので結構訂正をすることが多かったです。 データがダイレクトに反映されることで、細かい訂正をする必要もなく、時間の短縮になりました。 医療費控除 続いては医療費控除。 昨年の日記でも触れましたが、私と妻の医療費の情報をマイナポータルで紐付けしていたおかげでスムーズに家族の医療費データが反映され

                            ようやく2023年分の確定申告を終えました - やね日記
                          • Windows11の標準機能で、テキスト認識(OCR)をおこなう - 43号線を西へ東へ

                            Windows11の純正機能でテキスト認識(OCR機能)することが可能です。その方法を備忘録的にまとめます。 前回、iPhoneでスクリーンショットや写真からテキストを認識する方法をまとめました。その続きになります。 iPhoneでテキスト認識表示(ライブテキスト)を使いこなす - 43号線を西へ東へ Snaping toolとは Snaping toolの起動方法 ショートカットキーを使う起動方法 WInキーから起動すると3/5/10秒後のキャプチャがとれる Snapping ToolのOCR機能を使ってみる メールアドレスや電話番号をマスクするクイック編集?をやってみる リンク まとめ Snaping toolとは Windows純正のスクリーンショットの撮影などが可能なツールです。 Snaping toolの起動方法 ショートカットキーを使う起動方法 [Win]+[Shift]+[S

                              Windows11の標準機能で、テキスト認識(OCR)をおこなう - 43号線を西へ東へ
                            • Cyberbullying Gone Global: Fediverse Spam and Operation Beleaguer

                              On February 15th, newly-created Fediverse accounts started posting spam messages from various instances, sending invites to a Discord server for a Japanese troll organization. This spam was widespread across the Fediverse. The posts frame ap12 from “KuronekoServer” as the culprit behind the operation. Looking at their spam content (in Japanese), it’s obvious that it’s not just any typical spam. An

                                Cyberbullying Gone Global: Fediverse Spam and Operation Beleaguer
                              • ノートアプリUpNoteのメリット・デメリット

                                ※この記事は、ノートアプリ探している人向けです。 UpNote(アップノート)を使っているコバヤシ(@BizHack1)です。 今回は、ノートアプリUpNoteのメリット・デメリットを解説します。 UpNoteとは? 動作が軽く、シンプルな文章向きのノートアプリで、ここ数年Evernoteの代わりとして個人利用者からの需要が高まっています。UpNote より、ダウンロードすることができます。 Best Notes App - Write and Organize with UpNoteUpNote is a clean and beautiful app for writing and organizing notes. It’s easy to use with rich features and delightful...getupnote.com 関連記事:Evernote乗り換え【

                                  ノートアプリUpNoteのメリット・デメリット
                                • スタートアップCTOたちが語り合う、ChatGPT活用法 LayerX・ファインディにおける、プロダクト開発事例

                                  登壇者の自己紹介 松田敦義氏(以下、松田):それでは簡単に、松本さんから自己紹介をお願いします。 松本勇気氏(以下、松本):みなさん、こんばんは。あらためまして、LayerX代表取締役CTOの松本です。自己紹介としては、今日のお題目に関連するところだと、LayerX LLM Labsという、呼びにくいので最近は社内で「L3」と略したりしているラボで、大規模言語モデルや、「ChatGPT」、GPT-3、GPT-4だけじゃなく、例えば「PaLM 2」などの次世代言語モデルといった、最先端の言語モデルの利活用を目指していこうねというところで研究開発をやっています。 LLM Labsを始めたのが2023年の4月だったのですが、「もうこれを事業として本格的にやろうぜ」といきなり始まりそうなので、人を探していたりもします。みなさま、本日はよろしくお願いします。 (会場拍手) 佐藤将高氏(以下、佐藤):

                                    スタートアップCTOたちが語り合う、ChatGPT活用法 LayerX・ファインディにおける、プロダクト開発事例
                                  • 熊本大学とTOPPAN、くずし字対応のAI-OCRを用いて「細川家文書」約5万枚の全文テキスト化に成功

                                      熊本大学とTOPPAN、くずし字対応のAI-OCRを用いて「細川家文書」約5万枚の全文テキスト化に成功
                                    • GPT‑4oで面白かった・気になった事例まとめ - Qiita

                                      はじめに GPT‑4oが来ましたね!! 早速色々な使い方をされている方を見つけたのでまとめてみました。 公式ではリアルタイム翻訳や歌っている動画がありましたが、まだ試せないので、以下の事例には書いていません。 GPT-4o GPT-4o日本語まとめ 処方箋読み込み(OCR機能) 漫画を読解(OCR機能) GPT-4oに一瞬騙されかけた話(OCR機能…じゃなかった!) ペーパープロトタイピングから最初のHTML書き起こし 簡単なゲームを作成 カロリー推定アプリを作ってみる 終わりに まだ公開されて1日も経っていないので数は少ないのですが、これから続々と皆さんの試した結果が出てくると思います…! また思い立ったら更新しに来ます。 今後が色々楽しみですね!

                                        GPT‑4oで面白かった・気になった事例まとめ - Qiita
                                      • GPT-4o のマルチモーダル機能をさっそく試す - Qiita

                                        1. この記事の内容 OpanAI から 2024.5.15 に新しい大規模言語モデル「GPT-4o」が出たので、以前書いた「GPT-4V に入門してみる」記事と同様の検証をもう一回 GPT-4o でやってみて比較する記事となります 結論から言うと「GPT-4oが圧倒的に強い」です。(わかり切った話ですみません) 2. GPT-4o とは? すでに大量のニュース記事が出ていますので細かく紹介しませんが、以下の公式サイトを貼っておきます。 2-1. 料金 こちらのページを参照されたし 2-2. どのくらいの時点までの知識があるのか? 勿論上にある通りオフィシャルには2023年10月までなのですが、実際どのくらい最近のことまで答えられるのか聞いてみました。 最近の情報まで含めてめちゃくちゃ正確な回答です。いつの間にかWeb検索した情報を踏まえて回答するようになっていました。ハルシオン防止のため

                                          GPT-4o のマルチモーダル機能をさっそく試す - Qiita
                                        • OpenAI Data Partnerships

                                          Working together to create open-source and private datasets for AI training. We are introducing OpenAI Data Partnerships, where we’ll work together with organizations to produce public and private datasets for training AI models. Modern AI technology learns skills and aspects of our world — of people, our motivations, interactions, and the way we communicate — by making sense of the data on which

                                            OpenAI Data Partnerships
                                          • マンションにはホラー~~な住人がいる① 三途の川にいる鬼 part1 (231) - しあすさとくもちゃんの闘病日記

                                            こんにちは。お盆でお忙しい中、いつも読んでくださってありがとうございます。 おはぎでも食べながら、「ーん、またぁ しあすさったら」とか突っ込みを入れながら読んでいただけるとうれしいです。 換気扇 (レンジフードっていうのかな?)が壊れてしまって1年近く放っておいたけれど、冬場に台所の換気扇回さないだけで、カビが生えまくったので、観念して直すことに決めました。いろいろなところに電話して聞いてみたけれど、ずいぶんと値段に差があるので、どうしたらいいのか迷っている しあすさです。ちょっと基本のやり方じゃつかないみたいで、余分に費用がかかりそうです。見積りだけで、神経疲れまっす💦 暑すぎると頭が働かなくなって、岸田首相が変なこと言い出しても、もぉやめてよ~と力なく言って、生ぬるい水を飲んでため息をつく しあすさです (冷たいの飲むと、腸にくるので)。 そういえばマイナンバーカードのデータが100

                                              マンションにはホラー~~な住人がいる① 三途の川にいる鬼 part1 (231) - しあすさとくもちゃんの闘病日記
                                            • 10万回以上DLされてる「UpNote」が便利すぎたので機能や使い方についてご紹介

                                              Evernoteも改悪されちゃたし、ノートアプリの移行先どうしよう… とお迷いのノートアプリ難民のみなさん、こんにちは。 さて、今回は「バチクソ使える!」と最近話題になっているノートアプリ「UpNote(アップノート)」の機能や使い方について紹介しようと思います! ずっと前にはEvernoteも使ってみたことはあるんですが、元から私にはなんとなくフィーリングがあわず。 その後は、NotionとかLifeBearなんかも使ってみたものの、やたらと高機能すぎて使いにくかったり(Notion)、メモの検索システムが搭載されていないのが不便だったり(LifeBear)と、なかなかしっくりと来るものがなかったんです。 それらの不満点をすべて解消してくれるのが、この「UpNote」だったということなんですな。 まじでバチクソ便利すぎて、これはもうみなさんに紹介せずにはいられねえ! ということでさっそく

                                                10万回以上DLされてる「UpNote」が便利すぎたので機能や使い方についてご紹介
                                              • One Capital、国内SaaS市場の動向や2024年における予測をまとめた「Japan SaaS Insights 2024」を公開

                                                Japan SaaS Insightsは、同社が国内SaaS市場の民主化を目指して、年に1回発刊しているレポートで、今回公開された「Japan SaaS Insights 2024」は、以下のような内容となっている。 2023年におけるSaaS市場の予測 答え合わせ 日本のSaaS市場動向 SaaSスタートアップの資金調達/Exit動向 SaaS上場企業のマーケット動向 2024年におけるSaaS市場 5つの予測 前回のJapan SaaS Insightsでは、Horizontal SaaSにおいてSales、Development、Analytics、Security、Automation分野が急成長すると予測していた。しかしながら、SalesやAI/Automationはプロダクト数や評価額の増加がみられたものの、他の領域では急成長が確認できず、この予測は誤っていたといえる。 一方で

                                                  One Capital、国内SaaS市場の動向や2024年における予測をまとめた「Japan SaaS Insights 2024」を公開
                                                • 【ドキュメントスキャナ】ScanSnap S1500からEPSON DS-531に買い替え【自炊】

                                                  古本を触ると体中がかゆくなる。もしかしてダニアレルギーかも? ということで、断捨離もかねて集めてきた本を裁断→ドキュメントスキャナでスキャンしてPDFにしています。 長年愛用していたドキュメントスキャナ ScanSnap S1500ですが、最近給紙の調子が悪いなと思って確認したところ、フィードローラーが加水分解していました。 自炊ブームに乗って2009年に購入し、途中何年か実家に眠らせたりもしましたが、かなり長期間使ってきました。 フィードローラーの加水分解は経年劣化でよくある症状のようで、分解して交換できる互換品のパーツがAmazonで売っています。 修理も考えましたが、今回は新しいEPSON DS-531というドキュメントスキャナを購入してみました。 ScanSnap S1500の加水分解 下記が加水分解しているフィードローラーの写真です。 交換用のフィードローラー(メーカー純正ではな

                                                    【ドキュメントスキャナ】ScanSnap S1500からEPSON DS-531に買い替え【自炊】
                                                  • Kaggle Grandmaster振り返り

                                                    画像系に参加することが比較的多いですが、NLP系も嗜む程度にやったりしてます 参加スタイルはソロで始めてそこそこの順位になったあたりで声かけてもらった方とチームを組むパターンが多いです kaggleとの出会い コンペに興味を持ったきっかけは、kaggleについて紹介しているweb記事をたまたま見かけたことでした。 もともと新卒入社した会社でDeepLearning関連のプロジェクトをやっていたのですが、社内にあまりノウハウが確立されておらず手探りで案件を進める日々を送っていました。自分なりに技術書を読んだり、webにある情報をかき集めたりしながら何とかやっていたものの、我流でやり続けることに漠然とした不安を感じていました。 そんな中、しばらくして転職活動をしてる際にたまたまkaggle取り組みについて紹介している記事を見かけます。kaggle自体は知っていて5年くらい前にアカウントだけ作っ

                                                      Kaggle Grandmaster振り返り
                                                    • Gemini API を使いスマホでスキャンした表やグラフから自動的にスプレッドシートを作ってみる

                                                      Gemini API を少し触ってみて、画像関連でいくつか応用できそうに思えました。 そこで、Google Drive でスキャンした画像(PDF)から自動的にスプレッドシートを作成するような GAS 用スクリプトを試作してみました。 どのようなスクリプト? Google Drive で以下のような画像をアップロード(スキャン)しておくと Gemini API を利用してスプレッドシートを作成します。 図 1-1 紙の表をスキャンしたファイル 図 1-2 紙の表から作成したスプレッドシート また、スキャン元の画像にはグラフも利用できます。ただし、グラフ内に値が表示されていないと多くの場合で正確な値にはなりません。 図 1-3 画面に表示されているグラフをスキャンしたファイル 図 1-4 グラフから作成したスプレッドシート 表として取り込む仕組み(プロンプト) 基本的にはドキュメントに従って

                                                        Gemini API を使いスマホでスキャンした表やグラフから自動的にスプレッドシートを作ってみる
                                                      • 豚の生姜焼きとオールドクロウで! - 私生活を楽しむ日記

                                                        昨夜は、豚の生姜焼きを肴に、松田優作がこよなく愛したバーボンウイスキー「オールド・クロウ」のハイボールで晩酌を楽しみました・・・・ オールドクロウは初めて買ってみたんですが、最初口に含むとほろ苦いような感じですが、、、、 途中チョコのような甘味になり、とても飲みやすいウイスキーでした!! これもナイスなリーズナブルウイスキーです・・・(#^.^#)・・・リピートコレクションの1つになっちゃいます!! 豚の生姜焼きは、、、オールドクロウにジャストミートでした!! 久々に作った締めの麦ごはんも・・・最高ですね!!・・・食事が採れること、飲酒出来ることに感謝です!!! オールド クロウ 40度 箱なし 700ml 正規 shibazaki_OCR 価格:1276円 (2023/12/14 20:15時点) 感想(45件) 【12/15はウイスキーくじ】バーボン ウイスキー オールド クロウ 40

                                                          豚の生姜焼きとオールドクロウで! - 私生活を楽しむ日記
                                                        • GPT-4 Turbo with Visionを使えばOCRの工程が不要になりました|PharmaX Blog

                                                          こんにちは!PharmaXエンジニアリング責任者の上野(@ueeeeniki )です。 PharmaX2023年アドベントカレンダーの前夜祭と題して、フライングで発信していきます! 今回は、2023年11月6日に行われたOpenAI DevDeyで発表されたGPT-4 Turbo with vision APIについての記事です。 PharmaXのユースケースでは、GPT-4 Turbo with visionを使うことでOCRの工程が不要になり、アプリケーションの構成が1ステップ分少なくなったという事例紹介になります。 実際にGPT-4 Turbo with visionでどのようなことができるのか気になっている方や、これまでOCRを使ってアプリケーションを作ってきた方の参考になると嬉しいです。 GPT-4 Turbo with visionとは?GPT-4 Turbo with vis

                                                            GPT-4 Turbo with Visionを使えばOCRの工程が不要になりました|PharmaX Blog
                                                          • 『般若心経』の敦煌写本@フランス国立図書館を大正新脩大蔵経と比較できるツール - digitalnagasakiのブログ

                                                            このところ、少しずつ時間をみつけて改良を続けている、「大正新脩大蔵経と他の木版・写本を簡単に比較できる仕組み」ですが、表示を高速化できるように色々工夫を行いまして、割とお待たせせずに表示できるようになりつつあります。 それから、「木版大蔵経の版まるごと」の比較だけでなく、個々の経典の写本や版本でも対比できるように、全体的に枠組みを拡張しました。まずはお試し版ということで、短いけど有名なテキスト『般若波羅蜜多心経』で、フランス国立図書館に所蔵されている敦煌写本ペリオコレクションから2つの写本を組込んでみました。以下の画像で、左上の「大蔵経一覧」のところを選ぶとそれぞれの版と大正新脩大蔵経が表示できるようになっています。 https://sate.dhii.jp/VIEW/ZJK/TID/T0251_.08.0848c04 これらのテキストでは、黄色いマーカーがついていますが、そのうちで、「@

                                                              『般若心経』の敦煌写本@フランス国立図書館を大正新脩大蔵経と比較できるツール - digitalnagasakiのブログ
                                                            • GitHub - yuka-friends/Windrecorder: Windrecorder is a memory search app by records everything on your screen in small size, to let you rewind what you have seen, query through OCR text or image description, and get activity statistics. Developed as MacOS

                                                              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                GitHub - yuka-friends/Windrecorder: Windrecorder is a memory search app by records everything on your screen in small size, to let you rewind what you have seen, query through OCR text or image description, and get activity statistics. Developed as MacOS
                                                              • GPT4-Vで画面設計書から画面を生成させる - Qiita

                                                                はじめに これまで設計書からプログラム、構成図からIaCなど、GPT4-Vで画像を使ったケースを取り扱ってきました。今回は画面設計書みたいなものから画面のコードを生成させてみたいと思います。 なお、生成するコードはSvelteコンポーネントです。 画面設計書 本当は日本語が良かったのですが、日本語OCRの精度に不安があったので英語で記載しました。なお、英語もChatGPTで日本語をもとに翻訳したものをそのままいれています。 DallePanel.svleteというSvelteコンポーネントについて、画面の構成と、動作に関する説明などを右側にいれています。右側の説明は画像にいれなくてもプロンプトに入れてもいいかなと思いましたが、とりあえず画像です。 ともすればfigmaとかでもいいじゃないかっていう話もありますが、動作含めて画像にすることを今回試します。 説明の内容は日本語(翻訳前)だと以下

                                                                  GPT4-Vで画面設計書から画面を生成させる - Qiita
                                                                • ネット広告の“勝利の方程式”をAI予測 サイバーエージェント独自システムの中身を解き明かす

                                                                  AIを使えばインターネット広告の効果を“爆上げ”できるのでは?――マーケティングに携わる人なら一度は考えそうなこのアイデア。すでに取り組んで成果を出している企業がある。それがサイバーエージェントだ。 同社はインターネット広告の配信効果をAIで予測する「極予測AI」を2020年に開発した。効果が高い広告の制作を支援すべく、ChatGPTなどの生成AIを使ったキャッチコピーや商品画像の自動生成にも乗り出している。 極予測AIによってサイバーエージェントの広告制作はどう変わったのか。外部には非公開だという極予測AIのシステムの一部を、ITmedia主催のオンラインイベント「デジタル戦略EXPO」(2月25日まで)の特別講演で明かした。 効果1位の広告を超えろ! AIで変わる広告制作 運用型広告を採用したら、効果を上げるために露出するターゲットに合わせて画像や動画など多種多様なクリエイティブを用意

                                                                    ネット広告の“勝利の方程式”をAI予測 サイバーエージェント独自システムの中身を解き明かす
                                                                  • 熊本大学とTOPPAN、くずし字AI-OCR活用した古文書の大規模調査のための独自手法を開発

                                                                    【概要説明】 国立大学法人 熊本大学(所在地:熊本県熊本市、学長:小川久雄、以下熊本大学)とTOPPAN ホールディングスのグループ会社であるTOPPAN 株式会社(本社:東京都文京区、代表取締役社長:齊藤昌典、以下 TOPPAN)は、熊本大学が公益財団法人永青文庫から寄託を受けている歴史資料『細川家文書(ほそかわけもんじょ)』のうち、専門家でも解読が困難な難易度の高いくずし字で書かれた約5 万枚の未解読の古文書(藩政記録)をAI-OCR を用いて短期間で解読し、約950 万文字のテキストデータを生成することに成功しました。 さらに、くずし字資料の解読システムと連動するキーワード検索システムを構築することにより、江戸時代前期の細川藩領国(小倉領40 万石から熊本領54 万石)の、約90年間にわたるあらゆる社会的事件や統治制度の変容を示す記述を含んだ資料を即時に検索収集できるようになりました

                                                                      熊本大学とTOPPAN、くずし字AI-OCR活用した古文書の大規模調査のための独自手法を開発
                                                                    • 2024年最新版 金融・保険 AI導入事例カオスマップを公開!「生成AI」「ChatGPT」等、カテゴリに分類し全105事例を掲載!

                                                                      AI・人工知能のAIsmiley TOP ニュース 2024年最新版 金融・保険 AI導入事例カオスマップを公開!「生成AI」「ChatGPT」等、カテゴリに分類し全105事例を掲載! 2024年最新版 金融・保険 AI導入事例カオスマップを公開!「生成AI」「ChatGPT」等、カテゴリに分類し全105事例を掲載! 最終更新日:2024/01/11 AIポータルメディア「AIsmiley」は、全国の金融機関・保険業界のAI・DX導入事例をまとめたカオスマップを公開します。カオスマップを資料請求いただいた方には導入事例一覧(Excel)も無償提供いたします。 カオスマップと事例集を資料請求する ■2024年最新版 金融・保険 AI導入事例カオスマップ こちらのカオスマップは金融機関・保険業界のAI導入やDX事例の中から、最新のChatGPT連携サービスや生成AI、チャットボット、OCR、不

                                                                        2024年最新版 金融・保険 AI導入事例カオスマップを公開!「生成AI」「ChatGPT」等、カテゴリに分類し全105事例を掲載!
                                                                      • ChatGPTとPydanticでかんたん契約書解析 - MNTSQ Techブログ

                                                                        こんにちは、MNTSQでアルゴリズムエンジニアとチームマネージャーをやっている平田です。 MNTSQでは自然言語処理を使って契約書を解析したり検索したりする機能を開発しています。 契約書解析には、次のようなタスクがあります。 秘密保持契約等の契約類型に分類 契約締結日や契約当事者等の基本情報を抽出 条項(第1条, 第2条, ...)単位で分解 本稿では、これらの契約書解析タスクをGPT-4oに解かせてどんな結果になるか見てみます。 ざっくりやり方 GPT-4oのAPIを呼び出すところ ここではAzure OpenAIのGPT-4oを使います。Microsoftのサンプルコードほぼそのままですが、一応貼り付けておきます。 from openai import AzureOpenAI client = AzureOpenAI( api_version="2023-05-15", azure_e

                                                                          ChatGPTとPydanticでかんたん契約書解析 - MNTSQ Techブログ
                                                                        • Nougat: Neural Optical Understanding for Academic Documents

                                                                          Scientific knowledge is predominantly stored in books and scientific journals, often in the form of PDFs. However, the PDF format leads to a loss of semantic information, particularly for mathematical expressions. We propose Nougat (Neural Optical Understanding for Academic Documents), a Visual Transformer model that performs an Optical Character Recognition (OCR) task for processing scientific do

                                                                          • 商標ウォッチbot on X: "出願日:2020-10-08 出願人:群馬電機株式会社 区分:第35類(広告・事務) 商品役務:飲食料品の小売又は卸売の業務において行われる顧客に対する便益の提供 ほか10 タイプ:音商標 OCRテキスト:Sym pnm 続き https://t.co/Y5nHSIbUCh https://t.co/fKXalWVVYy"

                                                                            • シリーズA “102億円調達”のLayerXーーAIがレガシー業務を一気に変える(後編) - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                                                              LayerX代表取締役(CEO)の福島良典氏 シリーズAラウンドで102億円の資金調達をクローズさせたLayerX、代表取締役の福島良典さんのインタビュー後半をお届けします。前半ではここ数年、キーワードとして挙がっている「コンパウンド」の戦略をなぜ必要としたのか、その考え方についてお聞きしました。後半では、バクラクを中心にLayerXがどこまで拡大するのか、その要因となりうるAI、地域戦略、開発計画についてお答えいただいています。(太字の質問は全て筆者。回答は福島さん) コンパウンドの考え方でLayerXのプロダクトラインアップを考えた場合、法人の支払い、つまり企業の血流でもあるお金の流れがひとつポイントになるかなと思ってます。ただ、これは言ってみればすべての部門に関係があるわけで、どのような粒度でサービスを開発していくのか、その判断基準が気になります。 福島:この部分はシンプルでユーザー

                                                                                シリーズA “102億円調達”のLayerXーーAIがレガシー業務を一気に変える(後編) - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                                                                              • 生成AIで、セキュリティの「潜在的な侵害シナリオ」を予測 データ流出のリスクを軽減する新たな仕組み

                                                                                連日さまざまなサイバーセキュリティ犯罪のニュースが報じられる中、いまだに日本のセキュリティレベルは高いとは言えない状況にあります。一方で、企業がサイバーセキュリティ対策を進める上では、人材不足や経営層の意識・関心、コスト、導入による利便性の低下など、さまざまな壁が立ちはだかっています。 そこで今回は、株式会社網屋が主催する「Security BLAZE 2023」より、サイバーセキュリティのエキスパートによる講演をお届けします。本記事では、ゼットスケーラー株式会社の三浦マーク氏が、AIを活用した先進的なクラウドセキュリティの実例を紹介します。 Fortune500の4割を顧客とする、クラウドセキュリティ企業 三浦マーク氏:私、ゼットスケーラー・パートナーソリューションアーキテクトの三浦と申します。本日は「真のDXの鍵はOne True Zero」というテーマで、弊社のAIを使った最新のセキ

                                                                                  生成AIで、セキュリティの「潜在的な侵害シナリオ」を予測 データ流出のリスクを軽減する新たな仕組み
                                                                                • 一般財団法人人文情報学研究所(監修)大向一輝/永崎研宣/西岡千文/橋本雄太/吉賀夏子(編)『IIIF[トリプルアイエフ]で拓くデジタルアーカイブ コンテンツの可能性を世界につなぐ』(文学通信)

                                                                                  文学通信|多様な情報をつなげ、多くの「問い」を世に生み出す出版社 日本語・日本文学の研究書を中心に、人文学書全般を刊行する出版社、文学通信のブログ。 文学だけにこだわらず周辺領域も含め、意欲的に刊行していきます。 出版活動と同様に、webでも積極的に活動することで、多様な情報をつなげ、多くの「問い」を世に生み出していきたいと思います。 〒113-0022 東京都文京区千駄木2-31-3 サンウッド文京千駄木フラッツ1階101 電話03-5939-9027 FAX03-5939-9094 info@bungaku-report.com インボイス登録番号:T4011501023591 ホーム 一般財団法人人文情報学研究所(監修)大向一輝/永崎研宣/西岡千文/橋本雄太/吉賀夏子(編)『IIIF[トリプルアイエフ]で拓くデジタルアーカイブ コンテンツの可能性を世界につなぐ』(文学通信) Twee

                                                                                    一般財団法人人文情報学研究所(監修)大向一輝/永崎研宣/西岡千文/橋本雄太/吉賀夏子(編)『IIIF[トリプルアイエフ]で拓くデジタルアーカイブ コンテンツの可能性を世界につなぐ』(文学通信)