並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 24 件 / 24件

新着順 人気順

OCRの検索結果1 - 24 件 / 24件

  • 【MiniCPM-Llama3-V 2.5】たった8BでGPT-4o超えのVLM | WEEL

    WEELメディア事業部LLMライターのゆうやです。 MiniCPM-Llama3-V 2.5は、中国のOpenBMB(Open Lab for Big Model Base)が開発した最新のオープンソースマルチモーダル言語モデルで、8BというサイズながらGPT-4Vと同等の性能を有しています。 🚀 Excited to introduce MiniCPM-Llama3-V 2.5! With 8B parameters, it’s our latest breakthrough, outperforming top models like GPT-4V. 📈 💪 Superior OCR capabilities 🔑 Supports 30+ languages HuggingFace:https://t.co/Skivve1BgN GitHub:https://t.co/x868

    • IIIF[トリプルアイエフ]で拓くデジタルアーカイブ 一般財団法人人文情報学研究所(監修) - 文学通信

      紹介 「デジタルアーカイブ」をより多くの人に使ってもらえる、よりよいものにしたい―― それを目指した世界中の人々が集まって創られ、広まってきている枠組み、IIIF(トリプルアイエフ : International Image Interoperability Framework)を紹介し、その概要、構築方法、活用例を紹介・解説する初の書。 第1部ではIIIFの概要の紹介、第2部ではIIIFに対応したデジタルアーカイブの構築手法、第3部では、具体的なIIIFの活用例を扱う。加えて、インタビューやいくつかのコラムも掲載。 コンテンツのよりよい在り方やさらなる利活用を考える方に。公共図書館、大学図書館、ほかデジタルアーカイブに関わる方必携の書。 執筆は、大向一輝、永崎研宣、西岡千文、橋本雄太、吉賀夏子、本間淳、鈴木親彦、三原鉄也、高橋洋成。 【IIIFの素晴らしいことの一つは、「自分の(ここでは

        IIIF[トリプルアイエフ]で拓くデジタルアーカイブ 一般財団法人人文情報学研究所(監修) - 文学通信
      • 快活CLUBをお得に使う料金表を作ってみた - 43号線を西へ東へ

        車でPC作業すると腰が痛むので、最近は駐車場が完備されたコメダや快活CLUBを活用するようになりました。 また夏場の車内はエアコンを動かすために、ハイブリッド車と言えどもエンジンが頻繁に回ります。温暖化のためにも車で仕事するより、人のいる涼しいところにいるのは地球のためにも良さそうです。 とは言いつつ、快活CLUBなどのネットカフェ系は、従量制料金とパック料金の組み合わせで料金が発生します。何分いればパック料金にした方が安いのか、計算してみました。 計算方法 用意するもの ChatGPTへの指示 1. 画像内テキストのOCR 2. 料金の計算を指示 結果:1時間30分以上いるなら3時間パックとほぼ同じ まとめ 計算方法 今回は国道2号西宮店の料金表を使用し、平日の料金表を拡張します。Excelで計算式を書けば簡単にできる作業です。今回はあえてChatGPTを使って作業いたしました。 用意す

          快活CLUBをお得に使う料金表を作ってみた - 43号線を西へ東へ
        • SBC6802 plus Bus、Altair Basic、スタートレック

          電脳伝説様作の SBC6800 向けに、はせりん様が Altair 680 Basic パッチを作成されました。2021 年版 sbc6800 データパックに含まれています。 Altair 8800/680 の当時(1976 年頃)は、Basic インタプリタを実行できる環境を整えるのに相当な投資が必要だったという話です。CPU、メモリ、I/O モジュール、端末コンソール、記憶装置(紙テープまたは CMT?)それぞれの機材が今よりはるかに大掛かりだったので、一式揃えて動かすのは大仕事だったことでしょう。今では 10cm 角基板の SBC とノート PC、USB-シリアルインターフェイスケーブルだけで準備が整います。 Altair Basic を 32KB RAM で使用する この Altair 680 Basic パッチは SBC6800 対応ということで、以前の投稿で紹介した SBC68

            SBC6802 plus Bus、Altair Basic、スタートレック
          • 「Spiritual Unfoldment Two」到着中ですが英文の見直しがキツすぎるので困ってます(祈)† | 「皇族は強姦殺人魔」山を愛する霊覚者・たきざわ彰人です(祈)†

            さぁ安かったので入手しましたがどうしたもんでしょう。ホワイトイーグル霊の書籍の訳者の訳文がどうにも気に入らないので自分でGoogle翻訳を使用して日本文にしようと思っての入手だったのですが、英文のOCR変換テキスト見直しがメチャ時間がかかるキビシイ作業という事が分かってしまいましたので、チョト一旦止めましょう。書籍入手も一旦止めましょう。もう予定の書籍は全て入手済ですので。この本はペライですね。 今月は書籍関連で出費がかさんでしまいましたので新規WordPress立ち上げはモチョト待ちましょう、いくつか支払いが発生してしまいますので。脱出のあるアイデアが初期投資が高すぎてどうしても実行できず、それ以外の方法で模索してWordPress新規立ち上げと言い出したのです。 もしこの作戦で脱出を本当に実現させるとしても1年以上かかります、イヤ、すごく上手く行って1年という意味で、全然脱出につながら

            • HTMLで作成しOCR回避 ~ 新たなQRコードフィッシング手法 | ScanNetSecurity

                HTMLで作成しOCR回避 ~ 新たなQRコードフィッシング手法 | ScanNetSecurity
              • 週刊生成AI with AWS – 2024/7/1週 | Amazon Web Services

                Amazon Web Services ブログ 週刊生成AI with AWS – 2024/7/1週 みなさん、こんにちは。AWS ソリューションアーキテクトの小林です。 7月になりましたので、AWS公式ウェブマガジン”builders.flash“で新しい記事が公開されましたので、今月も生成AIに関連するものをピックアップしてみましょう。 Amazon Bedrockを活用して3Dキャラクターと対話するサービスを構築する(ピクシブ株式会社様) ガーデニングの新時代!Amazon Bedrock で理想の庭を実現してみた ~GreenSnap株式会社による生成AI実装解説~(GreenSnap株式会社様) 生成AIで飲みニケーション対策!無料の生成AIプレイグラウンドPartyRockで新入社員がアプリを作ってみた! ひとつめの記事はピクシブ株式会社様に寄稿いただいたものです。ピクシブ株

                  週刊生成AI with AWS – 2024/7/1週 | Amazon Web Services
                • 日本語字幕が出ない(英語は可能です。)外国のDVDを、なんとか同時に日本語で理解出来ないものかと…。 - 同時に日本語で読... - Yahoo!知恵袋

                  <方法1 英語字幕のテキスト化→日本語への翻訳> DVDに英語字幕があっても,規格上,画像ベースの字幕(画面の上に文字が表示されていても「絵」としての文字。内部的にテキスト情報ではない)なので,そのままでは日本語への翻訳に利用できません。DVDの暗号を解除し(違法),SubRipというソフトで英語字幕を抽出してOCRにかけてテキストベースの字幕ファイル(SRT形式)にすれば,それを他方リッピング(違法)したMP4ファイルと合わせ,PotPlayerのリアルタイム翻訳機能で日本語字幕での視聴が可能です。英語字幕の精度が良いので,翻訳の仕上がりもましになるのが利点ですが,(映像および)字幕抽出部分が違法なので,すすめられません。 <方法2 音声認識による英語字幕の作成→日本語への翻訳> 現状ですすめられるのは,音声認識技術を用いて英語で自動文字起こしをし,それを機械翻訳にかけるという方法です。

                    日本語字幕が出ない(英語は可能です。)外国のDVDを、なんとか同時に日本語で理解出来ないものかと…。 - 同時に日本語で読... - Yahoo!知恵袋
                  • CamScanner

                    手間をかけずにドキュメントをスキャンする CamScanner strong>は、無料の生産性ソフトウェアです。キャプチャした画像をきれいなデジタル写真に変換します。 INTSIGによって開発されたこの画像スキャナープログラムは、高品質のスキャン画像とドキュメントのフォーマット、変換 strong>機能、ドキュメントの編集 strong>機能、さらにはテキスト認識。 p> Adobe Scan と同様に、CamScannerは移植性が高いように設計されています使いやすいです。実際のスキャナーマシンを所有していない場合や、現在外出中の場合は、急いで仕事をするのに最適です。 PC、モバイル、ウェブブラウザの両方で利用できますが、PCバージョンはオンラインファイル管理のみを行うことに注意してください。 CamScannerは安全ですか? h3> CamScannerは、その使いやすさとHD画像変

                    • QNAPがNAS製品でAI機能を強化、画像認識や検索を高速化

                      QNAPは、同社のNAS製品におけるAI機能を活用し、ストレージの使い勝手の向上に積極的に取り組んでいる。その意図はどこにあるのだろうか? 先頃、台湾・台北市で開催されたCOMPUTEX TAIPEI 2024のQNAPブースで、その一端を垣間みることができた。 QNAPはNAS製品においてもAI機能を強化すべく、NPU(Neural network Processing Unit)を搭載した製品の拡充を図っており、これらの製品を利用することでNASに保存された大量のデータの中からユーザーが求めるデータを見つけやすくすることを可能にするオリジナルのAIアプリも展開している。 そのひとつが写真検索・管理アプリの「QuMagie」だ。このアプリは、NASに写真や動画ファイルを保存すると自動的にタグ付けを行ない、撮影日や被写体などの単位でフォルダー分けをしてくれる。そのうえ、AI機能を活かして特

                        QNAPがNAS製品でAI機能を強化、画像認識や検索を高速化
                      • GPT4o の画像解析でレシートを読み取る bot を作ってみた - 虎の穴開発室ブログ

                        こんにちは。虎の穴ラボ エンジニアのS.Aです。 本記事は虎の穴ラボ2024年夏の連載ブログ 9日目の記事です。 前回はT.Hさんによる「【Phaser3 + Whisper + OpenAI API】ブラウザゲームを音声認識で動かしてみた」でした。 次回はA.Mさんによる「Gemini APIを触ってみる」が投稿予定です。 今回は ChatGPT の最新モデル GPT4o の画像解析を使って、レシートの内容をスプレッドシートに書き出してくれる bot を作ってみました。 その過程で GPT4o の API の使い方などの知見を得たので備忘も兼ねてご紹介しようと思います! bot を作ろうとしたきっかけ 最初に今回の bot を作ろうと思い立ったのは、Web 版のChatGPTで GPT4o の画像解析を試してみた時でした。 正確に内容読み取ってくれないだろう...と思いながらスマホで撮影

                          GPT4o の画像解析でレシートを読み取る bot を作ってみた - 虎の穴開発室ブログ
                        • AI-OCR(文字認識)サービス - LINE WORKS OCR - WCS

                          LINE WORKS OCRは、紙面・画像に記載された文字・文章をテキストデータへ変換するAI-OCRです。 方法はかんたん。PDFやスキャン、スマホで撮影した画像データなどを読み取るだけ。 フォーマットが決まっている帳票はもちろん、あらゆるスタイルの文字を素早くテキスト化し、 入力作業を大幅に軽減します。

                          • AI inside の AWS 生成 AI 事例:セキュアな生成 AI 環境を実装し、対応帳票テンプレートの大幅な拡充を実現 | Amazon Web Services

                            Amazon Web Services ブログ AI inside の AWS 生成 AI 事例:セキュアな生成 AI 環境を実装し、対応帳票テンプレートの大幅な拡充を実現 本ブログは、AI inside 株式会社と Amazon Web Services Japan が共同で執筆しました。 AI inside 株式会社は、生成AI・LLM や自律型 AI をはじめとした最先端テクノロジーの研究開発と社会実装を行うテックカンパニーです。AI エージェント「Heylix」や AI-OCR サービス「DX Suite」に加え、それらを支える AI インフラ「AnyData」と「AI inside Cube」を、政府機関・地方公共団体・民間企業へ広く提供しています。提供する AI サービスは既に、5 万人を超えるお客様に累計 72 億回以上ご利用いただいています。 直面していたビジネス上の課題

                              AI inside の AWS 生成 AI 事例:セキュアな生成 AI 環境を実装し、対応帳票テンプレートの大幅な拡充を実現 | Amazon Web Services
                            • Claude-3時点でIQ101で人類の平均IQ100を超えた今どうする? | ネットビジネス・アナリスト横田秀珠

                              LINEで更新通知を受け取れます 今朝に飛び込んできた 最新ニュースも解説! イーンスパイアの横田です。 https://www.enspire.co.jp 山形県の南陽市商工会でした。 ありがとうございます。 さて、本題です。 GPT-4超えをアピールするClaude-3がAIで初めてIQ100超えを達成したという報告 https://gigazine.net/news/20240308-claude-3-chat-gpt-iq-test/ 2024年3月8日のニュースですけど 最近セミナーでよく話しています。 https://www.youtube.com/watch?v=orEYJTmrSkg Claude-3時点でIQ101で人類の平均IQ100を超えた今どうする? ネットビジネスアナリスト横田秀珠が、2024年7月8日の配信で、AIの知能指数(IQ)に関する最新情報を共有。Cla

                                Claude-3時点でIQ101で人類の平均IQ100を超えた今どうする? | ネットビジネス・アナリスト横田秀珠
                              • 【MiniCPM-Llama3-V 2.5】たった8BでGPT-4o超えのVLM | WEEL

                                WEELメディア事業部LLMライターのゆうやです。 MiniCPM-Llama3-V 2.5は、中国のOpenBMB(Open Lab for Big Model Base)が開発した最新のオープンソースマルチモーダル言語モデルで、8BというサイズながらGPT-4Vと同等の性能を有しています。 🚀 Excited to introduce MiniCPM-Llama3-V 2.5! With 8B parameters, it’s our latest breakthrough, outperforming top models like GPT-4V. 📈 💪 Superior OCR capabilities 🔑 Supports 30+ languages HuggingFace:https://t.co/Skivve1BgN GitHub:https://t.co/x868

                                • 2024年(令和6年)7月以降のセミナー・講演・企業研修の予定 | ネットビジネス・アナリスト横田秀珠

                                  2024年1月以降のセミナー予定は以下の該当月をクリックで飛びます。 1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月 2025年〜 LINEで更新通知を受け取れます 講演の帰りにスーパーで刺身を買い、 成城石井で好きな惣菜を買いました イーンスパイアの横田です。 https://www.enspire.co.jp 炊いて来たご飯とマイ醤油で 電車飯(笑)の山梨日帰り。 (山梨県)早川町商工会の皆様 ありがとうございました! さて、本題です。 2024年(令和6年)7月以降の セミナー・講演・企業研修など 15分の動画で解説しました。 https://www.youtube.com/watch?v=fQh5-n5s-oY 0:00 導入部分 1:08  山梨県講演後のエピソード 2:18  旅先での食事 3:27  早川町商工会での講演内容 4:36  年内の予

                                    2024年(令和6年)7月以降のセミナー・講演・企業研修の予定 | ネットビジネス・アナリスト横田秀珠
                                  • 90Hz対応「Teclast T50 Max」のメリット・デメリット - 秋葉原ぶらり

                                    90Hzリフレッシュレート対応の「Teclast T50 Max」。早くも「高速で動画視聴も快適そう」と評判です。しかし、その一方で「性能が変わっていない」との口コミもあり、購入を迷っている人もいるのではないでしょうか? そこで今回はその性能を確かめるため、5つの観点で検証していきます。 ディスプレイ リフレッシュレート カメラ デザイン(サイズ・重量) OS また、前モデル「Teclast T50 Pro」との違いや引き継いだメリットも紹介!購入する前に知っておきたいデメリットや評価、詳細な価格情報も掲載しているので、ぜひ参考にしてみてください。 ※本ページはプロモーション(広告)を含んでいます。 「Teclast T50 Max」が発売開始! 2024年7月5日、日本で中国のタブレット製造メーカー Teclast(テクラスト)から新製品「T50 Max」(ティー50 マックス)が発売さ

                                    • Kaggle Grandmaster振り返り

                                      画像系に参加することが比較的多いですが、NLP系も嗜む程度にやったりしてます 参加スタイルはソロで始めてそこそこの順位になったあたりで声かけてもらった方とチームを組むパターンが多いです kaggleとの出会い コンペに興味を持ったきっかけは、kaggleについて紹介しているweb記事をたまたま見かけたことでした。 もともと新卒入社した会社でDeepLearning関連のプロジェクトをやっていたのですが、社内にあまりノウハウが確立されておらず手探りで案件を進める日々を送っていました。自分なりに技術書を読んだり、webにある情報をかき集めたりしながら何とかやっていたものの、我流でやり続けることに漠然とした不安を感じていました。 そんな中、しばらくして転職活動をしてる際にたまたまkaggle取り組みについて紹介している記事を見かけます。kaggle自体は知っていて5年くらい前にアカウントだけ作っ

                                        Kaggle Grandmaster振り返り
                                      • LLM時代のデータ基盤 : 非構造化データを扱うETLプロセスの重要性 #ベッテク月間 - LayerX エンジニアブログ

                                        こんにちは!LayerXのバクラク事業で機械学習・データ周りを担当しております、たかぎわ (@shun_tak) と申します。 みなさま、ChatGPTの登場に衝撃を受け、これを日々の生活やビジネスに活用されていることかと思います。わたしも社内でChatGPT活用の勉強会を開催したところ、大変大きな反響をいただきました。 tech.layerx.co.jp ChatGPTの登場以来、AIを前提としたユーザー体験の構築、すなわちAI-UXの実現を目指すことがLayerX社内の共通認識になりました。LayerXは、プロダクトだけでなくあらゆるビジネスプロセスにおいて、ユーザー体験をAIを前提に再構築するAI Transformation (AX) を推進することで、生産性革命を実現しようとしています。 comemo.nikkei.com AI-UXやAXの実現を通じて、仕事や暮らしの中にある摩

                                          LLM時代のデータ基盤 : 非構造化データを扱うETLプロセスの重要性 #ベッテク月間 - LayerX エンジニアブログ
                                        • Google Merchant Center NextのProduct Studioで商品画像をAIが生成 | ネットビジネス・アナリスト横田秀珠

                                          LINEで更新通知を受け取れます 半年前にChatGPTセミナー したばかりですが再講演した イーンスパイアの横田です。 https://www.enspire.co.jp この半年のアップグレードが凄い。 70名近い参加をいただきました。 ありがとうございます!! さて、本題です。 2024年4月13日、Google Merchant Center が Google Merchant Center Nextに変わりました。 https://merchants.google.com/ その際にProduct Studioが追加されましたが 当時は日本では使えない機能でした。 ところが先日から日本でも使えるようになり Product Studioの生成AIを使って商品画像の 編集が出来るようになりました。 https://merchants.google.com/mc/productstud

                                            Google Merchant Center NextのProduct Studioで商品画像をAIが生成 | ネットビジネス・アナリスト横田秀珠
                                          • 2023年11月に生成AIの民主化を起こしたChatGPTのGPTsとは? | ネットビジネス・アナリスト横田秀珠

                                            LINEで更新通知を受け取れます 午後からの高鍋商工会議所で 生成AIのセミナで講演してきた イーンスパイアの横田です。 https://www.enspire.co.jp かなり完成度が高くなって来ました。 後から反響のメールが届き実感して いますが、ありがとうございます さて、本題です。 2023年11月にOpenAIが発表した オリジナルのGPTsを作成できる GPTsが起こした生成AIの民主化。 会話、SNS、ブログ、YouTube、 HP、アプリ、生成AIの違いから 考察してみると面白いよね? https://www.youtube.com/watch?v=9wDJ_LnzGFo 2023年11月に生成AIの民主化を起こしたChatGPTのGPTsとは? ネットビジネスアナリストの横田秀珠が、AI時代の変革とチャットGPTの使い方について語る。1994年に社会人デビューし、インタ

                                              2023年11月に生成AIの民主化を起こしたChatGPTのGPTsとは? | ネットビジネス・アナリスト横田秀珠
                                            • カレンダーシェアアプリ「TimeTree」、生成AI活用の読取機能が複数登録に対応

                                              TimeTreeは7月3日、カレンダーシェアアプリ「TimeTree」において、生成AIの活用により画像データから予定を登録できる「予定スキャン機能(ベータ版)」のアップデートを実施した。 TimeTreeは、共有とコミュニケーションを前提にしたカレンダーサービス。家族、パートナー、サークル、職場など複数人数の予定共有が簡単にでき、目的に応じたカレンダーを複数つくることが可能。2015年3月24日よりサービスの提供を開始し“スマホの中の壁掛けカレンダー”として利用され、2024年4月には登録ユーザー数が5500万を突破している。 予定スキャン機能(ベータ版)は、iPhone端末に搭載されたOCR機能と生成AIを活用することにより、画像から文字データを読み取り「予定に関連する情報」のみを抽出することで、TimeTreeアプリへの予定登録を可能にするもの。画像データに含まれる「予定タイトル」、

                                                カレンダーシェアアプリ「TimeTree」、生成AI活用の読取機能が複数登録に対応
                                              • 【株式銘柄徹底分析】TOPPANホールディングス(7911)~印刷業界2強の一角 半導体部材 包装資材 情報コミュニケーション~ - 社畜から経済的自立(FIRE)を目指す

                                                こんにちは、ToMO(@tomo2011_08)です。 私はサラリーマンをしながら、サイドFIREを目指しています。 サイドFIREを目指す上で重要なことの1つとして、「投資」があります。 投資をして、今ある資産を拡大し、経済的自立を達成して、自分のやりたいことを仕事にしたいと思っています。 様々な投資の方法がありますが、その中の1つとして株式投資があり、株式投資を行う上で株式銘柄を分析することは非常に重要なことです。 日本株式投資をされる方の必需品といえるのが、以下の四季報になります。 お持ちでない方は、以下から購入して読まれることをお勧めします。 リンク 銘柄の事業内容は?、業績はどうか?、配当はいくらなのか?、現在の株価はいくらか?などを知って、投資するかしないかを決定したり、買い時・売り時を判断したりします。 私はこれまで20年以上様々な日本株銘柄に投資をしてきましたが、株式銘柄を

                                                  【株式銘柄徹底分析】TOPPANホールディングス(7911)~印刷業界2強の一角 半導体部材 包装資材 情報コミュニケーション~ - 社畜から経済的自立(FIRE)を目指す
                                                • AI博覧会、第4弾スピーカーを発表!住友生命 岸氏、中條氏、埼玉県戸田市 大山氏が講演!

                                                  AIsmileyは、2024年8月29日(木)~8月30日(金)に「AI博覧会 Summer 2024」を開催します。本日カンファレンスの第4弾スピーカーを公開しました。ビジネスを変革させるカギとなる最先端のAIトレンド情報を収集できる絶好の機会ですので、ぜひご参加ください。 \申込は約30秒/ 無料で参加登録 Z世代若手社員をリープフロッグさせるには!? 日時:2024年8月30日(金)12:20~12:50 コロナ入社のZ世代若手社員が生成AIにより早いサイクルでスキル習得し社外向け研修の講師を担うまでに。その裏側に迫ります。 岸 和良 氏 住友生命保険相互会社 エグゼクティブ・フェロー 住友生命保険相互会社に入社後、生命保険事業に従事。2016年から健康増進型保険“住友生命「Vitality」”のITプロジェクトリーダーを担当。現在はデジタル共創オフィサーとして、デジタル戦略の立案・

                                                    AI博覧会、第4弾スピーカーを発表!住友生命 岸氏、中條氏、埼玉県戸田市 大山氏が講演!
                                                  1