並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 1721件

新着順 人気順

OCRの検索結果361 - 400 件 / 1721件

  • 知人に「プロトタイプの感想」を聞くのは、ホームパーティで料理ふるまうようなもの。LayerX「バクラク請求書」が学んだニーズ検証の罠と「まずは市場に出す」の大切さ|アプリマーケティング研究所

    知人に「プロトタイプの感想」を聞くのは、ホームパーティで料理ふるまうようなもの。LayerX「バクラク請求書」が学んだニーズ検証の罠と「まずは市場に出す」の大切さ LayerXさんの「バクラク請求書」の成長の裏側を取材しました。 株式会社LayerX 取締役 榎本 悠介さん(右)、執行役員 牧迫 寛之さん(左)「バクラク請求書」について教えてください。牧迫: バクラク請求書(旧 LayerX インボイス)は、請求書受け取りソフトです。 受け取った請求書のデータを、AI-OCRで自動入力することで、請求書処理が「入力ゼロ」になるというサービスです。 現在は数百社に利用されていて、業務フローに一度組み込んでもらえると、ずっと継続してつかってもらえています。 請求書って会社ごとに、フォーマットが少しずつ異なるので、それを手入力していくというのが、すごく大変なんですよ。 プロダクトを運営してきて、

      知人に「プロトタイプの感想」を聞くのは、ホームパーティで料理ふるまうようなもの。LayerX「バクラク請求書」が学んだニーズ検証の罠と「まずは市場に出す」の大切さ|アプリマーケティング研究所
    • ラズパイとAI-OCRで生産日報を電子化する(後編)

      今回は、前回に引き続き、小型ボードコンピュータの「Raspberry Pi(ラズベリーパイ、略してラズパイ)」と、機械学習などのAI(人工知能)技術を活用したOCR(光学的文字認識)である「AI-OCR」を組み合わせた事例として「生産日報の電子化」をどのように実現するかについて具体的に解説します。 ⇒連載「ラズパイで製造業のお手軽IoT活用」バックナンバー 生産日報の電子化は、以下の手順で進めます。 手書きで日報を記入する 手書き日報をラズパイで読み取り、テキストデータに変換する テキストデータに変換した日報データを現場画面に表示して内容の確認をする。誤認識している部分は手で修正する 修正した箇所を機械学習して認識率を向上させる 前回は1.と2.について説明しました。今回は3.と4.について解説します。 3.テキストデータに変換した日報データを現場画面に表示して内容の確認をする OCRは1

        ラズパイとAI-OCRで生産日報を電子化する(後編)
      • AIカンパニー内に新たに設置された「Computer Vision Lab」が目指す未来

        LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog 2021年11月10日・11日の2日間にわたり、LINEのオンライン技術カンファレンス「LINE DEVELOPER DAY 2021」が開催されました。特別連載企画「DEVDAY21 +Interview」では、登壇者たちに発表内容をさらに深堀り、発表では触れられなかった関連の内容や裏話などについてインタビューします。今回の対象セッションは「LINEのコンピュータビジョン研究-その現状と将来」です。 音声認識や音声合成、自然言語処理などのAI技術について研究開発を進めているLINE AIカンパニーは、画像認識に特化したR&D部門である「Computer Vision Lab」を2021年7月に立ち上げました。Computer

          AIカンパニー内に新たに設置された「Computer Vision Lab」が目指す未来
        • PowerToys、画像から文字を抽出できる機能を開発中

            PowerToys、画像から文字を抽出できる機能を開発中
          • 【キャディ小橋CTO】CADDi AI Lab“戦略的”組織変更の裏側

            キャディ小橋CTO「1000ページの図面解析は機械学習でも大変だった」AI Lab“戦略的”組織変更の裏側 2023年7月24日 キャディ株式会社 CTO 小橋 昭文 スタンフォード大学・大学院にて電子工学を専攻。世界最大の軍事企業であるロッキード・マーティン米国本社で4年超勤務。ソフトウェアエンジニアとして衛星の大量画像データ処理システムを構築、JAXAやNASAも巻き込んでの共同開発に参画。その後、アップル米国本社にてハードウェア・ソフトウェアの両面からiPhone、iPad、Apple Watchの電池持続性改善などに従事した後、シニアエンジニアとしてAirPodsなど、組み込み製品の開発をリード。2017年11月に、キャディ株式会社をCEOの加藤勇志郎氏と共同創業。 CADDi AI Labは、AI活用の先進事例がない製造業の領域で、キャディ社が持つ大量の非構造化データの活用を目的

              【キャディ小橋CTO】CADDi AI Lab“戦略的”組織変更の裏側
            • 【週刊ポストがスクープ】内閣広報室のテレビ監視,第2弾!「桜を見る会」だけで255枚!|WADA/開示請求

              きょう26日発売の「週刊ポスト」に,私が提供した内閣広報室開示資料「報道番組の概要」の記事が出ました! これはもともとは,「なんで一民放番組のツイートに,お役所が口をはさむツイートができるんだろう?勤務時間中にテレビ見てるのか?」という疑問から,まさに興味本位で出した開示請求でした。 記事は,私の開示資料をもとに,望月衣塑子さんなどのコメントも取っており,まさに開示請求とメディアの理想的なコラボとなっています。 なお,週刊誌で3ページというのはかなり「大々的な」扱いです。たいていは見開きの2ページで終わっちゃいますから。 全データ公開しますいくら雑誌では大きな扱いとはいえ,開示資料は,2019年4月1日~2020年1月末までで,なんと676個のPDFファイル,結合してみたら3377ページに及ぶ膨大なもので,これでは雑誌はもとより赤旗だって全文掲載はできません。 というわけで,死蔵していても

                【週刊ポストがスクープ】内閣広報室のテレビ監視,第2弾!「桜を見る会」だけで255枚!|WADA/開示請求
              • くずし字を解読できるAI-OCRアプリ「古文書カメラ」、凸版印刷が提供開始

                  くずし字を解読できるAI-OCRアプリ「古文書カメラ」、凸版印刷が提供開始 
                • 20万円で社員1人分の活躍、りそなHDが導入したアーム型「中継ぎロボ」の実力

                  りそなホールディングス(HD)は2019年6月から小型ロボットとRPA(ロボティック・プロセス・オートメーション)などを組み合わせた新システムを導入し、現場の各種帳票にまつわる入出力作業の省人化に取り組んでいる。実証実験ではなく、既に東京都や大阪府などの施設内で50セットほどが本稼働している。 「1セットのハード費用はロボットを含めて約20万円。1セットに1人分の仕事を任せているため、約1カ月で投資回収できた」。同社の荒木敏郎デジタル化推進部AI・RPA推進チームグループリーダーは満足げだ。 新システムが担う作業は帳票に関する一連の業務だ。具体的には、OCR(光学文字認識)ソフトで読み取ったり直接送られてきたりした紙の伝票のテキストデータなどをRPAのソフトロボットで加工する。次にキーボード・エミュレーター・ソフトがそのデータを勘定系システムに入力する。 勘定系システムが入力内容を現場のプ

                    20万円で社員1人分の活躍、りそなHDが導入したアーム型「中継ぎロボ」の実力
                  • チェック・ポイント、ASCIIコードをベースとする新たなQRコードフィッシングの手法を発見

                    チェック・ポイント、ASCIIコードをベースとする新たなQRコードフィッシングの手法を発見OCRエンジンによる検知を回避する、HTMLで作成されたQRコードの登場に警鐘。時代はQRコードフィッシング3.0へ AIを活用したクラウド型サイバーセキュリティプラットフォームのプロバイダーであるチェック・ポイント・ソフトウェア・テクノロジーズ(Check Point® Software Technologies Ltd.、 NASDAQ:CHKP、以下チェック・ポイント)は、ASCIIコードをベースとしてHTMLによって作成されたQRコードを用いる新たなQRコードフィッシング(通称クイッシング、Quishing)の手法を発見しました。このQRコードは従来の画像によるQRコードと異なり、ASCIIコードをベースとしたHTMLで作成され、OCRによる検知を免れることから、さらなる注意が必要です。 急速

                      チェック・ポイント、ASCIIコードをベースとする新たなQRコードフィッシングの手法を発見
                    • BizTech、「AI開発会社/AIサービスカオスマップ 2021」を公開 AI開発会社やAIサービスを紹介

                      AI活用サービスの選定、導入・活用を支援するコンシェルジュサービス「AI Market」を運営するBizTechは、AI開発会社やAIサービスをカテゴリ別にまとめた「AI開発会社/AIサービス カオスマップ2021」及び「カテゴリ別レポート」を5月13日に公開した。 同カオスマップでは、AI Marketが各社Webサイトやプレスリリース等の公開情報を元に調査を行い、独自の視点でAI開発会社およびAIサービスを以下のカテゴリに分け、掲載するもの。 受託等サービス系 AI開発会社(総合(画像認識・音声認識・自然言語処理・予測等)・エッジAI・医療/創薬系) アノテーション/データセット(総合・プラットフォーム) AI人材関連サービス(育成/研修・派遣/紹介/活用) ツール系 AI開発/活用プラットフォーム(総合・医療用) AI-OCR AIチャットボット レコメンド/Web接客 法務・知財関

                        BizTech、「AI開発会社/AIサービスカオスマップ 2021」を公開 AI開発会社やAIサービスを紹介
                      • Kindle に入っているビジネス書をオーディオブック化したい

                        TL; DR ゴールデンウィークの自由研究として、 Kindle 書籍を音声化するアプリケーションを作って公開したよ 手元の PC で書籍部分を抜き出して画像化するよ。 macOS では Automator を使って Kindle.app を自動でページめくりさせてスクショをとるよ できた PDF を GCP の Cloud Storage にアップロードすると、 Cloud Functions が起動して Vision API + Text-to-Speech に突っ込んで MP3 ができあがるよ 著作権の問題から Web サービスとして公開はしないけど、自分用に環境構築して使えるよ。慣れてない人でも30分〜1時間くらいでできると思うよ 一度環境構築すれば、あとは1冊10分以内、費用もほぼ無料〜1冊最大200円程度で好きな Kindle 書籍を音声化できて、積ん読消化が捗るよ はじめに

                          Kindle に入っているビジネス書をオーディオブック化したい
                        • 画像の中の文字を見つけるのって今どんな感じなの?まとめてみたんご - Qiita

                          AdventCalender論文2日目担当のCurryです! 今回は画像の中の文字を見つける技術の昔と最新をまとめました。 意外と文字検出の論文紹介ってないんじゃね!?っていう 画像は参照サイト(各章の先頭のURL)、論文中から引っ張ってきてます 文字検出 画像の中の文字を見つけるのは 文字検出 と呼ばれます。英語では Text Detection とか Text Localization という。 つまりこんなタスク。オレンジ線が文字を囲めてるので、検出ができたと判断できる。 入力画像 出力 文字検出の難しさは、以下のようによく言われる。(いわゆる論文のイントロの謳い文句) 1. 文字の多様性 2. 文字の色 3. 文字のコントラストや背景との混同 4. 文字の大きさが違う 5. 文字の方向(いわゆるアルファベットが斜めになっていたり) ちなみに、、、 文字認識 は文字を判別することなの

                            画像の中の文字を見つけるのって今どんな感じなの?まとめてみたんご - Qiita
                          • A deep dive into an NSO zero-click iMessage exploit: Remote Code Execution

                            A deep dive into an NSO zero-click iMessage exploit: Remote Code Execution Posted by Ian Beer & Samuel Groß of Google Project Zero We want to thank Citizen Lab for sharing a sample of the FORCEDENTRY exploit with us, and Apple’s Security Engineering and Architecture (SEAR) group for collaborating with us on the technical analysis. The editorial opinions reflected below are solely Project Zero’s an

                              A deep dive into an NSO zero-click iMessage exploit: Remote Code Execution
                            • AI-UXとAX(AI Transformation)というLayerXの挑戦|福島良典 | LayerX

                              このように有言実行してきたのがLayerXの歴史であり、AI-UXとAXに関しても有言実行して実現していきます。 (2024/1/9追記) 偶然ではありますが、2024年1月にGoogle ResearchもAI-UXに関する記事を出していました。 ここではAI-UXの責任性。どうやってバイアスの少ないAI-UXを実現していくのかがメインで紹介されています。 AI-UXとAX(AI Transformation)ChatGPTの衝撃はみなさんの記憶に新しいと思います。技術的な進化の速さはもちろんのこと、スマホ以来、久々に登場したUXの転換点であることも重要です。ChatGPTに刺激されて、今後さまざまなアイデア、UXが実現していくでしょう。 この変化から生まれる体験を、AI-UX(※弊社の造語です)と名付けたいと思います。AI-UXは、「AIを前提とした理想のUX」です。 大事な点は、AI

                                AI-UXとAX(AI Transformation)というLayerXの挑戦|福島良典 | LayerX
                              • 現場主導のDXを実現。5万円から始められるAIカメラの実力

                                製造業をはじめとするさまざまな企業のAIカメラへの期待は大きい。その一方で、導入がなかなか進まないという現実もある。ソラコムの「S+ Camera Basic」は、5万円と安価であるだけでなく、「現場へのカメラの取り付け」「通信環境」「リモートアクセス」というAIカメラ導入の3つの課題を解決できるとともに、無料で体験できる「トライアル」機能も提供している。 IoT(モノのインターネット)とAI(人工知能)の組み合わせにより、製造現場の情報をデジタル化し、人が目視で行う確認作業をデジタル化して代替することができる。中でもカメラは、人の代わりに対象を認識したり、モノの数をカウントしたり、情報を読み取ったり(OCR:光学的文字認識)、対象の状態を判断したりと、画像データを通じて、初めてのAI活用の際に導入しやすいデバイスだ。 ソラコムは、同社が通信プラットフォーム提供で培ったノウハウを生かし、セ

                                  現場主導のDXを実現。5万円から始められるAIカメラの実力
                                • ラサール石井「小池:宇都宮+山本=7:3 初回でこれなら4年後にはひっくり返せる!スキャンダル来い!」 : 痛いニュース(ノ∀`)

                                  ラサール石井「小池:宇都宮+山本=7:3 初回でこれなら4年後にはひっくり返せる!スキャンダル来い!」 1 名前:ヨーロッパオオヤマネコ(栃木県) [DE]:2020/07/05(日) 20:47:20.24 ID:yoxQYiwI0 ラサール石井 (@lasar141) 皆様、よく頑張りました。 宇都宮に山本足して、小池、小野に7対3。 初回でこの点数なら、充分ひっくり返せる。 4年後の逆転勝利を目指そう。何かスキャンダルで意外にチャンスは早く来るかも。 でも次は橋下とかも来るかも。 監視しましょう。まずはコロナ、そしてオリンピック。 築地に満員電車も。 https://twitter.com/lasar141/status/1279740210289369088?s=19 2: 白(東京都) [US] 2020/07/05(日) 20:47:52.82 ID:L9Y9mOl+0 スキャ

                                    ラサール石井「小池:宇都宮+山本=7:3 初回でこれなら4年後にはひっくり返せる!スキャンダル来い!」 : 痛いニュース(ノ∀`)
                                  • Autify ブログ - Autify(オーティファイ)

                                    About Autify 無料トライアルをはじめる 2024年03月30日 QA業務に役立つおすすめ資格とは?必要な知識やスキル、向いている人の特徴などをわかりやすく解説! Autify, Inc. 2024年03月30日 ソフトウェアにおけるQA(Quality Assurance)とは?品質保証の考え方 Autify, Inc. 2024年02月05日 Autifyのテスト実行を20%高速にした話 Autify, Inc. Autify, Engineering 2024年02月05日 AutifyのHackathon、名付けてAutifyathon! Autify, Inc. Engineering, Event 2023年12月25日 テスト自動化プラットフォームAutifyはどのようにAutify自身を自動テストしているか – テストシナリオ作成編 Autify, Inc. Ev

                                    • 【Excel】PDF上の表は手入力しなくても簡単に取り込める! 紙のスキャンデータでも大丈夫【いまさら聞けないExcelの使い方講座】

                                        【Excel】PDF上の表は手入力しなくても簡単に取り込める! 紙のスキャンデータでも大丈夫【いまさら聞けないExcelの使い方講座】
                                      • デジタル化能力5%弱?!国会図書館デジタル化実現へ大きく前進!(上編) | 参議院議員山田太郎 公式サイト

                                        写真)国立国会図書館でのデジタル化スキャンの様子 参議院会館の道路を挟んで向かいにある国立国会図書館。普段はあまり注目されない施設ですが、日本国内で出版されたすべての出版物を保存する、日本で唯一の図書館です。私も立法調査業務で毎日のように利用していますが、一般の方の来館者数も年間79万人(東京本館だけで57万人/1日平均2071人)にものぼります。 しかし、そんな国のもっとも重要な施設の一つでもある「国会図書館のデジタル化能力が、毎年納本される書籍等のうち5%弱しかない(年間納本件数43万点中、デジタル化処理能力は約2万点)」という驚愕の事実を知りました。かつ、現在国会図書館の蔵書は約4418万点、1968年以前の発刊書籍等1240万点のうち、デジタル化されているのは、244万点でデジタル化率は20%しかないというのです。 コロナ禍においてデジタル化・オンライン化のニーズが高まっているにも

                                          デジタル化能力5%弱?!国会図書館デジタル化実現へ大きく前進!(上編) | 参議院議員山田太郎 公式サイト
                                        • ExcaliburによるPDFテーブルデータ抽出を動かしてみる - OPTiM TECH BLOG

                                          R&D チームの徳田(@dakuton)です。 前回、2値化画像処理の論文(+実装)について紹介しましたが、今回はこういった2値化の応用例としてExcalibur(PDFからテーブルデータを抽出するためのWeb UIベースのツール)を紹介します。 本記事はOPTiM TECH BLOG Advent Calendar 2020 12/7 の記事としてお送りします。 前回記事はこちら。 tech-blog.optim.co.jp 動かしてみる インストール # https://camelot-py.readthedocs.io/en/master/user/install-deps.html#macos] brew install ghostscript tcl-tk pip install excalibur-py excalibur initdb 実行結果 今回もこちら(Rustの全マク

                                            ExcaliburによるPDFテーブルデータ抽出を動かしてみる - OPTiM TECH BLOG
                                          • LINE、昭和前期以前の資料にも対応するOCRモデルを開発。国立国会図書館のデジタル化資料247万点のテキストデータ化を完了

                                            LINE、昭和前期以前の資料にも対応するOCRモデルを開発。国立国会図書館のデジタル化資料247万点のテキストデータ化を完了この度開発したOCRモデルは国立国会図書館の文字認識性能評価において、96%の項目で目標値を上回る結果に LINE株式会社 AIカンパニー(本社:東京都新宿区、カンパニーCEO:砂金 信一郎)は、国立国会図書館(東京都千代田区)が保有するデジタル化資料247万点、2億2300万画像を対象とした「デジタル化資料のOCRテキスト化」作業を受託し、同プロジェクトにおいて、「CLOVA OCR」の技術によるモデル開発を実施、全文のテキストデータ化が完了しましたことを、お知らせいたします。 「CLOVA OCR」は、書類・画像に記載された文字等の情報をテキストデータへ変換するサービスです。 OCRモデルの研究・開発経験豊富なチームが、日々ユーザーニーズに寄り添いながら製品改善を

                                              LINE、昭和前期以前の資料にも対応するOCRモデルを開発。国立国会図書館のデジタル化資料247万点のテキストデータ化を完了
                                            • マスコミの味方!? 音声・映像をAIで「自動文字起こし」 手作業の時間を3分の1以下に

                                              パナソニック システムソリューションズ ジャパンは10月28日、AIとクラウドの技術を活用し、撮影・録音したデータを自動でテキスト化するサービス「P-VoT」(ピーボット)を11月13日にリリースすると発表した。放送・新聞・出版といったメディア企業のコンテンツ制作を効率化する狙い。 メディア業界では、コンテンツを制作する下準備として、インタビューなどの録音データをスタッフが聞き直し、手作業で書き起こすケースが多い。だが同社の試算によると、1時間分の音声・動画をテキスト化する作業の所要時間は約5時間掛かることもあり、長時間労働の一因になっているという。P-VoTでこれを約1.5時間にまで短縮し、業務改善につなげるとしている。 P-VoTはブラウザベースのサービス。ユーザーが取材現場で記録した音声・動画のファイルをクラウド上にアップロードすると、同社の高精度音声認識装置が内容を分析し、専用We

                                                マスコミの味方!? 音声・映像をAIで「自動文字起こし」 手作業の時間を3分の1以下に
                                              • スタートアップは対話型AI「ChatGPT」時代をどう迎えるべきかーーLayerX福島氏特別インタビュー - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                                OpenAIが対話型AI「ChatGPT」の3.5バージョンを公開したのが昨年11月。2月にはMicrosoftの検索エンジンBingと連携したチャット型検索のBing-GPTがお目見えし、3月のバージョン4とAPI、そしてプラグイン公開でこの流れは一気に世界のサービスを飲み込むことになります。 機械学習やディープラーニングによる効率化はこれまでも各所で謳われ、数多く実装されてきましたが、今回発生した一連のジェネレーティブ(生成)AIの波は、自然言語を入り口としたことでかつてないインパクトをもたらすことになります。 半年から1年で世界は変わるーーChatGPTが起こす変革、東大松尾教授一問一答 東大・松尾豊教授の言葉の通り、世界は日々刻々と変わりつつあります。その中で、私たち、特にスタートアップはどのようなバリューを生み出すべきでしょうか。自身も東京大学で機械学習の研究からニュースアプリ「

                                                  スタートアップは対話型AI「ChatGPT」時代をどう迎えるべきかーーLayerX福島氏特別インタビュー - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                                                • OpenAIのAPIを使って任意の画像やPDFからいい感じに情報抽出する方法 - Qiita

                                                  こんにちは!逆瀬川 (@gyakuse)です! さいきん以下の記事を書きました。 上記記事ではOpenAIが新しく提供したFunction callingを使って請求書から請求額や請求先情報等を自動的に抽出するという仕組みを解説しています。 ちなみに、functionsの定義書くのだるくてChatGPTに書かせていました。つまり、functionsをChat APIを使って自動で作れば、任意の種別の資料にすぐさま適用できるというわけです。今日はこちらの仕組みの紹介と、AppendixとしてGoogle Bardで情報抽出する、というのをやってみます。 処理の流れ ユーザーがやることが画像やPDFをアップロードするだけだと未来っぽいです。書類種別も考えさせてしまいましょう。 画像やPDFをアップロードする OCRで文字列を座標とともに抽出する 上記座標付きテキストをChat APIに投げて書

                                                    OpenAIのAPIを使って任意の画像やPDFからいい感じに情報抽出する方法 - Qiita
                                                  • Why dig? How to Dig? 〜音源蒐集のススメ〜 - かるとばこ

                                                    カルトです。 普段はブックオフでCDを買ったり、図書館でCDを借りたり、GEOオンライン55円セールでCDを借りたり、TSUTAYAディスカスのレンタルCDの優先順位を上下させたり、ヤフオクとメルカリとアマゾンマーケットプレイスを巡回して同じCDの価格比較した上で買ったりして暮らしています。 声優さんの曲や、変なJ-POPでDJもしています。 www.mixcloud.com 本日は私が日々いそしんでいる声優楽曲のディグ(Dig)=音源蒐集について、ご紹介したいと思います。声優楽曲に興味のない方でも、音源集めている方なら参考になるかもしれません。 ディグとは何か?なぜディグるのか? ※んなもん知っとるわ!という諸氏は、読み飛ばしてください! さて、weblio英和辞書によると、"Dig"とは 「(道具・手などを使って)掘る、掘り起こす、(…を)十分に掘り返す、掘る、掘って造る、(…を)掘り

                                                      Why dig? How to Dig? 〜音源蒐集のススメ〜 - かるとばこ
                                                    • Deep Learningの先にあるもの。マネーフォワードのCTO、技術顧問、Money Forward Lab所長の技術トップ3に、ビジョンとアプローチを聞く

                                                      テックカンパニーをテックカンパニーたらしめているものはなにか?技術か、人か、それともチームなのか。 連載「Technology Company Internals」では、テックカンパニーの内側で働くエンジニアに、技術に精通したエキスパートが対面で話を聞き、テックカンパニーとは何か?を探るだけでなく、テックカンパニーを目指す企業の指針となることを目指します。 「オートノマス・バックオフィス」a.k.a「会社の自動運転」 -- 本日はお集まりいただきありがとうございます。今回は、「数年後のマネーフォワード」をキーワードに、ビジョンとテクノロジーの話を伺えるということで、大変楽しみです。まずは自己紹介をお願いします。 中出: 中出 匠哉と申します。マネーフォワードの取締役執行役員CTOを務めています。経営メンバーの一人として、テクノロジーで競争力を高めていくことをミッションの一つとして取り組んで

                                                        Deep Learningの先にあるもの。マネーフォワードのCTO、技術顧問、Money Forward Lab所長の技術トップ3に、ビジョンとアプローチを聞く
                                                      • OneNoteのデータを画像付きのMarkdownにexportする

                                                        今まで技術書のメモをOneNoteに取っていました。 OneNoteを使う理由としては、自分はスクリーンショットをメモの代わりにしていて、OneNoteは画像が扱いやすくOCRも効くためでした。 技術書読むときメモ取る代わりにスクショとって貼って書くこと多いんだけど、これできるアプリ欲しい。 OneNoteでやってるんだけど、もっと気軽に読みながらスクショとメモを貯められる一時置き場みたいのがほしいな。 最終的な貼り付け先はOCRできるOneNoteがいい気がするけど。 pic.twitter.com/TzyRdSgMFh — azu (@azu_re) September 15, 2019 ただし、OneNoteを使うとスクショを取って貼り付けるという作業が面倒でした。 そのため、mumemoというスクリーンショットベースのメモをとり、Markdownファイルとして書き出していくアプリを

                                                          OneNoteのデータを画像付きのMarkdownにexportする
                                                        • 文章だけでなく視覚的なコンテンツも理解してIQクイズに答えられるAI「Kosmos-1」をMicrosoftが発表、汎用人工知能の開発に前進

                                                          近年では画像生成や人間との対話などの特定分野で優れた能力を発揮するAIが注目を集めていますが、一部のAI開発者は人間のように言語や視覚、聴覚などさまざまな情報をまとめて処理できる「Artificial General Intelligence(AGI)/汎用(はんよう)人工知能」の開発を目標としています。新たにMicrosoftが、言語処理だけでなく画像や視覚的なコンテンツの認識にも優れ、図形を用いたIQテストにも回答できるマルチモーダルなAI「Kosmos-1」を発表しました。 [2302.14045] Language Is Not All You Need: Aligning Perception with Language Models https://doi.org/10.48550/arXiv.2302.14045 Microsoft introduces Kosmos-1,

                                                            文章だけでなく視覚的なコンテンツも理解してIQクイズに答えられるAI「Kosmos-1」をMicrosoftが発表、汎用人工知能の開発に前進
                                                          • KuroNetくずし字認識サービス | ROIS-DS人文学オープンデータ共同利用センター

                                                            本サービスは無料ですが、利用状況の把握と過度な利用の防止のために、ログインを必須としています。ログインサービスの実装には、Google社のFirebase認証を活用しており、Google、Facebook、Twitterのアカウントと連携するか、電子メールアドレスを入力することで、ログインが可能となります。 「KuroNetくずし認識ビューア」と「ダッシュボード」は、両方とも同じアカウントでログインする必要がありますのでご注意下さい。ログイン機能は、いずれの場合も画面の右上にあります。なお、アカウント連携はログイン機能の実現のみに利用し、取得した情報はそれ以外の目的には活用いたしません。 「KuroNetくずし認識ビューア」に、認識したい本のIIIFマニフェストをドラッグ&ドロップしてください(注意:IIIFの利用)。そして、ページ移動やサムネイル表示などを用いて、認識したい画像を表示して

                                                              KuroNetくずし字認識サービス | ROIS-DS人文学オープンデータ共同利用センター
                                                            • セキュリティチェックシートに回答する“つらみ”はLLMで解消 セキュリティ担当者に「本格運用できるんじゃない?」と言わせた仕組み

                                                              LLMを活用したサービスを社内外でリリース・運用した経験のある3社のエンジニアが登壇し、実運用を経たからこそ見えた課題やその解決策、運用を見据えた設計・実装の知見などについて語る「LLM in Practice -3社の実例から見るLLM活用サービスを運用した課題と学び -」。ここで株式会社LayerXの白井氏が登壇。「セキュリティチェックシート」をLLMに回答させる取り組みについて紹介します。 白井氏の自己紹介 白井仁美氏(以下、白井):「LayerX Biz Boost 〜セキュリティチェックシート一次回答の取り組み〜」と題して、LayerXの白井から発表します。 自己紹介です。ハンドルネームは「yakipudding」で活動しています。2023年3月にLayerXに転職してきて、機械学習エンジニアをやっています。 LayerXは法人向け支出管理サービス「バクラク」シリーズを提供してい

                                                                セキュリティチェックシートに回答する“つらみ”はLLMで解消 セキュリティ担当者に「本格運用できるんじゃない?」と言わせた仕組み
                                                              • プロセスマイニングとは何か 主要ツールの整理、DX推進の切り札として注目される理由

                                                                プロセスマイニングとは何か 代表的なプロセスマイニングツールの種類 皆さんはプロセスマイニングという言葉ご存じでしょうか。 プロセスマイニングは、DX(デジタルトランスフォーメーション)推進や脱レガシーの文脈においてこの数年注目を集める技術キーワードの一つです。 プロセスマイニングを一言で表すと「データに基づくビジネスプロセスの可視化」のための分析手法です。事業活動の中で発生するあらゆる行動のログを生かして、現実のビジネスプロセスを可視化して分析したり、改善のポイントを探ったりする際に役立つとされています。 プロセスマイニング・イニシアティブ代表。プロセスマイニング専門コンサルタント。 マーケティングリサーチ会社、シンクタンク、広告会社、ネットベンチャーなどを経て現職。専門はマーケティングリサーチ、データ分析、ダイレクトマーケティング、CRM、事業開発。現在は「プロセスマイニング」の導入コ

                                                                  プロセスマイニングとは何か 主要ツールの整理、DX推進の切り札として注目される理由
                                                                • 【追及スクープ】マイナンバー500万人分を中国に流出させた「実行犯」のヤバすぎる告白(週刊現代, 岩瀬 達哉) @moneygendai

                                                                  東京・池袋のマンションの一室に「本社」を構える中小企業「SAY企画」は、日本人770万人分もの年金情報データを扱い、そのうち501万人分を中国の企業に「丸投げ」した。マイナンバーや年収情報をも含む日本人の個人情報は、中国のネット上に流出。日本年金機構は、いまも「流出」を否定する。だが今回、身を潜めていた当事者の元社長がすべてを語った──。 過去の連載はこちら 〈中国にマイナンバーと年金情報が「大量流出」していた…厚労省が隠蔽し続ける「不祥事」の全容〉 〈日本人500万人のマイナンバーと年収情報は、池袋の一室から中国の工場に「丸投げ」されていた〉 岩瀬達哉(いわせ・たつや)/'55年、和歌山県生まれ。'04年、『年金大崩壊』『年金の悲劇』で講談社ノンフィクションを受賞。著書に『新聞が面白くない理由』『裁判官も人である 良心と組織の狭間で』『キツネ目 グリコ森永事件全真相』(いずれも講談社刊)

                                                                    【追及スクープ】マイナンバー500万人分を中国に流出させた「実行犯」のヤバすぎる告白(週刊現代, 岩瀬 達哉) @moneygendai
                                                                  • Amazon BedrockでClaude 3.5 Sonnetの画像理解・分析機能を使用して画像生成を検証・再生成・自動化する(Amazon Titan Image Generator G1編) - NRIネットコムBlog

                                                                    小西秀和です。 以前の記事では、Anthropic Claude 3.5 Sonnetの画像理解・分析機能を活用して、Stability AI Stable Diffusion XL(SDXL)で生成した画像を検証・再生成するAmazon Bedrockの使用例を紹介しました。 Claude 3.5 SonnetでStable Diffusion XLによる画像生成を要件が満たされるまで繰り返すAmazon Bedrockの使用例 本記事では、Anthropic Claude 3.5 Sonnetの画像理解・分析機能を活用して、Amazon Titan Image Generator G1で生成した画像を検証・再生成するAmazon Bedrockの使用例をご紹介します。 この試みは、前述の記事同様に生成画像の要件充足を自動的に判定することで、人間による目視確認の作業量削減も目指しています

                                                                      Amazon BedrockでClaude 3.5 Sonnetの画像理解・分析機能を使用して画像生成を検証・再生成・自動化する(Amazon Titan Image Generator G1編) - NRIネットコムBlog
                                                                    • 「マイ・インターネット」で印象に残った回答・コンテンツまとめ - 世界のねじを巻くブログ

                                                                      私とインターネット はてなブログで「My Internet」を公開しバトン的なものを回してみると、 思った以上にたくさんの方に回答していただいたので、 (いまさらですが)印象に残ったものをまとめてみました。 ・My Internet 特集が面白いので自分もやってみた話 - 世界のねじを巻くブログ はてなブログの「引用機能」が有効なブログは「引用貼り付け」、 オフにしている場合はGoogle Chromeの「選択箇所へのリンク」でやってみました。 (クリックすると参照元の各ブログに飛べるはず!) 私とインターネット 最近、面白いと思ったネットミームや投稿は? どんな種類のYoutube動画をみてますか? Tiktokを使ってますか?どんな動画が出てきますか? インスタグラムをどう使ってますか? Twitterでつぶやいてますか? バズったことはありますか?どんな感じでしたか? あなたのTwi

                                                                        「マイ・インターネット」で印象に残った回答・コンテンツまとめ - 世界のねじを巻くブログ
                                                                      • Engadget | Technology News & Reviews

                                                                        iPad Pro (2024) review: So very nice, and so very expensive

                                                                          Engadget | Technology News & Reviews
                                                                        • iOSで文字認識(Text Recognition)

                                                                          iOS 13以降で、待望だった「文字認識」機能が使えるようになりました。カメラなどで撮影した画像内にある文字を読み取る [1] ことができます。 iOS 9からあった「文字検出」との違い 文字認識は、Visionフレームワークの一機能として追加されました。 一方、Core ImageのCIDetectorというクラスでは、CIDetectorTypeTextというタイプを指定でき、テキストを検出することができます。 このCIDetectorTypeTextやCIFeatureTypeTextはiOS 9からあるものです。 しかしこちらは文字の「領域」を検出する機能です。何が書いてあるか、までは認識できませんでした。 そこで今まではTesseract[2]というオープンソースのOCRエンジンや、SwiftOCR[3]という(おそらく個人がメンテしている)OSSしか選択肢がなかったのですが、つ

                                                                            iOSで文字認識(Text Recognition)
                                                                          • 【イラストの基礎講座】絶望的に絵が下手くそでも「人物イラスト」を”それとなく”簡単に書く方法 - 花太郎BLOG

                                                                            1.下手くそなりの心得 2.番外編『自分で描いたイラストを貼りたい』 3.あとがき \私も使ってます。初心者にオススメの漫画デッサン本/ リンク こんにちは、会社員しょこちゅんです🤗 先日、さじ (id:conasaji)さんからこんなご要望をいただきました。 イラストの基本講座?みたいな記事も読みたいなあ~と希望を書いてみます。 というコメントを頂きました。ありがとうございます。 ちなみに わたしは絵は下手くそですー。ぴえん そこまで得意じゃないの。 ということですが、『イラストは苦手だけど、なんとか形にしたい』という、私と同じようなかたへ、わたしなりの描き方のポイントをお伝えしようとおもいます。 1.下手くそなりの心得 今回のサムネは、手書きでかいたイラストをデータ化しフォトショップで着色。雑ですがお許しください。作業時間は手書き~着色まで2,3時間。 【イラストの基礎講座】絶望的に

                                                                              【イラストの基礎講座】絶望的に絵が下手くそでも「人物イラスト」を”それとなく”簡単に書く方法 - 花太郎BLOG
                                                                            • コスメプラットフォームLIPSと広告クリエイティブ: 最新の研究事例から見る広告クリエイティブの作成支援と自動生成 - AppBrew Tech Blog

                                                                              こんにちは @shunk031 です。 ご縁があって appbrew Tech Blog へ本記事を寄稿しました *1。 今回のお話は、私が取り組んでいる研究分野の 1 つである「機械学習と広告クリエイティブ *2」を特に評価していただき実現しました。 ここで簡単に、本記事の著者である私の自己紹介をします。私は以下のような自然言語処理の研究を中心に進めております: 基礎研究: 深層学習モデルによる解釈可能な自然言語処理 *3 応用研究: 自然言語処理等による広告クリエイティブの評価や生成 *4 今回こうしたバックグラウンドから、 AppBrew の LIPS において商品推薦を広告宣伝の観点から議論・相談を受ける形でお仕事をさせていただきました。 本記事では、機械学習による広告クリエイティブ作成支援の観点から、最新の研究事例について紹介し、議論することが目標です。 特に AppBrew が

                                                                                コスメプラットフォームLIPSと広告クリエイティブ: 最新の研究事例から見る広告クリエイティブの作成支援と自動生成 - AppBrew Tech Blog
                                                                              • 【Excel】PDFや画像を見ながら表を手入力する時代は終わった! 画像認識を活用しよう【再掲】【今すぐ読みたい!人気記事】

                                                                                  【Excel】PDFや画像を見ながら表を手入力する時代は終わった! 画像認識を活用しよう【再掲】【今すぐ読みたい!人気記事】
                                                                                • 【イベントまとめ】各社PdMと徹底対談!プロダクト価値を高めるPdM組織の舞台裏 - RAKUS Developers Blog | ラクス エンジニアブログ

                                                                                  はじめに ラクスでは、「PdM(プロダクトマネージャー)」をテーマにした対談イベントを積極的に開催しております。 本記事では、その目的や、各回の概要・内容、今後の開催テーマをご紹介します。 イベントでのリアルな取り組み紹介を通じて、各社の開発戦略やPdM組織の役割、さらにはプロダクトを通じた顧客課題解決への想いを知る一助になれば幸いです。 ※明日開催のイベント情報もあります!是非最後までご覧ください! はじめに 開催背景と目的 各回の内容 【PdM Meetup】プロダクトマネジメントの最適解とは?~BtoB SaaS 3社合同イベント 【ログラス×ラクス】PdM Meetup ~製品・組織フェーズによって異なるPdMの役割や考え方〜 【弁護士ドットコム × ラクス】PdM Meetup〜ビジョンを成功に導く効果的なPdM組織とは? 【日経 × ラクス】PdM Meetup〜 toC/to

                                                                                    【イベントまとめ】各社PdMと徹底対談!プロダクト価値を高めるPdM組織の舞台裏 - RAKUS Developers Blog | ラクス エンジニアブログ