タグ

ブックマーク / tech.layerx.co.jp (33)

  • Document Layout Analysisに物体検出を利用したDocument Object Detectionのすゝめ - LayerX エンジニアブログ

    はじめに こんにちは。バクラク事業部 機械学習チームの機械学習エンジニアの上川(@kamikawa)です。 バクラクではAI-OCRという機能を用いて、請求書や領収書をはじめとする書類にOCRを実行し、書類日付や支払い金額などの項目内容をサジェストすることで、お客様が手入力する手間を省いています。 書類から特定の項目を抽出する方法は、自然言語処理や画像認識、近年はマルチモーダルな手法などたくさんあるのですが、今回は項目抽出のための物体検出モデルを構築するまでの手順について紹介します。 Document Layout Analysisとは Document Layout Analysisとは、文書のレイアウトを解析するタスク(直訳)のことを指します。具体的には、文書内のさまざまな要素(例えば、テキスト、画像、表、見出し、段落など)を抽出し、それぞれの位置や意味などを明らかにすることを目的とし

    Document Layout Analysisに物体検出を利用したDocument Object Detectionのすゝめ - LayerX エンジニアブログ
  • MDM のコーポレートシステム部門で働いてスキルセットが変わってきた話 - LayerX エンジニアブログ

    LayerX Fintech事業部 (※) の piroshi です。※ 三井物産デジタル・アセットマネジメント (MDM) に出向しています。 入社から 9ヶ月が経ちました。現職では業務領域がだいぶ広がったな〜と感じたので、その点についてササッと振り返ってみたいと思います。 業務領域の広がり 私が所属するMDM のコーポレートシステム部は、社内の従業員が利用するクラウドサービス(情シス) および、自社開発サービス・プロダクトのインフラの統制・セキュリティ周りを担当しています。 前職までは情シスの領域が主担当でしたが、プロダクトを動かしている AWSGCP といったプラットフォームまで幅が広がりました。 また、インハウスなエンジニアリング (内製) で対応する領域が増えたなと感じています。ここが一番の変化したところです。 スキルセットの変化と学び 例えばセキュリティの高度化を目指すた

    MDM のコーポレートシステム部門で働いてスキルセットが変わってきた話 - LayerX エンジニアブログ
  • 開発者が安心して実行可能なSQL実行基盤の導入と運用 #ベッテク月間 - LayerX エンジニアブログ

    こんにちは!バクラク事業部 Platform Engineering 部 DevOps チームの id:sadayoshi_tadaです。 7月はエンジニアブログがたくさん出る #ベッテク月間です。今後も記事が出ますので、どんな記事がでるのかこちらのカレンダーからよければチェックしてみてください!7/2にSRE Lounge#17にて開発者が安心して実行可能なSQL実行基盤の取り組みという発表させていただきました。この記事では当該発表で時間の関係で触れきれなかった内容や補足を行っていきます。 従来のデータベースのデータ変更における課題 課題に対する解決策の検討 Bytebaseの利用にかかるコスト Bytebaseの導入及びデータ変更のフロー整備 データ変更のフロー整備 Bytebase導入後の変化 データ変更オペレーション上の課題 まとめ 最後に 従来のデータベースのデータ変更における課

    開発者が安心して実行可能なSQL実行基盤の導入と運用 #ベッテク月間 - LayerX エンジニアブログ
  • LLM時代のデータ基盤 : 非構造化データを扱うETLプロセスの重要性 #ベッテク月間 - LayerX エンジニアブログ

    こんにちは!LayerXのバクラク事業で機械学習・データ周りを担当しております、たかぎわ (@shun_tak) と申します。 みなさま、ChatGPTの登場に衝撃を受け、これを日々の生活やビジネスに活用されていることかと思います。わたしも社内でChatGPT活用の勉強会を開催したところ、大変大きな反響をいただきました。 tech.layerx.co.jp ChatGPTの登場以来、AIを前提としたユーザー体験の構築、すなわちAI-UXの実現を目指すことがLayerX社内の共通認識になりました。LayerXは、プロダクトだけでなくあらゆるビジネスプロセスにおいて、ユーザー体験をAIを前提に再構築するAI Transformation (AX) を推進することで、生産性革命を実現しようとしています。 comemo.nikkei.com AI-UXやAXの実現を通じて、仕事や暮らしの中にある摩

    LLM時代のデータ基盤 : 非構造化データを扱うETLプロセスの重要性 #ベッテク月間 - LayerX エンジニアブログ
  • 今LayerXのバクラク事業部 機械学習グループに入るべき理由(2024年版) - LayerX エンジニアブログ

    すべての経済活動を、デジタル化したい松村(@yu-ya4)です。LayerXのバクラク事業部機械学習グループにおいて機械学習エンジニア兼マネージャーを務めています。 先日、代表の福島(@fukkyy)が以下のnoteを公開しました。LayerXの発信を見てくださっている社外の方々から「もう入るには遅い会社だよね?」と言われることが最近増えたことに対して、LayerXがまだ全然完成されていない、成長機会だらけのこれからの会社であるということを綴った内容となります。 note.com 今回はこの内容を受け、LayerXのバクラク事業部においてAI機械学習を活用した機能の開発・顧客価値の提供に責任を持っている機械学習グループについても、まだまだこれからの組織であり、今入っていただくことで様々な挑戦や成長の機会を提供できるということをお伝えしたいと思います。 現在のLayerX バクラク事業部

    今LayerXのバクラク事業部 機械学習グループに入るべき理由(2024年版) - LayerX エンジニアブログ
  • バクラクのAI-OCRが扱う問題の複雑さ - LayerX エンジニアブログ

    こんにちは。 LayerXのバクラク事業部 機械学習チームのテックリードを務めております機械学習エンジニアの島越(@nt_4o54)です。 最近、カジュアル面談や学会などで「AI-OCRってもうほぼ完成で、運用フェーズですよね」「やることあるんですか?」など頻繁に聞かれることがあります。 「いやいや課題が山のようにあるんです」という話をいつもしているので、今回は我々が作っているAI-OCRがどれだけ複雑で難しい問題を扱っているか、という部分についてお話しさせていただければなと思います。 少し、経理ドメインの話が多く恐縮ですが、お付き合いいただけると嬉しいです。 AI-OCRについて AI-OCRが扱う問題の複雑さ ドメインへの深い理解が必要 同じ書類であってもコンテキストによって抽出したい値が異なる まとめ 最後に AI-OCRについて まず、そもそも弊社のバクラクで提供しているAI-OC

    バクラクのAI-OCRが扱う問題の複雑さ - LayerX エンジニアブログ
  • 機械学習とビジネスゴールのはざまで - LayerX エンジニアブログ

    機械学習をプロダクトに取り入れて磨き上げているいるみなさん。機械学習モデルのオフライン評価とビジネス上のKPIとを近づける難しさを感じてませんか? はじめに 深澤 (@qluto) です。 LayerXという会社で、経理業務をはじめとした業務支援を行うバクラクシリーズの開発に携わっています。私はその中でも、非定型の書類から的確に情報を読み取るAI-OCR機能の開発を担当しています。 私は、機械学習を根幹に据えつつ、ビジネス上や直接的なユーザーの課題解決のために複合的な問題に対処してきたソフトウェアエンジニアです。 今回は、機械学習とビジネスゴールの狭間で生じがちな問題を俯瞰し、バクラクのAI-OCR機能において直面した問題とその解決方法についてご紹介します。 機械学習とビジネスゴールとの間にギャップが生まれてしまうのはどういう時か? まずは、機械学習とビジネスゴールとの結び付けが難しくなり

    機械学習とビジネスゴールのはざまで - LayerX エンジニアブログ
  • 1on1 で「センスが無い」を言語化した話 - LayerX エンジニアブログ

    LayerX Fintech事業部 (※) の piroshi です。 ※ 三井物産デジタル・アセットマネジメント (MDM) に出向しています。 今回は、上長の ken5 さんとの 1on1 の中で「センス」について言語化した話を紹介させていただこうと思います。 現職で実装する機会が増え、力不足から「自分にセンスが無い」と感じた時、それを曖昧な状態にせず、要素に分解して改善に繋げようとしているお話の共有です。 問題の具体例 Fintech という領域ではセキュアな業務環境が求められます。その一環として、ECS を使ったセキュリティ施策の検証を進めています。 しかし私がこれまで Docker や ECS を扱った開発経験がほとんどないため、検証を進めるスピードは遅く、手探りの状態が続いていました。 1on1 での気づきと学び 長らく詰まっていた問題を ken5 さんに相談したところ、彼は

    1on1 で「センスが無い」を言語化した話 - LayerX エンジニアブログ
  • 最小権限の原則に一歩近づく - Entra ID の "Just-in-time application access with PIM for Groups" 機能の紹介 - LayerX エンジニアブログ

    LayerX Fintech事業部(※)の piroshi です。 ※三井物産デジタル・アセットマネジメント (MDM)に出向しています。 沖縄からリモートワークで働いており、蒸し暑い日が続いています。クーラーをつけないと寝苦しくなってきました。 ところでみなさん、特権 (ちから) が欲しいですか?ここでの権限はシステム上の各種権限です。私は小心者で、大きすぎる力は持ちたくない派です。特権をもっていると「オレは今、セキュリティリスクの塊だ...」と気になってしまい、輪をかけて夜も眠れません。 さて、Microsoft の IdP サービスである Entra ID には Privileged Identity Management (PIM) という特権管理機能があります。PIM により「必要最低限の権限」を「必要な期間」に限定して付与することが可能です。ユーザは特権へのエスカレーションを自

    最小権限の原則に一歩近づく - Entra ID の "Just-in-time application access with PIM for Groups" 機能の紹介 - LayerX エンジニアブログ
  • プレスリリース駆動開発のすゝめ - LayerX エンジニアブログ

    機械学習・データ部 / データチームの @irotoris です。こんにちは。 データチームでは社内で使うデータプラットフォームやデータマートの開発をしています。今日は弊チームの開発スタイルの中から「プレスリリース駆動開発」を紹介します。 データチームの開発スタイル データチームの開発は1週間のタイムボックスで、月曜日にバックログやプロジェクトから今週取り組むタスクを計画し、金曜にスプリントレビューを行っています。デイリーでは夕会を行っています。ベロシティの計測などは今のところできていませんが、いわゆるスクラムっぽい開発です。 その月曜朝の計画会で、まずプレスリリースを書いています。 プレスリリースとはなにか? 来プレスリリースは新商品や新サービス、経営・人事などの企業情報を、ニュースとしてメディアに掲載する文書ですが、ここではデータチームが開発・提供する機能や改善をユーザーに伝えるため

    プレスリリース駆動開発のすゝめ - LayerX エンジニアブログ
  • AWS知見共有会でTerraformのCI/CDパイプラインのセキュリティ等について発表してきました + GitHub新機能Push rulesについて - LayerX エンジニアブログ

    先日2024/04/16にタイミーさんのオフィスで開催された、AWS知見共有会というイベントで発表してきました。この会のテーマは「運用のスケーラビリティとセキュリティ」ということで、私は「コンパウンドスタートアップのためのスケーラブルでセキュアなInfrastructure as Codeパイプラインを考える」というタイトルで発表してきています。 イベントの動画もあります。 私の発表は 1:43 ぐらいからです。 この発表については資料と動画を見ていただければ!という感じで特に付け加えることもなかったのですが、イベントの開催後にGitHubから発表された新機能Push rulesがとても便利で、新たなベストプラクティスとなるインパクトがあると思ったので、この記事で紹介します。 Push rulesとは つい昨日発表された機能で、現在はpublic betaという状態です。なので、仕様変更と

    AWS知見共有会でTerraformのCI/CDパイプラインのセキュリティ等について発表してきました + GitHub新機能Push rulesについて - LayerX エンジニアブログ
  • アノテーションの研究事例からLayerXにおける改善案を考える - LayerX エンジニアブログ

    こんにちは! LayerXで機械学習エンジニアをしている伊藤 (@sbrf248) です。直近はOCRモデルの学習・評価に使うデータセット周りの改善に取り組んでいます。 今回は、データセット作成におけるアノテーションに注目し、関連する研究分野や、LayerXにおける改善にどう繋げられそうかを紹介したいと思います。 アノテーションに関する研究分野 アノテーションは、機械学習に利用する教師付きデータの正解ラベルを人間が付与する作業を指します。 高い精度のモデルを作るためには高品質かつ大量のデータセットが用意できると理想ですが、人間が作業する以上一定の時間的・金銭的コストは必要になるため、品質を高めつつ効率を上げるための工夫が必要になります。 アノテーション品質・効率を高めるための研究分野は、大きくサンプリングと品質管理と効率化の2つに分けられます。 以下では、それぞれについての代表的な手法や最

    アノテーションの研究事例からLayerXにおける改善案を考える - LayerX エンジニアブログ
  • ログ一元管理の本質とSIEMの限界 - データ基盤への道 - LayerX エンジニアブログ

    三井物産デジタル・アセットマネジメントで、ガバナンス・コンプラエンジニアリングをしている 鈴木 (@ken5scal )です。 いきなりですが、ログ管理はどの職種どの場面でも重要です。セキュリティにおいても、古生代よりサーバー、ネットワーク機器、アプリケーションなどから出力されるログを一元的に収集し、監視や分析を行うことで、セキュリティインシデントの早期発見や対応、コンプライアンス要件の達成が可能になります。 このようなログ一元管理を実現する代表的なソリューションは、そう、皆様よくご存知のSIEM。我らが「Security Information and Event Management」であります。 私はSIEMを、新卒で入社した大手企業でSOC(Security Operation Center)として触れ、その後ユーザー企業でもOSSやAWS GuardDuty(?)などの形で利用す

    ログ一元管理の本質とSIEMの限界 - データ基盤への道 - LayerX エンジニアブログ
  • ChatGPT入門 (社内勉強会の資料を公開) - LayerX エンジニアブログ

    こんにちは!たかぎわ @shun_tak と申します!バクラク事業で機械学習・データ領域のマネジメントを担当しています! 先日社内でChatGPT入門の勉強会を実施して、参加者からは好評だったので、資料をこちらで共有させてください!わりと社内資料そのままコピペです。 背景 羅針盤15を体現した例 早速やってみよう! ChatGPTを触り倒す Step1 : ChatGPTを開く (0min) Step2 : まずは挨拶してみよう! (5min) Step3 : Google検索の代わりに使ってみよう! (5min) 他のトピックも聞いてみよう! Step4 : ペルソナ設定済みのGPTを使ってみよう! (10min) まずはConsensusというGPTを使ってみましょう! ChatGPT Teamに加入していると、社内の人が作ったGPTにアクセスできます! わいまつさんが作った企業リサー

    ChatGPT入門 (社内勉強会の資料を公開) - LayerX エンジニアブログ
  • 今日から始めるChatGPT+Zapierで雑パーソナライズ情報収集 - LayerX エンジニアブログ

    皆さんこんにちは。CTOの松です。LLM使ってますか?ChatGPT毎日触ってますか? LLMに熱狂してすでに1年以上が経ちましたが周辺エコシステムが充実してきたことでいろいろな取り組みがとても簡単に実現出来るようになったなーと感じています。 ということで今回はZapierを使った小ネタのご紹介です。 AI・LLM事業部の今 とその前に、AI・LLM事業部での取り組みから着想を得たものでして、AI・LLM事業部について簡単に紹介させてください。 LayerXの新規事業であるAI・LLM事業部では、バクラクでも取り組んできたビジネス文書の解析の延長としてLLMを活用して文書分析エンジンの開発を進めています。現在このエンジンを使ったエンタープライズ向けの新規プロダクト開発にいそしんでおります。とても楽しいですし、最近は様々なお客様からの引き合いも増えておりまして、事業成長に向けて満を持しての

    今日から始めるChatGPT+Zapierで雑パーソナライズ情報収集 - LayerX エンジニアブログ
  • バクラク事業におけるデータ組織とデータ基盤 2023 - LayerX エンジニアブログ

    お世話になっております。LayerXの高際 @shun_tak と申します。現在は、データ分析組織の立ち上げに注力しています。 記事では、バクラク事業におけるデータ組織とデータ基盤をテーマに取り扱います。データ分析における認知負荷や属人性を解消するための取り組みや、良質なデータを提供するためのデータ基盤の構築について、具体的な技術スタックを交えて解説し、最後に現在の課題と今後の展望について説明します。 また、この記事は 7月はLayerXエンジニアブログを活発にしよう月間 の2日目の記事になります。 1. データ組織について 1.1. チーム設立の背景 1.1.1. 多少間違ったクエリでも正しい意思決定ができれば、それはとても良いこと (余談コラム) 1.2. チーム構成 1.3. 業務内容 2. データ基盤について 2.1. データ基盤の構成 2.1.1. データソース 2.1.2.

    バクラク事業におけるデータ組織とデータ基盤 2023 - LayerX エンジニアブログ
    knj2918
    knj2918 2024/02/05
  • バクラクの爆速開発を支えるDevOpsチームの「のびしろ」! #のびしろウィーク - LayerX エンジニアブログ

    こんにちは!バクラク事業部DevOpsチームです。 この記事は LayerXテックアドカレ2023 の37日目の記事です、前回はid:kikuchyさんが『歳末!バクラク申請・経費精算モバイルアプリ のびしろ大放出祭 』という記事を書いてくれました。また、38日目はid:suguruが『バクラク Enabling Team の課題とのびしろ #のびしろウィーク』を書いてくださいました! 今回はのびしろウィークということで、バクラクのDevOpsチームの伸びしろをお伝えできればと思います! のびしろウィークとは のびしろウィークとは、LayerXの各チームメンバーが自分たちのチームの「のびしろ」について対外的に発信する期間です! 過去の対外的な発信では社内でうまく行った事例などについては各種発信していましたが、どういう課題があってどういった方の協力を求めているかについての発信はあまり行なって

    バクラクの爆速開発を支えるDevOpsチームの「のびしろ」! #のびしろウィーク - LayerX エンジニアブログ
  • データ領域におけるイネーブリング活動を10か月やってみた報告と今後の課題 #LayerXテックアドカレ #のびしろウィーク - LayerX エンジニアブログ

    今年の2月にデータイネーブリングはじめますという宣言をしました。 note.com また、こちらの記事にもチーム設立の背景や課題についてまとめています。 tech.layerx.co.jp 10か月活動してみて、いろいろと解像度が上がってきたので、一度まとめておこうと思い筆をとりました。 そもそもイネーブリング活動とは何か データ領域におけるイネーブリング活動とは何か この10か月にやったこと・成果・学び 課題と伸びしろ まとめ そもそもイネーブリング活動とは何か 「イネーブリング」や「イネーブルメント」という単語は、「セールス・イネーブルメント」や「チームトポロジー」の文脈での使用が広がっています。 Salesforceの提供コンテンツでは、「成果を輩出し続ける人材育成の仕組み」としてセールス・イネーブルメントを定義しています。 https://www.salesforce.com/jp

    データ領域におけるイネーブリング活動を10か月やってみた報告と今後の課題 #LayerXテックアドカレ #のびしろウィーク - LayerX エンジニアブログ
  • ID/共通管理チームは「のびしろ」だらけ!これからやりたいことを一部紹介します! #のびしろウィーク - LayerX エンジニアブログ

    こんにちは!ID/共通管理チームの id:convto です。 ほんとは日曜日の担当だったんですが気づいたら火曜日になってました。不思議なことってあるんですね。今後は精神統一して乱れを正していきます。 あとぼくはとにかくが大好きなんですが、住んでる物件の都合で飼えない!とかなんだかんだ縁がなくてかれこれ3年くらい経ちます。運命を引き寄せるためにキャットタワーだけ先に買うか迷っているのでだれかアドバイスください。たぶん買ったほうがいいと思っている。 この記事は LayerXテックアドカレ2023 の33日目の記事です、前回は id:ar_tama さんが「成長サイクル」でVUCAの時代を乗りこなす、というタイトルで登壇しました という登壇記事を書いてくれました。次回は id:yu-ya4 がML領域の課題を書いてくれるそうなので、楽しみにしていてください! 今回はのびしろウィークというこ

    ID/共通管理チームは「のびしろ」だらけ!これからやりたいことを一部紹介します! #のびしろウィーク - LayerX エンジニアブログ
  • LayerXののびしろ、2023年を振り返る #LayerXテックアドカレ #のびしろウィーク - LayerX エンジニアブログ

    LayerXののびしろ、2023年を振り返る こんにちは、LayerX CTOの松です。今年のクリスマスイブもひたすら料理していました。息子とパンを捏ねて焼くのは楽しいですね。出来上がったパンをたくさんべくれたのが微笑ましかったです。 この記事はLayerXテックアドカレ(概念)の44日目の記事となります。昨日はnaoの「コンパウンドスタートアップにおけるQAチームの課題とのびしろ #LayerXテックアドカレ #のびしろウィーク」をお届けしました。ちなみにアドベントカレンダーと名乗っていますがもう44日目ですし、更にはクリスマスを超えて明日以降も続くそうです。 さて、昨年もこのタイミングで2022年の振り返りを書いていました。 tech.layerx.co.jp 今年も1年を振り返りつつ、今回はLayerXののびしろについて考えていこうと思っています。 2023年の主なリリース この

    LayerXののびしろ、2023年を振り返る #LayerXテックアドカレ #のびしろウィーク - LayerX エンジニアブログ