[3ページ] workflowの人気記事 215件 - はてなブックマーク

81 - 120 件 / 215件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

workflowの検索結果81 - 120 件 / 215件

【今週のiOSショートカット】Amazon商品のサクラチェッカーと価格推移を調べて賢く買い物をする
- 34 users
- reliphone.jp
- テクノロジー
- 2020/03/06
Amazonでは業者による不正なレビューや価格操作が増加しており問題になっています。良いレビューがたくさん付いているからといって良い製品であるとは限らないカオスな状態なので、それを見抜くためにサクラチェッカーなるものが登場しました。評価に極端な偏りがないか、メーカーや販売者が中国ではないかといったデータから、レビューの信頼性を判定するというものです。スマホからだと使うのがちょっと面倒なので、ショートカットで簡単に使えるようにしました。サクラチェッカーの使い方 Amazonアプリには商品画像の右上に共有ボタンがあります。Safariの場合は画面下部中央に。 ▼Amazonアプリ共有ボタンこれをタップして、ショートカットを呼び出します。（本記事はAmazonアプリのバージョン15.5.0、2020年3月現在の話であり、将来的にボタンの位置が変更される場合があります）実際にやってみ
Argo Workflowsを使った機械学習環境の構築手順 - アダコテック技術ブログ
- 32 users
- techblog.adacotech.co.jp
- テクノロジー
- 2023/10/05
はじめにテックリードの柿崎です。私たちは、機械学習のパラメータチューニングを効率よく行うため、KubernetesネイティブのワークフローエンジンであるArgo Workflowsを採用しています。この記事では、その導入手順の要点を紹介いたします。導入の目的 Argo Workflows導入以前は機械学習のパラメータチューニングを行うにあたり以下の機能を独自に実装しており、属人化していました。パラメータ探索のアルゴリズムインスタンスのスケーリングインスタンスの稼働状況の可視化ジョブの進行状況の可視化これらをより柔軟に活用できるようにして、開発、更新サイクルを早めていくことが導入の目的です。前提条件 Kubernetes(EKS)はすでに構築済みであること Kubernetes、Helmについての基本的な知識があること Argo Workflowsの基本的な知識があること K
モデリング施策を高速・安全に回せる、MLOpsの仕組みづくり
- 29 users
- techblog.yahoo.co.jp
- テクノロジー
- 2021/11/08
こんにちは。サイエンス統括本部で機械学習エンジニアをしている芹沢です。ヤフー全社で使われているレコメンドプラットフォームを担当するプロジェクトに所属し、ログ収集・学習ジョブの開発/運用やMLOpsに関連する業務を行っています。本記事ではそのMLOps業務の中からモデリング業務の効率化の取り組み事例を紹介します。新しいモデルを本番採用するまでにはA/Bテストの準備などをする必要がありますが、それにかかる工数が多いことが課題となっていました。そこで、検証段階からA/Bテスト実施までの実装の負担を軽減し、より早く安全にモデル改善の試行錯誤を行える仕組みを提供しました。 ※ レコメンドシステムの開発はプライバシーポリシーの範囲内で取得したデータを用いて、個人を特定できない形で行っています。全社共通レコメンドプラットフォームの紹介レコメンドとは、サービスを利用するユーザーにおすすめのアイテムを
gokartのMLパイプラインをKubernetesで並列分散実行できるライブラリkannonを作った話 - エムスリーテックブログ
- 29 users
- www.m3tech.blog
- テクノロジー
- 2023/03/14
初めまして！2023年3月前半にエムスリーのAIチームで10日間インターンに参加していた小栗 (@irungo_ic )です。インターンでは、エムスリー発の機械学習パイプラインOSSであるgokart をKubernetes上で高速にかつ簡単に実行できるようになるライブラリであるkannon('cannon'と同じ発音！)をゼロから実装し、OSSとして公開しました。 github.com この記事ではkannonの技術的な解説、インターンに参加した感想をお伝えします！ gokartの概要 gokartの抱えていた課題シングルスレッドでの逐次実行により実行時間が長くなってしまう GKEのリソースを効率的に使えない kannonの概要 kannonの使い方 gokart kannon gokart kannon 補足 kannonのアーキテクチャ kannonの実装 1. Task Que
Cloud Composerにデータマート集計基盤を移行しました - ZOZO TECH BLOG
- 28 users
- techblog.zozo.com
- テクノロジー
- 2023/02/13
こんにちは、MLデータ部データ基盤ブロックの奥山（@pokoyakazan）です。趣味の範疇ですが、「ぽこやかざん」という名前でラジオ投稿や大喜利の大会に出たり、「下町モルモット」というコンビで週末に漫才をしたりしています。私は普段、全社データ基盤の開発・運用を担当しており、このデータ基盤はGCPのBigQuery上に構築されています。そして、データ基盤内の各テーブルは、大きく分けて以下の2種類に分類されます。システムDBのデータやログデータなどが、特に加工されることなく連携されている一次テーブル一次テーブルから必要なデータを使いやすい形に集計したデータマート本記事では、後者のデータマートを集計するジョブを制御するワークフローエンジンを、DigdagからCloud Composerに移行した事例について紹介します。Cloud Composerとは、GCPにてApache Airflo
- あとで読む
ワークフロー基盤としてのEKSクラスター運用のポイントとEKS on Fargate検証 - Gunosy Tech Blog
- 28 users
- tech.gunosy.io
- テクノロジー
- 2019/12/17
本記事は、Gunosy Advent Calendar 2019 17日目の記事です。昨日の記事は、中村さんによる Pythonしか知らない新卒がGunosyに入るとこうなる - Gunosy Tech Blog でした。はじめにワークフロー基盤についてシステム概要その日はいきなり訪れた原因究明対策反省点まとめ EKS on Fargateについて検証のポイント検証内容まとめ最後にはじめにはじめましてこんにちは、Gunosy Tech Lab1 Data Reliability & MLOps Group2の大関（@mageyuki）と申します。弊チームでは、 Gunosyにおける統合データ基盤集約したデータを活用した機械学習基盤 Gunosyの社是である「数字は神よりも正しい」を根底から支える、重要な2つの基盤の開発運用を行っています。私は主にAWS上
- kubernetes
- あとで読む
TransformersのPipelinesで日本語固有表現抽出 - Retrieva TECH BLOG
- 27 users
- tech.retrieva.jp
- テクノロジー
- 2021/08/30
こんにちは。TSUNADE事業部研究チームリサーチャーの坂田です。本記事では、Hugging Face 社が開発しているTransformersのPipelinesという仕組みを使って日本語の固有表現抽出を行う方法をご紹介します。 Transformersとは？日本語学習済み言語モデル Pipelines Trainer 固有表現抽出とは？実際に日本語NERTを試してみる必要な各種依存ライブラリのインストール使用するデータ日本語固有表現抽出データセットでのFine-tuning Pipelinesを使った固有表現抽出実行例おわりに参考 Transformersとは？ TransformersはHuggingFace社が公開しているPython用ライブラリで、BERTを始めとするTransformer系の言語モデルを使用する際のデファクトスタンダードになっています。また、最
Airflowの処理の一部をdbtに移行しようとして断念した話 - Classi開発者ブログ
- 26 users
- tech.classi.jp
- テクノロジー
- 2021/08/19
こんにちは、データプラットフォームチームでデータエンジニアをやっている滑川(@tomoyanamekawa)です。以前紹介したデータ分析基盤であるソクラテスの改善のためにCloud Composer(Airflow)で行っている処理のdbtへの置き換えを検討しましたが、導入を見送りました。調べてみてdbtに対するわかりみも深まったので、その供養のために検討内容を公開します。同じように検討している方の参考になれば幸いです。 dbtとは DWH(Data Ware House)でのquery管理やデータの品質、データリネージの問題を解決してくれるツールです。すでに先人たちがいろいろな記事を公開してくれているので、詳細は説明しませんがこちらの文がdbtをよく表しています。 ELTの「T」を担当するツールデータの前処理における作業をELT（Extract、Load、Transform）と
- dbt
- データ
dbt Labs のベストプラクティス全部違反してみた。そして dbt project evaluator を使って全部直してみた。
- 25 users
- zenn.dev/mjunya1030
- テクノロジー
- 2022/12/11
dbt Labs のベストプラクティス全部違反してみた。そして dbt project evaluator を使って全部直してみた。サマリ dbt Labs では、dbt のプロジェクト、並びに変換パイプラインに関するベストプラクティスを紹介しています。さらに、いくつかのベストプラクティスについては、自動で評価可能な dbt project evaluator というツールも公開されています。今回は、dbt project evaluator で評価可能な、20 個のベストプラクティスを全て「違反」した dbt プロジェクトを１から作成し、このツールを当てて評価した上で、修正をかけました。実際にツールがうまく検知してくれるのかを確認し、検知された項目を修正する場合の手続きとその難所や、現実的な運用方法をまとめています。 ※この記事は dbtアドベントカレンダー2022 の 12/1
n8nでワークフローを自動化した話 / 20220914_n8n
- 25 users
- speakerdeck.com/yug1224
- テクノロジー
- 2022/09/14
2022ランキング圏外から2023ランキング入りを実現したテックブログ運営について / 2023-07-28-QiitaEngineerFesta
難関国際会議の壁
- 25 users
- kanojikajino.github.io
- 学び
- 2021/12/01
2021年も壁 Advent Calendar が開催されることになったわけだが、今回は真面目だが少々青臭い感じの記事を書こうと思う。テーマとして選ぶのは「難関国際会議の壁」である。難関国際会議は、その定義上明らかなように論文を通すのが難しい学会のことを指す。このような会議に通りやすい論文をどうやって書くかというのがこの記事の主題である1。私の論文リストはGoogle Scholarの通りで、主著はある一本2を除いては一、二回の投稿で採録されているので、機械学習系の国際会議に論文を通したい場合にはある程度再現性があると考えられる。ただし物事はそんなに単純ではないので大体このような記事は眉に唾をつけて読んだ方がいい。「素人発想、玄人実行」の法則金出先生の有名な言葉だが、これを聞くと「素人発想」に注目しがちであり、私が実際に金出先生の話を聞いた際も素人発想が大事だなと感じたもので
実験の再現性を高めるデータバージョン管理（DVC）の紹介 - techtekt
- 24 users
- techtekt.persol-career.co.jp
- テクノロジー
- 2024/04/24
データバージョンの管理とは？データバージョンの管理とは、バイナリデータのバージョンを管理することを指します。データバージョンの管理は、Git 等でのコードのバージョン管理をバイナリデータに拡張しています。実験の再現性を高められるメリットがあります。 DVC とは？データのバージョンを管理する機能をもつオープンソースソフトウェアです。データのハッシュをテキストファイルで保持し git でバージョン管理します。また、yaml ファイルで実行パイプラインを定義して監視対象データが更新された際にハッシュを更新することで、新しいハッシュ値を含んだデータをバージョン管理します。更新されたデータファイルはキャッシュディレクトリに保存され、必要なタイミングで自動的に復元されます。データのリモートリポジトリを定義することで、データ一式を簡単なコマンド操作で S3 等へ push / pull すること
- git
- あとで読む
Raycast 所感 - @kyanny's blog
- 23 users
- blog.kyanny.me
- テクノロジー
- 2022/02/01
TL;DR 現時点では Alfred の方が多機能でカスタマイズしやすい。ただ、Raycast はビルトインで便利な機能がいくつかあり、甲乙つけ難い。私物マシンで一週間ほど少し使った && 軽くドキュメントを見ながらちょっと込み入ったコマンドを試してみた感想。 Raycast Manual Action Panel Window Management Core (Extension) Calculator (Extension) Script Commands Quicklinks Fallback Commands Create Extension / Raycast API FAQ 結論 Raycast Manual Notion で作られている。センスが合わない。 Action Panel Alfred でいうところの Cmd+1,2,3 みたいな「追加アクション」のこと。Cmd+
- Alfred
- mac
- tools
- app
dbtを活用したデータ基盤の論理・物理設計の現在地と振り返り / data warehouse logic design by using dbt
- 23 users
- speakerdeck.com/tanakarian
- テクノロジー
- 2021/12/14
dbtを活用したデータ基盤の論理・物理設計の現在地と振り返り / data warehouse logic design by using dbt
- dbt
- 設計
- data
- あとで読む
ジョブ渋滞に機械学習でたちむかってみた〜広告レポート改善事例 #機械学習
- 23 users
- techblog.yahoo.co.jp
- テクノロジー
- 2020/03/02
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。ヤフー広告ディスプレイ広告の植木です。代理店様や広告主様に向けた広告効果のレポート機能のバックエンド開発を担当しています。先日、 Yahoo! JAPAN Tech Conference 2019 in Shibuyaにて「YDNレポートジョブ渋滞に機械学習でたちむかってみた」というタイトルで、処理待ち時間を改善する取り組みの経緯について発表してきましたのでその内容をご紹介します。取組みに至った経緯レポート作成は数秒で終わるものもあれば、数時間に及ぶものまであるため、作成処理と作成リクエスト受付WebAPIとを分離し、Message Queueを用いた非同期の仕組みを採用しています。特定の広告アカウント（広告
- 機械学習
- あとで読む
AtlantisでTerraformのドリフト検出 - クラウドワークスエンジニアブログ
- 23 users
- engineer.crowdworks.jp
- テクノロジー
- 2022/09/13
こんにちは。crowdworks.jp SREチームの@kangaechuです。先日開催されたイベント HashiTalks: Japanを見ていましたが、Terraformのドリフト検出に関する発表が多く、Terraform運用において重要なポイントなんだなと感じました。流行りに乗ったわけではないですが、今回はTerraformのドリフト検出をAtlantisで行った方法をご紹介します。この記事は以下環境で検証しています。 Atlantis: 0.19.8 Terraform: 1.2.8 ドリフト検出 Terraformはインフラストラクチャを安全かつ期待通りに構築するために使用する、Infrastructure as Codeのソフトウェアです。 crowdworks.jpではAWS、GitHub、GCPの管理をTerraformで行っていますが、今回はAWSに絞って話します。
楽々スケール Digdag on GKE Autopilot の紹介とその運用Tips - ZOZO TECH BLOG
- 22 users
- techblog.zozo.com
- テクノロジー
- 2022/03/28
こんにちは、MA基盤チームの田島です。私達のチームでは複数のワークフローエンジンを利用し、メールやLINEなどへの配信を含むバッチ処理を行っていました。今回それらのワークフローエンジンをすべてDigdagに統一しました。そして実行環境としてGKEのAutopilot環境を選択したことにより、柔軟にスケールするバッチ処理基盤を実現しましたのでそれについて紹介します。また、その中で得られた運用Tipsについても合わせて紹介します。目次目次 Digdag on GKE Autopilotの構成 Digdagの4つの役割 Worker Scheduler Web API Kubernetes Command Executor Workerでのタスク実行の問題 Command Executor Kubernetes Command Executorの利用 GKE Autopilot環境でのKu
- digdag
- あとで読む
機械学習基盤をGKE Autopilotに移行してコストを削減した - LIVESENSE ENGINEER BLOG
- 22 users
- made.livesense.co.jp
- テクノロジー
- 2022/10/19
リブセンスで機械学習基盤の開発・運用をしている赤坂（yyyyskkk）です。我々のチームでは今年の７月ごろにGKE Standard（以下Standardクラスタ）上に構築していた機械学習基盤をGKE Autopilot（以下Autopilotクラスタ）に移行しました。GKE Autopilotとはノードやポッドを自動で管理してくれるクラスタです（詳しくはGoogleのブログをご覧ください）。この記事ではなぜAutopilotクラスタに移行したのか、移行する上でどんな作業が必要だったかという話を書きます。なぜAutopilotクラスタに移行したのか高額なノードが複数立ち上がる問題 system podが原因？ StandardクラスタとAutopilotクラスタの違い検証移行に必要だった作業 Argo WorkflowsのExecutorを変更したメモリ不足が発生したためres
- 機械学習
- あとで読む
Cloud Composer 2上でApache Airflow 2のワークフローを実装する - ZOZO TECH BLOG
- 21 users
- techblog.zozo.com
- テクノロジー
- 2022/03/23
はじめにこんにちはZOZOデータサイエンス部MLOpsブロック松岡です。本記事では先日リリースされたGCP（Google Cloud Platform）Cloud Composerの最新バージョンCloud Composer 2について紹介します。 ZOZOTOWNでは、多種多様な商品が毎日新たに出品されています。現在MLOpsブロックでは、機械学習で商品情報の登録を補佐するシステムを開発しています。このシステムでは商品情報を保存するデータベースへ大量の書き込み処理が発生します。このアクセスによる負荷が日常業務に影響を及ぼすリスクを最小限に抑えるため、推論処理は夜間に行います。夜間に処理を完了させるには強力なマシンリソースを使用する必要があります。コストの観点から処理が行われていない時間はマシンリソースを使用停止する必要もあります。また、人手を介さずに安定して稼働出来る仕組みも求めら
Argo Workflows: 推薦基盤向けワークフローエンジンを Kubernetes で運用して1年経ったので振り返る | Wantedly Engineer Blog
- 20 users
- www.wantedly.com
- テクノロジー
- 2021/01/06
Argo Workflows: 推薦基盤向けワークフローエンジンを Kubernetes で運用して1年経ったので振り返るこんにちは。Matching チームの笠井（@unblee）です。この記事では、おおよそ1年以上前に私が新卒入社して Infrastructure チームで一番最初に取り組んだ Workflow Engine の導入プロジェクトについての振り返り・供養をしようと思います。記事内で触れている情報・判断は全て1年以上前の時点の社内外の状況に基づいていることを前提としているため現在の最新の情報とは異なることがあります。この前提を承知した上でお読みいただければ幸いです。 Agenda問題意識技術選定PoC本番環境への導入とその障壁の解決振り返りまとめ問題意識Wantedly では以前から推薦基盤へ力を注いでおり、Wantedly Visit におけるユーザと企業の理想のマ
Google Cloud Next’24で発表されたBigQueryのアップデート情報をまとめました | DevelopersIO
- 19 users
- dev.classmethod.jp
- テクノロジー
- 2024/04/14
Google CLoudデータエンジニアのはんざわです。 Google Cloud Next'24において、各サービスで多数のアップデート情報が紹介されました。この記事では、BigQueryのアップデート情報、特にデータエンジニア向けの情報をまとめて紹介したいと思います！新機能が発表されたセッションとその内容を簡単に紹介していきます！気になる内容があった方は是非、YouTubeの動画を確認してみてください。注意点本記事の内容にBigQuery ML関連のサービスは含まれていません。不足している情報があれば随時更新します... 2024年4月13日時点では、Google Cloud Next'24で発表された機能のほとんどがリリースノートやドキュメントに反映されていません。そのため今後変更される可能性がありますので注意してください。 Build a unified, open,
AWS Glue ETLワークロードをGUIでオーケストレーションする『Workflows』を実際に試してみました | DevelopersIO
- 19 users
- dev.classmethod.jp
- テクノロジー
- 2019/06/21
AWS Glueは、ワークフローを用いて、クローラ、ジョブ（及びトリガ）の有向非循環グラフ（DAG）を作成して、ETLワークロードをオーケストレーションできるようになりました。AWS Glueが利用可能なすべての地域で利用できるようになりましたので早速試してみます。 Workflowsとは Workflowsの作成 Workflowのシナリオ新規Workflowの追加 Workflowにエンティティを追加 Workflowの実行実行結果の管理制限事項まとめ AWS Glue now provides workflows to orchestrate your ETL workloads Workflowsとは Workflowsは、既存のクローラ、ジョブ（及びトリガ）をGlueコンソール上のGUIを用いて有向非循環グラフ（DAG）を作成、実行、管理できる新機能です。これからは、クロ
Data EngineeringとKubernetes Executorの話 | メルカリエンジニアリング
- 19 users
- engineering.mercari.com
- テクノロジー
- 2019/12/24
Cityカラムが英語表記へ統一 Temperatureカラムは摂氏(℃)へ統一 Dateのカラムは、タイムゾーンをUTCに固定し、YYYY-MM-DDフォーマットへこうしてDataが整理されてInformationになることで、「最高気温を比較すると、UTC 11月15日の時点ではPalo Altoの方が高かったが、12月5日の時点では東京の方が高かった」といった事実を見ることができるようになります。このInformationから導き出される傾向や規則性を導出されたものが、DIKWピラミッドにおけるKnowledgeになります。そして頂点であるWisdomは、導き出されたKnowledgeに基づいて人により下される判断のことそのものを示します。 Data Engineeringの仕事は、このDataを過不足無く蓄えること、DataからInformationへの変換・蓄積する作業がメインと
- あとで読む
データエンジニアリングの背景を踏まえてdbt（Data Build Tool）を少し深く理解してみる - Qiita
- 18 users
- qiita.com/manabian
- テクノロジー
- 2021/12/14
概要 dbt（Data Build tool）を、前提知識となるデータエンジニアリングにおける現状を踏まえて、どういったツールであるかを説明します。dbtがデータエンジニアリングのあるべき姿としてデザインされており、共有されることが少ないデータエンジニアリングのナレッジを含むため、dbtを利用しない場合でも本記事の内容は有益な情報となっております。 dbtの概要については、下記の記事で整理しています。データエンジニアリングの技術背景ストレージコンピューティングの分離が可能なデータ処理エンジン（Spark、Presto等）がデータ分析基盤のデータストアとして用いられるようになってきています。従来であればデータレイクではデータの管理が困難であったが、レイクハウスフォーマット（Delta Lake、Hudi、Iceberg等）の開発によりデータレイクにACID特性を持たせられるようになり、デ
- dbt
「ロゴをデザインする」とはなんなのか。ロゴデザインに挑むデザイナーが考えていること｜はるかな | meln Inc.｜note
- 18 users
- note.com/gurugle
- テクノロジー
- 2019/09/08
ロゴデザイン。最近ではとても使いやすいロゴジェネレーターサービスも増え、簡単にロゴを作成することができるようになりました。そんな中でわたしたちデザイナーがロゴをつくる時、「それらとの明確な違い」をきちんと伝え、理解を得ることも非常に重要になってきたように感じています……！というわけで、今回は「ロゴ」をつくるひとの頭の中を少しだけ語ってみようと思います😎 もちろんアプローチの仕方は様々ですし、思考のすべてを書き出すととんでもない長さになってしまうので(笑)「こういうプロセスで進めるのもありだな〜」と、参考のひとつとして読んでいただけると幸いです。【🙋はじめに】 - ロゴ？シンボル？マーク？「ロゴマーク」にまつわる言葉の定義具体的にどんな風に思考しロゴをつくったかという話に入る前にひとつ確認しておきましょう。ロゴをつくるシーンでは「ロゴ」「ロゴマーク」「マーク」「シンボル」「タイポ
- logo
- ロゴ
- architecture
- デザイン
- design
- あとで読む
Announcing HashiCorp Boundary
- 17 users
- www.hashicorp.com
- テクノロジー
- 2020/10/15
Sign up for freeGet started in minutes with our cloud products TerraformInfrastructure as code provisioning‌‍‍‍‌‍‌‍‌‍‍‌‌‍‌‌‍‍‌‌‍‍‍‍‍‍‍‍‌‍‌‌‍‌‌‌‌‍‌‍‌‍‌‌‍‍‌‍‌‍‌‍‌‍‍‍‍‍‌‍‍‌‍‌‍‌‌‌‍‌‍‍‍‍‍‍‍‌‍‍‌‌‌‌‌‌‍‍‍‍‌‍‍‌‍‌‌‌‍‍‌‍‍‌‌‍‌‍‌‍‌‍‍‌‍‌‌‍‌‌‍‌‌‍‍‌‌‍‍‍‍‌‍‌‌‍‌‌‌‌‍‌‍‌‍‌‌‍‍‌‍‌‍‌‍‌‍‌‍‌‌‌‍‌‌‍‍‌‌‌‌
- hashicorp
- あとで読む
OpenSLO
- 17 users
- openslo.com
- テクノロジー
- 2021/05/20
What is OpenSLO?OpenSLO is a service level objective (SLO) language that declaratively defines reliability and performance targets using a simple YAML specification. It is released under Apache 2.0 and we welcome contributions from the reliability engineering ecosystem. SLOs are reliability targets for services that allow organizations to make better decisions in how to create, operate, and run cl
- SRE
- あとで読む
dbt exposureによるデータ基盤アウトプットの登録を自動化しました - Timee Product Team Blog
- 16 users
- tech.timee.co.jp
- テクノロジー
- 2024/03/18
はじめに課題感・背景使用しているBIツールについて BIツールの使用ボリューム感についてやったこと：概要やったこと：詳細 referenced tableにテーブル名ではなくdbtモデル名が入るようにしたことについて各種アウトプットの公開設定をmeta情報として付与する方針としたことについて tagを追加してexposureの検索性を向上させたこと exposureのnameにシートとダッシュボードのタイトルを反映する方針にしたこと今後の発展保守運用の設計カラムレベルリネージュ ✖️ exposure おわりに We're Hiring!! はじめにこんにちは。okodooonです！！データ基盤を参照したアウトプットが社内に溢れかえっていませんか？弊社は追いきれていないLookerStudioやConnectedSheetがめちゃくちゃ溢れかえっていました。そんな折
- dbt
- ツール
GitHub - activepieces/activepieces: Your friendliest open source all-in-one automation tool ✨ Workflow automation tool 100+ integration / Enterprise automation tool / Zapier Alternative
- 16 users
- github.com/activepieces
- テクノロジー
- 2023/06/03
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- Workflow
- github
- server
- webservice
- tool
- software
- あとで読む
MLflowのデータストアを覗いてみる - 株式会社ホクソエムのブログ
- 14 users
- blog.hoxo-m.com
- テクノロジー
- 2020/05/01
(2020/08/14 flavorについての記載を一部修正) はじめにこんにちは、ホクソエムサポーターの藤岡です。最近、MLflowを分析業務で使用しているのですが、お手軽に機械学習のモデルや結果が管理できて重宝しています。また、特定のライブラリに依存しないなど、使い方の自由度も非常に高いところが魅力的です。ただ、ザ・分析用のPythonライブラリという感じでとにかく色々なものが隠蔽されており、サーバにつなぐクライアントさえもプログラマあまりは意識する必要がないという徹底っぷりです。もちろんマニュアル通りに使う分には問題ないですが、ちゃんと中身を知っておくと自由度の高さも相まって色々と応用が効くようになり、様々なシチュエーションで最適な使い方をすることができるようになります。というわけで、今回はMLflowの記録部分を担う、 Experiment, Run, Artif
社内の問題を解決するためにワークフローエンジンを開発した話
- 13 users
- zenn.dev/yohamta
- テクノロジー
- 2022/04/23
要約既存の ETL パイプラインの管理を効率化するため、YAMLでワークフローを定義し、実行できるツールを開発しました。なぜ Airflow や Prefect を使わないのか？ Airflow や Prefect は素晴らしいツールですが、これらのツールでワークフロー（DAG）を定義するには、Python でコードを書く必要があります。私が関わっている環境では、すでに数十万行のシェルスクリプトや Perl スクリプトのコードがあります。この上に Python のレイヤーを重ねれば、さらに保守が難しくなってしまいます。また、既存のコードを Python に書き換えることも現実的ではありません。そのため、プログラムを書かずに、ノーコード（YAML ファイル）でワークフローを定義でき、既存のプログラムをそのまま利用できる軽量なツールを開発することにしました。 Dagu の仕組み Dag
- workflow
Argo Workflow による機械学習ワークフロー管理
- 13 users
- speakerdeck.com/livesense
- テクノロジー
- 2019/06/27
2019/06/27 Data Pipeline Casual Talk #3
[GitHub]secrets.GITHUB_TOKENで実行できる権限について簡単ながらマッピングしてみた | DevelopersIO
- 13 users
- dev.classmethod.jp
- テクノロジー
- 2020/11/25
はじめに Workflow内でREST APIをsecrets.GITHUB_TOKENと共に実行していたところ、Resource not accessible by integration というメッセージに遭遇しました。権限がないということです。 APIを実行する場合に渡すTokenとしては secrets.GITHUB_TOKEN Personal Access Token の2つと、GitHub App tokenがあります。これはGitHub Appを元にTokenを生成するというものです。権限のスコープ面からみると以下の通り。 - メリットデメリット
MLOps年末反省会: Triton Inference Server を深層学習モデル推論基盤として導入したので振り返る | CyberAgent Developers Blog
- 12 users
- developers.cyberagent.co.jp
- テクノロジー
- 2022/12/05
MLOps年末反省会: Triton Inference Server を深層学習モデル推論基盤として導入したので振り返るこの記事は CyberAgent Developers Advent Calendar 2022 の5日目の記事です。 AI事業本部でソフトウェアエンジニア（機械学習 & MLOps領域）をしている yu-s (GitHub: @tuxedocat) です1。現在は極予測LP という、広告ランディングページの制作をAIにより刷新するという目標のプロダクトに関わっています。この記事では本プロダクトのMLOpsの取り組みのうち、特に深層学習モデルをデプロイして運用する基盤についての技術選定を振り返ってみます。タイトルにあるとおり Triton Inference Server というOSSの推論基盤を導入しました。前置き: プロダクトやチームなどの環境と経緯本記
- mlops
- docker
- 機械学習
- api
- あとで読む
Airflow's Problem
- 12 users
- stkbailey.substack.com
- テクノロジー
- 2022/08/01
I wrote an entire blog post trying to pin down why I dislike Airflow. But despite my rationalizations, it came out like a break-up letter — just way too personal: Dear Airflow, I tried to make it work, I really did. But you are too old, your abstractions are clunky, and I think you’re ugly. It’s over between us. Sincerely, Stephen Which would have been fine, except I knew exactly how Airflow would
- workflow
My Writing & Coding Workflow
- 12 users
- jacobzelko.com
- テクノロジー
- 2020/12/04
My personal workflow for terminal-based coding, writing, research, and more! Hello everyone! It has been quite sometime since I last posted! Suffice it to say, I have been immensely busy the past year but I am happy to say I am able to resurrect this blog! :tada: I have thoroughly grown into my own workflow for programming, research, and writing. Today, I am happy to be able to share it with you!
- Development
- bash
Tonamelのデータ基盤 ~データモデリング編~
- 12 users
- speakerdeck.com/mashiike
- テクノロジー
- 2021/09/24
#nakanoshima_dev 9/22 18:30~ https://nakanoshima-dev.connpass.com/event/221243/ nakanoshima.dev #21 LED!! (Let's enjoy データ分析!!)の発表資料です。
- dbt
- 運用
- データ
- data
機械学習バッチ実行環境を整備した話 - pixiv inside
- 12 users
- inside.pixiv.blog
- テクノロジー
- 2022/09/13
はじめまして。機械学習チームにてレコメンドの改善を行っているgumigumi4fです。本記事では、機械学習チームの取り組みの一環として機械学習等のバッチを含むバッチ実行環境を整備した話について話したいと思います。今までのバッチ実行環境機械学習チームではピクシブ会社全体のサービスにおけるアイテムのレコメンド等を主に取り組んでおり、そのロジックは多岐に渡ります。 matrix factorizationを用いた手法 item間共起頻度に基づくシンプルなアイテムの推薦手法ニューラルネットを用いた手法これらの計算を行うためのバッチは実装者の好きな手法で実装されており、バッチを行う環境に関しても下記にようにバラバラになっていました。オンプレの機械学習用マシンに各ユーザー毎に設定したcronでバッチが実行 gitlab-ciのスケジューリングによってバッチが実行 BigQueryで完結す
- MLOps
- 機械学習
- -
- あとで読む
Vertex Pipelines で動く Kubeflow Pipelines のサンプルを公開しました - Repro Tech Blog
- 11 users
- tech.repro.io
- テクノロジー
- 2021/06/22
Repro AI Labs で Software Engineer として働いている杉山阿聖です。Repro では機械学習の基盤として GCP を用いています。今回は Google I/O 2021 で発表された Vertex AI のサービスのひとつである、機械学習パイプラインの構築・運用を行える Vertex Pipelines で動かせるサンプルを作成したのでその紹介をします。サンプルは次のリンクからお試しください。 reproio/lab_sample_pipelines この記事ではまず、機械学習パイプラインの主な要件について述べます。次に、機械学習パイプラインの構築で用いられる Kubeflow Pipelines について概要を述べます。最後に、機械学習パイプラインの構築にあたり理解が必要な Kubeflow Pipelines の仕様について、今回作成したパイプラインを例に
- 機械学習
- あとで読む
Optuna on Kubeflow Pipeline 分散ハイパラチューニング
- 11 users
- www.slideshare.net/MasaoTsukiyama
- テクノロジー
- 2020/05/01
社内の勉強会等で発表した内容を改変したものです。 MOVの「お客様探索ナビ」にOptunaを用いたハイパーパラメータチューニングを組み込んだ経緯、実際のチューニングフロー、コードベースでの解説、実験評価について、Optunaのチュートリアルを交えつつまとめました。タイトルに分散とありますがKFP上の話なので厳密には並列です。Read less