タグ

ブックマーク / tech.gunosy.io (11)

  • LLMのプロンプトをCI/CDで評価する。promptfooを使って - Gunosy Tech Blog

    こんにちは。 LLM事業部のUTです。 概要 promptfoo の紹介 起動 CI での評価 GitHub Action まとめ 概要 OpenAI による ChatGPT 登場の衝撃から1年ほど経ちましたが、 LLM を活用する企業はものすごく増えました。 OpenAI だけでなく、大手クラウドや Hugging Face などを通して各企業も提供しています。 遊びで使う分にはどの LLM を使うかは適当で良いかと思いますが、プロダクトとして提供する場合利用を想定しているシーンに対して、最適なモデルを選びたいと思うのは必然でしょう。 また LLM を利用してレスポンスを受けるに当たり、最も重要なのがプロンプトです。 様々な研究結果にもある通り、プロンプトの書き方一つで出力結果が大きく変わります。 欲しいアウトプットを出すプロンプトを探すには、プロンプトを複数作り比較する必要があります。

    LLMのプロンプトをCI/CDで評価する。promptfooを使って - Gunosy Tech Blog
    sh19910711
    sh19910711 2024/05/21
    "欲しいアウトプットを出すプロンプトを探すには、プロンプトを複数作り比較する必要 / promptfoo: 評価したい LLM のアウトプットに対して、別の LLM との比較を実施する関数もあり (similar, llm-rubric)"
  • S3 Inventory + Athena によるプレフィックスレベルコスト分析 ~S3 のコストをスリムに保つために~ - Gunosy Tech Blog

    プロダクト開発部 Ads チームの yamaYu です。最近体重と筋肉量をコントロールしたい願望があり、まずは可視化ということで体組成計を買いました。まだ全然成果は上がっていないですが、現状を把握できて良い感じです。 今回の記事ですが、最近取り組んだ S3 のコスト削減の施策において、S3 Inventory がコストの可視化の文脈で良い感じだったのでその話について書いていきます。 最終的に ↓ のような感じでプレフィックス別にコストを分析できるようにしました。 プレフィックス別の S3 のコストの例 課題感 S3 のストレージ使用量を把握するための選択肢 AWS CLI S3 Storage Lens S3 Inventory S3 Inventory で使用量を可視化する S3 Inventory を設定する Athena と連携する SQL を書いて分析する まとめ 課題感 Ads

    S3 Inventory + Athena によるプレフィックスレベルコスト分析 ~S3 のコストをスリムに保つために~ - Gunosy Tech Blog
    sh19910711
    sh19910711 2024/04/15
    "広告サービスのログ: ストレージサイズは 2PB / Storage Lens: 有料オプションの高度なメトリクスの一つにプレフィックスレベルでの分析 + 使用量上位のプレフィックスの一覧をダッシュボード上に表示"
  • モブプログラミング開発に ADR を導入した話 - Gunosy Tech Blog

    こんにちは、 Gunosy Tech Lab 所属の m-hamashita です。 最近は良い年明けを迎えるために dotfiles の整備をしています。好きな Neovim の plugin は reacher.nvim です。 この記事は Gunosy Advent Calendar 2022 の 20 日目の記事です。 19 日目の記事は sugiyama さんの 『Recoil を触ってみた話』 でした。 今回はモブプログラミング開発する中で ADR を導入した話をしたいと思います。 モブプログラミング開発については 8 日目の記事に詳しく書かれているので、気になる方はこちらを読んでみてください。 tech.gunosy.io ADR とは 導入の背景 ADR を作成する workflow の導入 使い方 workflow の実装 repositoryId と categoryI

    モブプログラミング開発に ADR を導入した話 - Gunosy Tech Blog
    sh19910711
    sh19910711 2024/01/25
    "モブプログラミングでの開発によって議論が活発になった一方で、決めたことが記録に残っておらず、あれなんだっけとなる / GitHub Actions から workflow を実行 + 本文、タイトル、Labels が埋まった状態の Discussion が作成" / 2022
  • 更新できるデータレイクを作る 〜Apache Hudiを用いたユーザデータ基盤の刷新〜 - Gunosy Tech Blog

    広告技術部のUT@mocyutoです。 こちらの記事はGunosy Advent Calendar 2021の4日目の記事です。 昨日は内田さんの その設定、pyproject.tomlに全部書けます - Gunosyデータ分析ブログ でした 今回はApache Hudiを用いたユーザデータ基盤の刷新を紹介します。 背景 仕組み 課題 対応策 データの持ち方を変える Apache Hudiとは 構成 Glue + PySpark Athenaによる抽出 移行し終えて 背景 Gunosyの広告システムではユーザに対して最適な広告を届けるために、接触済みのユーザに対して何度も同じ広告を出さないようにする仕組みを提供しています。 例えば、すでにある広告Aをクリックしたユーザには広告Aは再度配信しないのような設定です。 仕組み この仕組みを実現するためには以下のようなアーキテクチャになっていました

    更新できるデータレイクを作る 〜Apache Hudiを用いたユーザデータ基盤の刷新〜 - Gunosy Tech Blog
    sh19910711
    sh19910711 2021/12/08
    "Apache HudiはS3などデータレイクのファイルを更新、削除ができるデータフォーマット / Hudiを利用した理由 > Glue Data Catalogへのsync + Athenaの読み込みの公式サポート / Hudiの次のバージョンでは Kafkaの対応やdbtへの対応なども"
  • Gunosy のデータ活用を支える統合データ基盤 Baikal の話 - Gunosy Tech Blog

    はじめに Baikal について Baikal を支える技術と工夫 AWS アカウント Terraform ワークフロー基盤 Athena Lake Formation アーキテクチャ Extract & Load データ生成元 AWS アカウントにある RDS からデータ抽出 データ生成元 AWS アカウントにある DynamoDB からデータ抽出 社外の API からデータ抽出 Transform workspace に配置されたデータの変換 データ生成元 AWS アカウント内の生ログ変換 ウェアハウス内での加工 Share 今後の課題 開発の一部を他チームへの委譲 データ異常検知 BI ツールの導入 はじめに DRE チームの hyamamoto です。 新卒の方々が入社されて 4 ヶ月ということで、時の流れの速さを感じています*1。なお、現在、新卒の方々でリレー方式でブログを書いて

    Gunosy のデータ活用を支える統合データ基盤 Baikal の話 - Gunosy Tech Blog
    sh19910711
    sh19910711 2021/08/13
    "Baikal > 透明度の高い、管理・整備の行き届いたデータレイクを作る / 活用が進んだ1つの要因として Lake Formation の Cross-Account Access Permission / 自身のアカウント内にある Athena テーブルのように扱うことができるように"
  • firecrackerの中身をのぞいてみた - Gunosy Tech Blog

    Gunosy Advent Calendar 2018、8日目の記事です。昨日の記事は キヴィタスポ(人工知能) (@Civitaspo) / Twitter さんの Digdag の Plugin をたくさん作ったので紹介するよ - Gunosy Tech Blog でした。 こんにちは、 今年のre:inventはTwitchライブで観戦した oota3 です。今年も新サービスがたくさん発表されましたね。 ちなみにそのあたりの記事は 鈴木 雄登 Yuto Suzuki (@mocyuto) / Twitter さんが書いてくださっています。 tech.gunosy.io なかでも11月26日のMonday Night Liveで発表のあった、Firecrackerについて、Googleの中の人のTweetも含め、気になったので調べてみました。 Who developed Firec

    firecrackerの中身をのぞいてみた - Gunosy Tech Blog
  • Goでインメモリキャッシュを取り扱う時にハマった話 - Gunosy Tech Blog

    こんにちは、Gunosy Tech Labの片木(@jkatagi)です(普段はGunosyデータ分析ブログの方に生息しています)。 記事では社内のとあるAPIGo製)の改修をしていたときに遭遇したインメモリキャッシュの落とし穴について共有します。 普段からGoを書いている人にとっては当たり前のことかもしれませんが、アンチパターンとして共有できれば幸いです。 落とし穴にハマるGopherくん 要約 APIのアーキテクチャについて なにが起きたのか なぜ起こったのか 単体テストでは気づけなかったのか どう解決したか おわりに 要約 長くなるので最初に要約しますと 当該APIでインメモリキャッシュとして構造体のスライスを格納していた キャッシュしている値を変えてしまうとキャッシュ元も変わってしまう という事態が発生しました。 ですのでインメモリキャッシュを使う時は対象の値が変更されないこと

    Goでインメモリキャッシュを取り扱う時にハマった話 - Gunosy Tech Blog
  • Athenaのクエリ課金額をSlack通知する - Gunosy Tech Blog

    はじめに こんにちは!DR&MLOps グループの阿部です。 Gunosyには社内警察と呼ばれる人がおり、たとえばデータ可視化の際に円グラフを使うと正しい使い方を教えてくれる、母数という言葉の使い方を正してくれる、方々がいます。 今回はAthenaで課金額の高いクエリを投げるとSlackで警告してくれる、Athena課金警察というボットを紹介します。 そういえばこんな記事もありました。 data.gunosy.io さあ、高額課金者を晒し上げにしてやりましょう! 目次 はじめに 目次 どうやってやるか Lambdaの中身 結果 悩み まとめ どうやってやるか 最近 CloudWatch Events で Athenaの Query State 監視に対応したようです。 aws.amazon.com 今回はその機能を使い、Query State に変化があったときに Lambda を呼び出し

    Athenaのクエリ課金額をSlack通知する - Gunosy Tech Blog
  • ワークフロー基盤としてのEKSクラスター運用のポイントとEKS on Fargate検証 - Gunosy Tech Blog

    記事は、Gunosy Advent Calendar 2019 17日目の記事です。 昨日の記事は、中村さんによる Pythonしか知らない新卒がGunosyに入るとこうなる - Gunosy Tech Blog でした。 はじめに ワークフロー基盤について システム概要 その日はいきなり訪れた 原因究明 対策 反省点 まとめ EKS on Fargateについて 検証のポイント 検証内容 まとめ 最後に はじめに はじめましてこんにちは、Gunosy Tech Lab1 Data Reliability & MLOps Group2の大関(@mageyuki)と申します。 弊チームでは、 Gunosyにおける統合データ基盤 集約したデータを活用した機械学習基盤 Gunosyの社是である「数字は神よりも正しい」を根底から支える、重要な2つの基盤の開発運用を行っています。 私は主にAWS

    ワークフロー基盤としてのEKSクラスター運用のポイントとEKS on Fargate検証 - Gunosy Tech Blog
  • AWS Neptuneを使ってニュースパスのコメント機能をGraphDBで実装・運用する方法 - Gunosy Tech Blog

    こんにちは。ニュースパスのサーバーサイドエンジニアをしているmanoです。 昨年末から、ニュースパスで記事にコメントができるようになりました。 そのコメントデータを、AWS Neptuneを使ってグラフ構造で保持しています。 今回は、その実装・運用について書きたいと思います。 AWS Neptuneって? AWS Neptuneは、GraphDBが扱えるAWSのフルマネージドサービスです(詳しくはこちら)。 マスター・レプリカ構成のクラスターを作ることができ、レプリカは最大で15まで並べることができます。 GraphDBとのやりとりについて、Neptuneは「グラフトラバーサル言語」であるGremlinとSPARQLをサポートしているので、このいずれかで実装することになります。私はどちらも「なんじゃそりゃ」というところからのスタートだったので、直感的に書き方がしっくりきたGremlinを使

    AWS Neptuneを使ってニュースパスのコメント機能をGraphDBで実装・運用する方法 - Gunosy Tech Blog
  • Digdag の Plugin をたくさん作ったので紹介するよ - Gunosy Tech Blog

    こちらは Gunosy Advent Calendar 2018、7日目の記事です。なお、昨日の記事は @yutanim さんの RxSwiftにおける孫からの祖父母孝行 でした。 qiita.com はじめに こんにちは、広告技術部の キヴィタスポ(人工知能) (@Civitaspo) / Twitter です。 Gunosy に入社してから早いもので1年が経ちました。昨年の Gunosy Advent Calendar では僕は読む専門だったのですが、『Gunosyのパーソナライズを支える技術 -ワークフロー編-』を読んで非常に感銘を受けたのを覚えています。 tech.gunosy.io ここではそのとき感銘を受けた言葉を紹介しておきます。 ワークフローは、いわばシステム上における兵站といってもいいでしょう。「戦争のプロは兵站を語り、戦争の素人は戦略を語る」という名言もあるくらいで

    Digdag の Plugin をたくさん作ったので紹介するよ - Gunosy Tech Blog
  • 1