nikkie-ftnextのブックマーク - はてなブックマーク

Arize Phoenixで始めるお手軽RAG実験管理 - Re:ゼロから始めるML生活

最近RAGアプリケーションの評価やその管理ツールについて調べることがありました。今回はRAGアプリケーションでの実験管理に使用できるPhoenixを使ってみたのでそのメモです。 RAGアプリケーションと評価 RAGアプリケーションの評価 Arize Phoenix 類似ツール使ってみる Tutorial ローカルでの管理参考文献感想 RAGアプリケーションと評価 Retrieval-Augmented Generation (RAG)は、LLMに外部の知識ソースからの追加情報を提供することで、LLM自体が知らない知識を補い、より正確で文脈に沿った答えを生成するアプリケーションです。大まかには下記のような流れで動作します。ユーザーからのクエリをもとに関連するドキュメントを検索 (retrieve) ユーザーのクエリ、関連するドキュメントを含めた形でプロンプトを動的に作成 (Aug

nikkie-ftnext 2024/04/29

リンク

96回目『夜のクラゲは泳げない（1～4話）』4人で作るひとつの作品が最高すぎる！ - 言いたいことを言いたいだけ

どうも、シオンです。気がつけば前回から１００日以上が経過していて、いつの間にやら春アニメが始まってしまいました。時の流れは早いですね。これからまたちょこちょこ記事を書いていけたらいいなと思っています。今期のアニメで、オリジナル作品を３つ見ているんですが、そのどれもがなかなか面白い！ということで、それぞれを個別記事で書いていこうかなと思います。今回はタイトルにある通り、『夜のクラゲは泳げない』という作品について語ろうと思います。あらすじ面白いところ推しキャラについて曲についてまとめあらすじあらすじはホームページとか見れば載ってるので細かくは書きませんが、４人の少女が覆面アーティスト「JELEE（ジェリー）」として活動していくという話ですね。メンバーはイラストレーターの「海月ヨル」こと光月まひる、元アイドルで作詞兼ボーカルの「JELEE/橘ののか」こと山ノ内花音、音大付属高校に

nikkie-ftnext 2024/04/29

リンク

Spring BootでWebアプリを作るときの第一歩 - （仮）

Spring Bootで初めてWebアプリを作ろうとすると最初につまづくのが「どういうライブラリ組み合わせればええんや…」というポイントなので、自分の中にある選定パターンをメモします。ここで説明するのはWeb層とDBアクセス層をどうするかという部分だけです。あまり真面目な記事ではないので、ちゃんとした情報を知りたい人はSpring Academyとかを見るのが良いと思います。マイ・パターン灰色になっているのは仕事では使ったことのない組み合わせです。 Spring WebFlux + Spring Data R2DBC Spring初心者は無視して良いです。自分も使ったことがあるのはDBアクセスなしのWebFluxだけです。 Microservicesで言うところのAPI Gatewayだったりリバースプロキシだったり、特定のユースケースのときしか選択肢に上がりません。 Spring

nikkie-ftnext 2024/04/27

リンク

Hono + React + Chart.js + TanStack Router + TanStack Query を使って、Hono製APIのレスポンスをPie chartとして表示してみた - メモ的な思考的な

前回、Chart.jsのPie chartをReactで表示してみました。 React + react-chartjs-2 + Chart.js を使って、Pie chart を表示してみた - メモ的な思考的なその続きとして、次はバックエンドからのレスポンスを React + Charts.js で描画したくなりました。バックエンドは今までさわったことがないもので作ろうと考え、気になっていた Hono を使うことにしました。 Hono - Ultrafast web framework for the Edges https://github.com/honojs/hono では、HonoとReactをどう組み合わせればよいか調べたところ、以下の記事が参考になりました。 HonoでAPIだけ作って素のReact DOMでSPAを書くアーキテクチャ HonoでAPI付き雑React S

nikkie-ftnext 2024/04/27

リンク

『世界一流エンジニアの思考法』実践ポイント5選 - 虎の穴開発室ブログ

こんにちは、虎の穴ラボのA.M.です。今回は書籍のご紹介です。読んだきっかけ直近のタスクで自身の生産性があまり良くなかったので、何か良い本がないか探していたところ、この本を見つけました。試し読みをしてみたところ、以下のような内容があり、自分の課題に対して解決策が書かれているように感じたので、購入しました。どうやったら不得意なことでも効率よく人並みのことができるのか「思考法」（マインドセット）が高い生産性を形づくっている AI時代を生き延びる思考法基本情報タイトル世界一流エンジニアの思考法著作者名牛尾剛ページ数 222ページ発売日 2023/10/23 発行文藝春秋 ISBN 978-4163917689 紹介ページ『世界一流エンジニアの思考法』牛尾剛 | 単行本 - 文藝春秋BOOKS 書籍の目次第１章　世界一流エンジニアは何が違うのだろう？―生産性の高さ

nikkie-ftnext 2024/04/25

リンク

『DIE WITH ZERO』読んだ〜一刻も早く「経験」に金を使え〜 - Shimpei Wakida's Blog

DIE WITH ZERO 人生が豊かになりすぎる究極のルール作者:ビル・パーキンスダイヤモンド社Amazon 久々に生き方アップデートされる系の本に出会った。人は老後のために過剰に資産を溜め込むが、その多くはほとんど使われることなく、なんなら老後も資産を増やし続けて死ぬ。そんなことをしている暇はなく、今できる「経験」に金を使え！経験こそが人生で最も大切なことである！というのが本書の主張。余分なお金を稼ぐということは、そのお金を稼ぐだけの時間も無駄にしている。そして、年齢を重ねるほどに体は衰えていき、やりたいこと（やれること）もどんどん減ってくる。老後に必要な資金も含めてあり金を全部使えということではなく、必要な最小限だけ用意しておき、残りは経験に投資しようねという話。経験は、「思い出の配当」として死ぬまでずっと人生を豊かにしてくれる。また、お金・時間・健康のバランスが大事で

nikkie-ftnext 2024/04/25

リンク

GoogleのMLOps実践ホワイトペーパー Practitioners Guide to Machine Learning Operations (MLOps) 要点まとめ - 肉球でキーボード

Googleが公開した、MLOps実践のためのホワイトペーパー GoogleがMLOps実践のためのホワイトペーパーを公開しています。 Practitioners Guide to Machine Learning Operations (MLOps) 2021年5月に公開されたものですが、2024年現在に読んでも色褪せない内容だったので、各章の要点をまとめました。 TL;DR Googleが2021年5月に公開したMLOpsの実践のためのホワイトペーパー MLOpsライフサイクルの全体像・コア機能を解説コア機能: 実験、データ処理、モデル学習、モデル評価、モデルサービング、オンライン実験、モデル監視、MLパイプライン、モデルレジストリ、データセット・特徴量レポジトリ、MLメタデータ・アーティファクトトラッキング MLOpsのコアプロセスの詳細を解説コアプロセス: ML開発、学習の運用

nikkie-ftnext 2024/04/25

リンク

アウトプットってどうやったらできるようになるん？？？半歩前進するための考え方 - 世迷言ラボの世迷言

「エンジニアたるものブログ等でアウトプットせい！」みたいな風潮あったりしませんか？ブログ書いている私が言うのもアレですが、けっこう辛いと感じる人も多いと思っています。一方でどうやったらアウトプットできるようになるか、いい感じにまとまっている情報ってあんまりなくて、いろいろすっ飛ばして「学んだことをブログに書いてみよう」で終わってたりします。 0から0.5に進むための考え方を紹介します。今北産業のまとめです。インプットをうまくアウトプットに変換しようアウトプットは型があるので、構成に迷わないように先に勉強しておこうまずは自分のためで良い前提そもそもアウトプットって何？アウトプットへの考え方インプット（=データ）を「解釈する」ためのテクニックずらす深ぼり混ぜるアウトプットの型に沿う体験をアウトプットする場合学びをアウトプットする場合エラーへの対応方法等をアウト

nikkie-ftnext 2024/04/22

リンク

このブログの全エントリで学習した極小規模言語モデルを作った - Copilot試してみた日記 - きしだのHatena

ブログの全エントリを読み込むコード作ったので、とりあえずこれで学習して極小規模言語モデルを作ったら面白かろう、とやってみました。というとかっこいいけど、まあ形態素解析して続く単語の頻度を覚えておいて、頻度に応じた単語をつなげていうという、Twitter老人会の方ならご存じの圧縮新聞ですね。圧縮きしだのHatenaか。まあ、ここではてなブログのアーカイブを読み込むコードを書いたので、これで何かしたら面白かろうなと。 GPTのEmbeddingを利用してブログの投稿に対する近いものを探し出す - きしだのHatena それで、以前圧縮新聞ぽいものを作っていたので、これを改めてはてなブログをデータに作ってみた感じです。 Igoという形態素解析器をつかって圧縮新聞っぽいものを作ってみる - きしだのHatena 圧縮新聞のアカウントは凍結されていますが、雰囲気はこちらを。圧縮新聞さん迷言集

nikkie-ftnext 2024/04/21

リンク

Megatron-LMとGKEで作るMixtral 8x7Bを語彙拡張継続事前学習 Part1 ~学習コードとモデルの先行公開~ - ABEJA Tech Blog

こんにちは！ABEJAでデータサイエンティストをしている大谷です。 ABEJAは国立研究開発法人新エネルギー・産業技術総合開発機構（以下「NEDO」）が公募した「ポスト5G情報通信システム基盤強化研究開発事業／ポスト5G情報通信システムの開発」に当社提案の「LLMの社会実装に向けた特化型モデルの元となる汎化的LLM」が採択されたことを受け、LLMの事前学習を実施しました。以降、本LLMプロジェクトをGENIAC（Generative AI Accelerator Challenge）と表記します。開発内容は表題の通り、Mistral社のMIxtral 8x7Bをベースにした日本語の語彙拡張版継続事前学習です。弊社が調べた限り、Megatron-LMでMixtralモデルを継続事前学習するソースコードは2024年4月12日時点（執筆時）では存在していません。 GENIACの計算資源提供の

nikkie-ftnext 2024/04/20

リンク

子育てエンジニアのためのキャリア会議に参加してきた - 天の月

forkwell.connpass.com こちらのイベントに参加してきたので、会の様子と感想を書いていこうと思います。(最初の部分は聞けず途中参加でした) 会の概要会の概要産休/育休はキャリアのブランクか？産休/育休を取得する際の心理的ハードルは？会社からあってほしい支援は？今より子育て支援に手厚い企業があった場合転職を検討するか？復職後にスキル面での不安はあったか？産休/育休の心理的ハードルを下げるために企業に求めることは？社外コミュニティ活動は継続していたのか？タイムマネジメントの工夫男性側の育休はどれくらい取るべきか？未就園児を見ながらどうキャッチアップ時間を確保しているのか？パートナーはどれくらい子育てに参加してくれていたのか？在宅勤務時の子どもとの向き合い方今後の展望会全体を通した感想会の概要子育ては、人生の大きなイベントです。これまでの生活

nikkie-ftnext 2024/04/19

リンク

記事執筆のモチベーションを維持するために「人の役に立つ」ことを諦める - yuki-uchidaの雑思考

2024年は、「技術発信を頑張る」というのを目標にしている。この目標は1月に設定して、既に3か月が経過しているが、今のところ上手くいっていない。書いた記事はまだ二つだけで、この記事を書くにもかなり苦労した。 zenn.dev zenn.dev 目標を設定したときはモチベーションに満ち溢れていたが、記事を書こうとしたときには既にモチベーションの低下が始まっていて、一週間くらいかけて”頑張って”記事を書いた。なんで「モチベーションが下がっているんだろう」というのを考えて、自分なりに理由が見つかったのでまとめておく。モチベーションを低下させる要因一つ目は、「記事を執筆して出すまでのリードタイムが長くなるとモチベが低下する」という点。以下の記事に以下の記載があった。私が記事を書くときはネタの賞味期限を意識しています。これは読み手が考える賞味期限ではなく、書き手である執筆者のブログを

nikkie-ftnext 2024/04/19

リンク

Googleが公開している「CodeGemma-7b-it」を「ChatUI」から使用する - パソコン関連もろもろ

はじめに「Llama.cpp」と「ChatUI」を使用しています。それぞれの使い方はこちらを参照して下さい。 touch-sp.hatena blog.com touch-sp.hatena blog.com 使い方「Llama.cpp」の実行 ./llama.cpp/server -m llama.cpp/models/codegemma-7b-it-f16.gguf -c 2048 -ngl 29「-ngl」でGPUを使用するLayerの数を指定します。おそらくこのモデルの最大値は29だと思います。 llm_load_tensors: offloading 28 repeating layers to GPU llm_load_tensors: offloading non-repeating layers to GPU llm_load_tensors: offloaded 29/29

nikkie-ftnext 2024/04/18

リンク

検索クエリパーサー自作入門 - LegalOn Technologies Engineering Blog

はじめにこんにちは。株式会社LegalOn Techno logies でエンジニアをしております、勝田(@WinField95)です。この記事は、情報検索・検索技術 Advent Calendar 2023 の 20日目の記事として執筆されました。この記事では、ANTLR[1]を使用したシンプルなクエリ構文の解析を行う検索クエリパーサーの生成と、解析結果から Elasticsearch の Query DSL[2]への変換までのプロセスと簡単な実装を紹介します。実務では、要求に応じて複雑なクエリ構文の文法定義が必要になる場合もありますが、この記事ではなるべく簡単なクエリ構文を取り扱います。解説で使用するコードは、この GitHub のリポジトリで公開しますので、参考にしてみてください。また、Search Engineering Tech Talk 2023 Winter では、この記事

nikkie-ftnext 2024/04/18

リンク

ネットワーク分析を用いた文書参照関係の分析 - LegalOn Technologies Engineering Blog

はじめに株式会社LegalOn Techno logies でデータアナリストをしている高木要です。LegalOn Techno logiesではデータ分析業務に積極的に取り組んでおり、我々データアナリストチームは各部門のステークホルダーとともに製品やビジネスの価値をデータから評価できるようにデータ分析を行なっています。分析内容は多岐に渡り、製品利用状況や営業データなどを用いて、プロダクト開発やビジネスにおける意思決定精度の向上に努めています。今回は「ネットワーク分析を用いたお客様の法律文書ナレッジマネジメント状況の可視化」についてご紹介いたします。背景今回の分析は、営業チームからの「お客様のナレッジマネジメント状況を可視化し、把握したい」という依頼を受けて行なったものです。ナレッジマネジメントとは一般的には「知識を共有して活用することで、新たな知識を創造しながら経営を実践すること」

nikkie-ftnext 2024/04/18

リンク

Hypothesisとpytestを使ってDjangoのユニットテストを書く - 何かを書き留める何か

Hypothesisとは何か、プロパティベーステストとは何か Hypothesisは、Python向けのプロパティベーステストのライブラリである。プロパティベーステストは、生成された多数の入力データに対してプロパティ(性質)が満たされるかどうかをテストする手法である。 HaskellのQuickCheckライブラリが初出で、現在は各プログラミング言語に移植されている。従来のユニットテストは、ある程度固定したテストデータを指定してテストを行っていた。その際、境界値分析などで妥当なパラメータを決定していた。しかし、境界値分析が必ず通用するとは限らないし、人間が行う以上、ミスも発生する。プロパティベーステストはデータを固定する代わりにそのデータが満たすプロパティを指定してテストを行う。実際のテストケースはHypothesisがプロパティを満たすパラメータを決めて生成してくれる。人力

nikkie-ftnext 2024/04/18

リンク

コサイン類似度のいろんな書き方 - どこにでもいるSEの備忘録

前にこんなことやってました。 www.nogawanogawa.work コサイン類似度の計算を高速化したくなることがちょくちょくあるのですが、「ぶっちゃけどれくらいのスループットが出せるもんなの？」というのが気になったので完全に興味本位でやってみます。コサイン類似度定義と素朴なpythonでの実装コサイン類似度の2つの計算パターン諸条件 2つのベクトルの配列間ですべての組み合わせのコサイン類似度を計算 baseline numpy sklearn xlr8 pytorch jax Numba 実行速度結果 2つのベクトルの配列間で同じインデックスの組み合わせのコサイン類似度を計算 baseline numpy jax Numba 実行速度結果使用したコード参考文献感想コサイン類似度定義と素朴なpythonでの実装コサイン類似度は下記のような式になります。これがなんの

nikkie-ftnext 2024/04/18

リンク

Stability AIが公開している「stable-code-instruct-3b」を「ChatUI」から使用する - パソコン関連もろもろ

はじめに以前「stable-code-instruct-3b」をPythonスクリプトから使用したことがあります。 touch-sp.hatena blog.com 今回は「Llama.cpp」と「ChatUI」の組み合わせで「stable-code-instruct-3b」を使用してみます。「Llama.cpp」と「ChatUI」の使い方はこちらを見て下さい。 touch-sp.hatena blog.com 使い方「Llama.cpp」の実行 ./llama.cpp/server -m llama.cpp/models/stable-code-3b-q5_k_m.gguf -c 2048 -ngl 16 「ChatUI」内の「.env.local」ファイルの中身「.env.local」ファイルの中身を書き換えることが色々なモデルを使用する時の障壁となります。今回はこのようにしました。

nikkie-ftnext 2024/04/17

リンク

DjangoのModelとChoices - 何かを書き留める何か

まとめ Choices クラスの登場により、ModelのFieldにある choices を指定しやすくなった。しかし、Choices クラスを使っても、ModelのFieldにある choices では、データベースに入る値を制限できない。 CHECK制約を使えばデータベースに入る値を制限できる、Choices クラスの属性を活用することもできる。 Choices クラスに __empty__ 属性を指定した場合は少し注意が必要かもしれない。 ModelのFieldにある choices を指定した状態でModelFormを実装すると、期待するバリデーションを備えたFormができる。愚かなる者よ、何故に『戦い』に身を置く？何かを守るためだそういう話は……興味ない選択肢を出したのだから選択肢から選んでよ Django 3.0から、Modelを定義する際に Choices クラスが

nikkie-ftnext 2024/04/17

リンク

Object-Oriented Conference 2024に協賛しました！~初オフラインイベントスポンサーの裏側~ - コドモン Product Team Blog

こんにちは！ Engineering Officeチームのおかぱるです。今回はコドモン開発チームが初めてオフラインイベントのスポンサーをすることになったObject-Oriented Conference 2024（以下OOC）についてです！スポンサーをすることになった背景、準備やイベント当日の様子、ふりかえりまでを記事にしていきます。イベントに向けたチームの雰囲気を知りたい方、またオフラインイベントの裏側が気になっている方がいましたら、ぜひご覧ください💪 スポンサーをすることになった背景スポンサーとして準備することと運営メンバー準備〜当日の様子ブースノベルティ幕間CM セッションふりかえりよかったこと👍 コドモンが得た学びをコミュニティに還元することができたたくさんの方にコドモンを知っていただけたブースでいろいろな方と交流をすることができた次回以降改善したいこ

nikkie-ftnext 2024/04/16

リンク

はてなブックマーク

タグ

nikkie-ftnextのブックマーク (1,014)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス