sh19910711のブックマーク / 2024年6月12日

Streamlit in SnowflakeでCortexと対話できるチャットアプリを作ってみた - Qiita

はじめに先日SnowflakeでサポートされているStreamlitのバージョンがv1.26.0まで上がり、それに伴ってStreamlitのチャット機能がStreamlit in Snowflake（SiS）でも使えるようになりました。 Snowflakeでは生成AIの機能であるCortex LLMも一部リージョンではpublic previewになっているため、これらを組み合わせてチャットアプリを作ってみました。 Snowflake Cortexとは Snowflake上から機械学習や生成AIを使える機能で、MLベースのモデルやLLMベースのモデルを利用できます。 LLMベースのモデルでは以下の関数を利用できます。 COMPLETE: プロンプトが与えられた場合、プロンプトに対応する応答を返す EXTRACT_ANSWER：ドキュメント（英語のテキストかJSONデータ）と質問が与えら

sh19910711 2024/06/12

sh19910711 2024/06/12

"なぜ多くの人に読んでもらえるブログ記事とそうでないものがあるのか / 人間の「文化」のありようを、生物進化の原理で理解・説明しよう / 学術コミュニティ内での科学的アイディア継承などなど" 2016

リンク

"念頭にあること: xの値が似ているサンプル同士はyの値も似ている→サンプル間におけるyの値の関係はxの値の関係から計算できる / 分布: xの値が1つ与えられたときyの値にばらつきがある" 2017

リンク

sh19910711 2024/06/12

"新しいencoding調べてるときとかはバイナリどうなってるのか気になる / `xxd -b`とかでみれるがGoプログラムから柔軟に使いたい / 標準のencoding系のパッケージはioの扱いとかで勉強になるのでおすすめ" 2022

リンク

レシピ動画からサムネイル画像を自動抽出するAIシステムを作りました - every Tech Blog

はじめに DELISH KITCHENでデータサイエンティストをやっている山西です。今回はレシピ動画のサムネイル画像の自動抽出の取り組みについて紹介いたします。 OpenCVを用いた画像処理画像とテキスト情報のペアを扱う大規模モデル等を用いつつそれを試みた事例になります。 ※記事後半で具体実装を扱っている部分では、周辺知識がある前提で説明を進めていることをご了承ください。 every Tech Blog Advent Calendar 2024(夏) 9日目の記事になります。出来たもののイメージどんなものが出来たかを先に紹介します。一言で表すと、レシピ動画の中から「調理手順を表すのに良い感じのサムネイル画像」をAI的振る舞いで自動で抽出してくれるシステムになります。これをワンパンカルボナーラというレシピに適用した例を以下に載せています。図1: AIシステムによるレシピサムネ

sh19910711 2024/06/12

"調理手順を表すのに良い感じのサムネイル / 各フレーム画像の特徴点を抽出し、動画内の前後のフレームの特徴点の総当たりマッチング / CLOOB: CLIPの改良版として、rinna社によって提供"

リンク

【Elasticsearch社内勉強会】Lucene IndexSearcher を読む - Qiita

これは何？最近、社内で Elasticsearch/Lucene 勉強会を毎週ガヤガヤとやっています。今週の私の担当は、Luceneの検索メソッド IndexSearcher.search の処理の流れを追っていきます。準備まずは、手元でデバッグするために、Luceneインデックスの作成と簡単な動作確認をしておきます。インデックスの作成インデックスの作成には、 IndexWriter を用いますが、詳細は、 @po3rin さんのブログに譲ります。 Directory directory = FSDirectory.open(Paths.get("./data/index")); StandardAnalyzer analyzer = new StandardAnalyzer(); IndexWriterConfig config = new IndexWriterConf

sh19910711 2024/06/12

"IndexReader: Lucene のインデックスを読み取るための抽象クラス + インデックスは複数のセグメントに分割されて管理 / 各セグメントごとにクエリを適用 + 各セグメントの結果を集計" 2020

リンク

無料版Herokuで「Mecab＋軽量化NEologd」を使った形態素解析に成功した

新語などに対応したNEologd＋Macabを使った形態素解析をHeroku上で行うことに成功したので軽量化手法とともにご紹介します。手順だけ教えろって方は後半を見てください。（どうせ来月には忘れている自分のためです） NEologdはHerokuで使えない「mecab-ipadic-neologd」とはMacabを新語などに対応させた辞書のことで、例えば通常のMecab辞書だと「鬼滅の刃」は一つの固有名詞だと認識できません。しかしNEologdを辞書として使うとことで固有名詞として形態素解析を行ってくれます。 $ mecab -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd 小宮果穂名詞,固有名詞,人名,一般,*,*,小宮果穂,コミヤカホ,コミヤカホ EOS 軽量化すればいい！ネット上にある殆どの記事は「無

sh19910711 2024/06/12

"Herokuの無料枠では容量制限500MB / しかし、公式ドキュメントにて提示されている軽量化手法を使えば制限をかいくぐって使うことが可能 / 辞書のビルド時に --eliminate-redundant-entry パラメータを渡す" 2022

リンク

End-to-End Object Detection with Transformers (DETR) の解説 - Qiita

最近、Arxiv Sanity Preserverで上位にランクインしていた、Facebookから20/5/27に公開のObject Detection論文 DETRについて解説する。概要 NMSやRPN等のごちゃごちゃした仕組み無しで、CNN＋Transf ormerの極めてシンプルな構成で真にEnd to Endな物体検出を実現する。その上で、最近の最前線クラスの物体検出器に匹敵する性能を達成している。（テクニカルに色々してるが、新規性は従来のRNNをTransf ormerに置き換えている所）このシンプルな構成のおかげで拡張が容易で、この論文ではDETR物体検出器をSegmentationタスクにも拡張し、SOTA級のアーキテクチャを上回る性能を叩き出している。 NMSをなくして、Transf ormer化に至るまでの背景現在よく使われてる物体検出器では、処理の途中過程にあるNM

sh19910711 2024/06/12

"DETR: CNN＋Transformer + End to Endな物体検出 + ハンガリアン法で一意かつ適切な対応付け / object query（学習値）とspatial positional encoding（固定値）の両方を場所毎に使い分けることで精度を上げている" 2020

リンク

Kdd 2021 読み会(clustering for private interest-based advertising & learning a logistic model from aggregated data)

sh19910711 2024/06/12

"プライバシー保護: 欧州でGDPR（'18/05） + アメリカでCCPA ('20/01) + iOS14.5, ATT ('21/04) / 広告をclickした後のユーザー行動計測が困難に / FLoC: KDD2021で初めてFLoCの仕様に関する論文が公開 / SimHash: LSHファミリー"

リンク

Chrome の組み込み AI Gemini Nano を試してみる

インストールが完了したらアドレスバーに chrome://flags と入力して設定画面を開きます。以下の 2 つのフラグを設定します。 Enables optimization guide on device: Enabled BypassPerfRequirement Prompt API for Gemini Nano: Enabled また、あらかじめ Gemini Nano のモデルをダウンロードしておく必要があります。アドレスバーに chrome://components/ と入力して Optimization Guide On Device Model の「アップデートを確認」をクリックします。 Gemini Nano を使ってみるそれでは、Gemini Nano を使ってみましょう。以下のコードをコンソールに貼り付けて実行します。 const canCreate = aw

sh19910711 2024/06/12

"Chrome 126 から ~ / Prompt API: JavaScript から Chrome に組み込まれた Gemini Nano にアクセスして生成 AI の機能を実装 / あらかじめ Gemini Nano のモデルをダウンロード"

リンク

タグ

2024年6月12日のブックマーク (82件)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第5週）

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

公式Twitter

キーボードショートカット一覧

公式Twitter

はてなのサービス