kiririmodeのブックマーク / 2024年6月2日

Prisma ORMを2年運用して培ったノウハウを共有する

TSKaigi 2024 ref: https://tskaigi.org/talks/tockn

kiririmode 2024/06/02

Prismaを使ってRLSおよび列レベルのセキュリティを担保する

リンク

Retrieval-Augmented Generationシステムの改善方法の紹介 - AITC - ISID | AI トランスフォーメンションセンターコラム

こんにちは、AI製品開発グループのファイサルです。この記事では、Know Narrator Searchで使用されている文章参照手法、Retrieval-Augmented Generation（RAG）の精度向上方法について紹介します。はじめに ChatGPTを始めとした大規模言語モデル（LLM）の登場により、AI業界、特に自然言語処理分野で多くの素晴らしい応用先が提案されるようになりました。 LLMは素晴らしい技術であることは間違いないですが、同時に幻覚（Hallucination）という問題を抱えています。このHallucinationという問題は、LLMが事実と異なる情報をあたかも真実であるように回答するというもので、LLMの発表当初から指摘されていました。この問題を解決するために、さまざまな手法が存在しますが、よく用いられるのが「Retrieval-Augmented G

kiririmode 2024/06/02

RAGの精度向上へのアプローチとして、検索の評価、文書クリーニング、インデックス検証、チャンク分割、プロンプト調整、メタデータ活用、クエリルーティング、リランカーやクエリ変換を紹介

rag
ai

リンク

フロントエンドから Amazon S3 にマルチパートアップロードしたい - カミナシエンジニアブログ

はじめに Presigned URL（*) などで、Amazon S3 へのアップロード処理を実装していると、大きなサイズのファイルをアップロードしようとしたときに、以下のような課題に直面することがあります。一回のPUT リクエストでアップロードできるサイズの上限が 5GB まで単一の HTTP リクエストでアップロードするため、大きなサイズをアップロードしようとしたときに問題が起きる。例えば、アップロードの処理の途中で失敗したとき、最初からやり直しになる。このようなときに活用したいのが、マルチパートアップロードです。マルチパートアップロードとは、その名の通り、アップロード対象のオブジェクトを小分けにしてアップロードする方法です。 AWS の SDK には、マルチパートアップロードが簡単に行えるような API が用意されているものの、多くは、S3 にアップロードを行うことができる I

kiririmode 2024/06/02

大容量ファイルのS3アップロードにおける課題として、マルチパートアップロードが効果的。IAMクレデンシャルを利用する方法とPresigned URLによる方法を実装

リンク

無料で商用にも使える日本の郵便番号APIをリリースしました

jp-postal-code-api https://github.com/ttskch/jp-postal-code-api 日本の郵便番号から住所のデータを取得できるWeb APIです。 GitHub Pagesを使用して静的なJSONファイルとして配信しているため、可用性が高いのが特徴です。また、オープンソースなのでクライアントワークでも安心してご使用いただけます。もしリポジトリの永続性や GitHub Pagesの利用制限が心配な場合は、ご自由にフォークしてご利用ください。日本郵便によって公開されているデータを元に住所データのJSONファイルを生成して配信しています。JSONファイルには日本語表記・カナ表記・英語表記の住所データが含まれています。ただし、以下の注意事項があります。大口事業所個別番号の住所データは以下のように出力されます（元データの内容がそうであるため）

kiririmode 2024/06/02

日本郵便のデータから住所データを自動更新しWeb APIで提供。GitHub Pagesを使用して静的JSONファイルとして配信。大口事業所や市町村変更対応。セルフホスト可能。

リンク

Large Language Models are Zero-Shot Reasoners

Pretrained large language models (LLMs) are widely used in many sub-fields of natural language processing (NLP) and generally known as excellent few-shot learners with task-specific exemplars. Notably, chain of thought (CoT) prompting, a recent technique for eliciting complex multi-step reasoning through step-by-step answer examples, achieved the state-of-the-art performances in arithmetics and sy

kiririmode 2024/06/02

「Let’s think step by step」を追加するだけで、ゼロショット推論でも高い性能を発揮することが示されている。実験結果は、多くの推論タスクで既存のゼロショットLLMの性能を大きく上回った

リンク

生成AIの能力をどう評価するか？ ~激化するLLM競争を正しく見極めるために~｜こへもこ

はじめにはじめまして、ウイングアーク１ｓｔのこへもこと申します。今回の記事では、大規模言語モデル（LLM: Large Language Models、以後LLM）の性能評価の裏側を紐解いていきたいと思います。生成AI（Generative AI）、特にLLMの進化は目覚ましいものがあります。GPT-4o, Claude 3, Gemini 1.5, command R+など数々のモデルが登場し、その驚異的な能力により、自然言語処理（NLP）の分野だけでなく、多くの産業で応用が広がっています。（2024年5月時点）多くの企業が自社のLLMの優れた性能をアピールしていますが、その発表を鵜呑みにすることは注意が必要です。各社の発表に対して、私たちが正しい目を養い、客観的かつ公正な視点でLLMを評価することが重要です。本記事では、LLMの評価に使用される「MMLU」という指標をベースに、

kiririmode 2024/06/02

LLMの性能評価指標としてのMMLU指標の概要・評価方法。内部ではプロンプトエンジニアリングとして0-shot Chain of Thoughtが使われている。

リンク

東京都の生成AI活用事例集にツッコミを入れてみる｜saip(さいぴ)

この記事の概要・都職員による生成AI活用事例集を基に、ChatGPTの効果的な使い方を解説・プロンプト作成のコツと最新ノウハウを平易な言葉で紹介・具体的な指示、マークダウン記法の活用、理由の記載など実践的なテクニックを解説・サンプルプロンプトの修正例を通じて、より効果的な書き方を例示・ChatGPTとの対話を通じた論理的思考力向上の可能性を示唆 Claude 3.5 Sonnetで作成こんにちは、saip (@_saip_) です。生成AIを利用した事業をしている株式会社TrippyでCTOを務めています。 Xで話題になっていたところてんさんの以下のポストから、「都職員のアイデアが詰まった文章生成AI活用事例集」という資料が公開されていることを知りました。東京都もMarkdownとは言ってなくて、ハッシュタグと言ってる…… どうみてもMarkdownの見出しによる強調なんだが

kiririmode 2024/06/02

Few-shot LearningもChain of Thoughtも、人間に対する指示の具体化や、作業する際のタスク分解・整理に準ずるもの。

リンク

Your API Shouldn't Redirect HTTP to HTTPS

TL;DR: Instead of redirecting API calls from HTTP to HTTPS, make the failure visible. Either disable the HTTP interface altogether, or return a clear HTTP error response and revoke API keys sent over the unencrypted connection. Unfortunately, many well-known API providers don't currently do so. Updates 2024-05-24: Added the Google Bug Hunter Team response to the report that the VirusTotal API resp

kiririmode 2024/06/02

「API」リクエストのHTTPからHTTPSへのリダイレクトは、secretの漏洩を招く危険性がある。80番ポートのLISTENをやめるか、それができなければエラーを返却すべき

security

リンク

テキスト生成AI利活用におけるリスクへの対策ガイドブック（α版）

テキスト生成 AI 利活用におけるリスクへの対策ガイドブック（α版） 2024（令和 6）年 5 月 30 日デジタル庁〔ドキュメントの位置付け〕参考資料。今後、デジタル社会推進標準ガイドラインへの編入を検討予定〔キーワード〕テキスト生成 AI、生成 AI、サービス開発者、サービス提供者〔概要〕テキスト生成 AI を利活用し、行政サービスや職員業務の改善の重要度が高まる中、リスクを特定し、そのリスクを受容できるレベルまでに軽減する対応もまた重要になっている。テキスト生成 AI に関連するリスクは多岐にわたるが、その多くはテキスト生成 AI 固有でない AI システム全般に共通するものである。そこで、本文書では政府情報システムを対象に、テキスト生成 AI 固有と見られるリスクに焦点をあて、留意点を紹介する。現段階（2024 年 5 月現在）では、実践的なフレームワー

kiririmode 2024/06/02

ai
goverment

リンク

はてなブックマーク

タグ

2024年6月2日のブックマーク (9件)

Prisma ORMを2年運用して培ったノウハウを共有する

Retrieval-Augmented Generationシステムの改善方法の紹介 - AITC - ISID | AI トランスフォーメンションセンターコラム

フロントエンドから Amazon S3 にマルチパートアップロードしたい - カミナシエンジニアブログ

無料で商用にも使える日本の郵便番号APIをリリースしました

Large Language Models are Zero-Shot Reasoners

生成AIの能力をどう評価するか？ ~激化するLLM競争を正しく見極めるために~｜こへもこ

東京都の生成AI活用事例集にツッコミを入れてみる｜saip(さいぴ)

Your API Shouldn't Redirect HTTP to HTTPS

テキスト生成AI利活用におけるリスクへの対策ガイドブック（α版）

お知らせ

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

今週のはてなブックマーク数ランキング（2024年8月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス