タグ

2024年6月2日のブックマーク (9件)

  • Prisma ORMを2年運用して培ったノウハウを共有する

    TSKaigi 2024 ref: https://tskaigi.org/talks/tockn

    Prisma ORMを2年運用して培ったノウハウを共有する
    kiririmode
    kiririmode 2024/06/02
    Prismaを使ってRLSおよび列レベルのセキュリティを担保する
  • Retrieval-Augmented Generationシステムの改善方法の紹介 - AITC - ISID | AI トランスフォーメンションセンター コラム

    こんにちは、AI製品開発グループのファイサルです。 この記事では、Know Narrator Searchで使用されている文章参照手法、Retrieval-Augmented Generation(RAG)の精度向上方法について紹介します。 はじめに ChatGPTを始めとした大規模言語モデル(LLM)の登場により、AI業界、特に自然言語処理分野で多くの素晴らしい応用先が提案されるようになりました。 LLMは素晴らしい技術であることは間違いないですが、同時に幻覚(Hallucination)という問題を抱えています。 このHallucinationという問題は、LLMが事実と異なる情報をあたかも真実であるように回答するというもので、LLMの発表当初から指摘されていました。 この問題を解決するために、さまざまな手法が存在しますが、よく用いられるのが「Retrieval-Augmented G

    Retrieval-Augmented Generationシステムの改善方法の紹介 - AITC - ISID | AI トランスフォーメンションセンター コラム
    kiririmode
    kiririmode 2024/06/02
    RAGの精度向上へのアプローチとして、検索の評価、文書クリーニング、インデックス検証、チャンク分割、プロンプト調整、メタデータ活用、クエリルーティング、リランカーやクエリ変換を紹介
  • フロントエンドから Amazon S3 にマルチパートアップロードしたい - カミナシ エンジニアブログ

    はじめに Presigned URL(*) などで、Amazon S3 へのアップロード処理を実装していると、大きなサイズのファイルをアップロードしようとしたときに、以下のような課題に直面することがあります。 一回のPUT リクエストでアップロードできるサイズの上限が 5GB まで 単一の HTTP リクエストでアップロードするため、大きなサイズをアップロードしようとしたときに問題が起きる。例えば、アップロードの処理の途中で失敗したとき、最初からやり直しになる。 このようなときに活用したいのが、マルチパートアップロードです。マルチパートアップロードとは、その名の通り、アップロード対象のオブジェクトを小分けにしてアップロードする方法です。 AWS の SDK には、マルチパートアップロードが簡単に行えるような API が用意されているものの、多くは、S3 にアップロードを行うことができる I

    フロントエンドから Amazon S3 にマルチパートアップロードしたい - カミナシ エンジニアブログ
    kiririmode
    kiririmode 2024/06/02
    大容量ファイルのS3アップロードにおける課題として、マルチパートアップロードが効果的。IAMクレデンシャルを利用する方法とPresigned URLによる方法を実装
  • 無料で商用にも使える日本の郵便番号APIをリリースしました

    jp-postal-code-api https://github.com/ttskch/jp-postal-code-api郵便番号から住所のデータを取得できるWeb APIです。 GitHub Pagesを使用して静的なJSONファイルとして配信している ため、可用性が高いのが特徴です。また、オープンソースなのでクライアントワークでも安心してご使用いただけます。もしリポジトリの永続性や GitHub Pagesの利用制限 が心配な場合は、ご自由にフォークしてご利用ください。 日郵便によって公開されているデータ を元に住所データのJSONファイルを生成して配信しています。JSONファイルには日語表記・カナ表記・英語表記の住所データが含まれています。ただし、以下の注意事項があります。 大口事業所個別番号の住所データは以下のように出力されます(元データ の内容がそうであるため)

    無料で商用にも使える日本の郵便番号APIをリリースしました
    kiririmode
    kiririmode 2024/06/02
    日本郵便のデータから住所データを自動更新しWeb APIで提供。GitHub Pagesを使用して静的JSONファイルとして配信。大口事業所や市町村変更対応。セルフホスト可能。
  • Large Language Models are Zero-Shot Reasoners

    Pretrained large language models (LLMs) are widely used in many sub-fields of natural language processing (NLP) and generally known as excellent few-shot learners with task-specific exemplars. Notably, chain of thought (CoT) prompting, a recent technique for eliciting complex multi-step reasoning through step-by-step answer examples, achieved the state-of-the-art performances in arithmetics and sy

    kiririmode
    kiririmode 2024/06/02
    「Let’s think step by step」を追加するだけで、ゼロショット推論でも高い性能を発揮することが示されている。実験結果は、多くの推論タスクで既存のゼロショットLLMの性能を大きく上回った
  • 生成AIの能力をどう評価するか? ~激化するLLM競争を正しく見極めるために~|こへもこ

    はじめにはじめまして、ウイングアーク1stのこへもこと申します。 今回の記事では、大規模言語モデル(LLM: Large Language Models、以後LLM)の性能評価の裏側を紐解いていきたいと思います。 生成AI(Generative AI)、特にLLMの進化は目覚ましいものがあります。GPT-4o, Claude 3, Gemini 1.5, command R+など数々のモデルが登場し、その驚異的な能力により、自然言語処理(NLP)の分野だけでなく、多くの産業で応用が広がっています。(2024年5月時点) 多くの企業が自社のLLMの優れた性能をアピールしていますが、その発表を鵜呑みにすることは注意が必要です。各社の発表に対して、私たちが正しい目を養い、客観的かつ公正な視点でLLMを評価することが重要です。 記事では、LLMの評価に使用される「MMLU」という指標をベースに、

    生成AIの能力をどう評価するか? ~激化するLLM競争を正しく見極めるために~|こへもこ
    kiririmode
    kiririmode 2024/06/02
    LLMの性能評価指標としてのMMLU指標の概要・評価方法。内部ではプロンプトエンジニアリングとして0-shot Chain of Thoughtが使われている。
  • 東京都の生成AI活用事例集にツッコミを入れてみる|saip(さいぴ)

    この記事の概要 ・都職員による生成AI活用事例集を基に、ChatGPTの効果的な使い方を解説 ・プロンプト作成のコツと最新ノウハウを平易な言葉で紹介 ・具体的な指示、マークダウン記法の活用、理由の記載など実践的なテクニックを解説 ・サンプルプロンプトの修正例を通じて、より効果的な書き方を例示 ・ChatGPTとの対話を通じた論理的思考力向上の可能性を示唆 Claude 3.5 Sonnetで作成こんにちは、saip (@_saip_) です。 生成AIを利用した事業をしている株式会社TrippyでCTOを務めています。 Xで話題になっていたところてんさんの以下のポストから、「都職員のアイデアが詰まった文章生成AI活用事例集」という資料が公開されていることを知りました。 東京都もMarkdownとは言ってなくて、ハッシュタグと言ってる…… どうみてもMarkdownの見出しによる強調なんだが

    東京都の生成AI活用事例集にツッコミを入れてみる|saip(さいぴ)
    kiririmode
    kiririmode 2024/06/02
    Few-shot LearningもChain of Thoughtも、人間に対する指示の具体化や、作業する際のタスク分解・整理に準ずるもの。
  • Your API Shouldn't Redirect HTTP to HTTPS

    TL;DR: Instead of redirecting API calls from HTTP to HTTPS, make the failure visible. Either disable the HTTP interface altogether, or return a clear HTTP error response and revoke API keys sent over the unencrypted connection. Unfortunately, many well-known API providers don't currently do so. Updates 2024-05-24: Added the Google Bug Hunter Team response to the report that the VirusTotal API resp

    Your API Shouldn't Redirect HTTP to HTTPS
    kiririmode
    kiririmode 2024/06/02
    「API」リクエストのHTTPからHTTPSへのリダイレクトは、secretの漏洩を招く危険性がある。80番ポートのLISTENをやめるか、それができなければエラーを返却すべき
  • テキスト生成AI利活用におけるリスクへの対策ガイドブック(α版)

    テキスト生成 AI 利活用におけるリスクへの対策ガイ ドブック(α版) 2024(令和 6)年 5 月 30 日 デジタル庁 〔ドキュメントの位置付け〕 参考資料。今後、デジタル社会推進標準ガイドラインへの編入を検討予定 〔キーワード〕 テキスト生成 AI、生成 AI、サービス開発者、サービス提供者 〔概要〕 テキスト生成 AI を利活用し、行政サービスや職員業務の改善の重要度が高まる中、リ スクを特定し、そのリスクを受容できるレベルまでに軽減する対応もまた重要になってい る。テキスト生成 AI に関連するリスクは多岐にわたるが、その多くはテキスト生成 AI 固有 でない AI システム全般に共通するものである。そこで、文書では政府情報システムを対 象に、テキスト生成 AI 固有と見られるリスクに焦点をあて、留意点を紹介する。現段階 (2024 年 5 月現在)では、実践的なフレームワー