並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 7 件 / 7件

新着順 人気順

Datasetの検索結果1 - 7 件 / 7件

  • 加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実

    加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実 2024.06.21 Updated by Ryo Shimizu on June 21, 2024, 18:19 pm JST 世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。 いくつかの興味深い事象が起きているからだ。 昨日発表されたKarakuri社のLLM、「KARAKURI LM 8x7B Instruct v0.1」は、非常に高性能な日本語LLMだ。Karakuri社は今年の一月にも非常に高性能な70Bモデルを引っ提げて業界に旋風を巻き起こした。この最新のLLNは、日本語向けオープンLLMとしては初の「命令実行」チューニングを施されている。それだけでなく、RAGと呼ばれる、複数の知識を組み合わせてより正解に近い答えを導く技術や、Function

      加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実
    • 日々高度化するサイバー攻撃からお客様を保護するための取り組み:定期観測レポート(IIR vol.63 1章) | IIJ Engineers Blog

      2024年6月に発行したIIJの技術レポートIIR vol.63 1章では「日々高度化するサイバー攻撃からお客様を保護するための取り組み」をお届けします。 本報告のポイント 電子メールは引き続きビジネスやプライベートでの重要な連絡手段の一つですが、迷惑メールや、それによって引き起こされるフィッシング詐欺により、企業や個人に経済的被害が発生する状況が続いています。IIJでは継続的に迷惑メール対策に取り組んでおり、その知見から次の二点について報告を行ないます。 お客様を脅威から保護する取り組み 近年の迷惑メールは、正規のメール利用者の認証情報(ID、パスワード)を盗み、メールアカウントを乗っ取って送信されるケースが増えています。このような方法で迷惑メールが送信されると、乗っ取られた利用者自身や所属組織の評判(レピュテーション)が低下し、今後の電子メールの利用に支障が出てしまいます。 IIJセキ

        日々高度化するサイバー攻撃からお客様を保護するための取り組み:定期観測レポート(IIR vol.63 1章) | IIJ Engineers Blog
      • 金融データのスタースキーマ実装方法|zono

        はじめに本記事では、金融データの管理・分析に有効なスタースキーマの概要と実装方法を紹介します。 データレイクに格納されたテーブルからスタースキーマを作成する具体的な方法について説明します。ただし、理解しやすさを優先したので非常にシンプルかつ簡易的な設計になっています。 スタースキーマスタースキーマは、データウェアハウスやデータマートでよく使用されるデータモデルの一種です。その特徴はシンプルで直感的な構造でありながら、高いパフォーマンスと柔軟性を提供します。 スタースキーマは、中心に「ファクトテーブル」と呼ばれるテーブルを配置し、その周囲に「ディメンションテーブル」と呼ばれる複数の関連テーブルを配置する形式を取ります。 分析前のテーブル以下のような主要テーブルが存在すると仮定します。 顧客(Customer) 口座(Account) 支店(Branch) 口座取引(AccountTransa

          金融データのスタースキーマ実装方法|zono
        • BigQueryを補完する技術: DuckDBとDataflowでのデータ処理入門 - yasuhisa's blog

          背景 & Disclaimer DuckDB 概念や代表的なユースケース 使ってみる 1週間〜一ヶ月などある程度の期間、分析で使いたい場合 便利なCLIツールとして使う 所感 参考 Dataflow 代表的なユースケース 具体例 参考 背景 & Disclaimer BigQueryは非常に便利で、BigQueryにさえ上がってしまえばSQLで巨大なデータを簡単に相手にできます とはいえ、BigQueryに行きつくまでが大変な場合もありえます 例: 個人情報を含むsensitiveなデータで、BigQueryに気軽に上げられないケース 一時的であっても、相談なしにその手のデータを気軽にアップロードするのはやめてください... 数万件程度であれば手元のエクセルで開いて、問題ない行/列だけに絞る、ということもできるが、もっと量が多いデータだとそういうわけにもいかない。そもそも分析はSQLでやり

            BigQueryを補完する技術: DuckDBとDataflowでのデータ処理入門 - yasuhisa's blog
          • Vol.04 LLMOps に取り組み始めた話 - Sansan Tech Blog

            技術本部Strategic Products Engineering Unit Contract One Devグループの伊藤です。契約データベース「Contract One」の開発に携わっています。 Contract Oneでは、GPTを活用した機能をいくつか提供しています。 今回は、Contract OneのGPTを活用した機能開発のために、LLMOpsの取り組みの一環としてLangfuseを導入し始めた話をします。 なお、本記事は【Strategic Products Engineering Unitブログリレー】という連載記事のひとつです。 buildersbox.corp-sansan.com はじめに Contract Oneでは、GPTを活用した文書内検索 *1 と要約機能 *2 を約1年前にリリースし、現在も提供しています。 GPTは自然言語形式の入力をAPI形式で処理でき

              Vol.04 LLMOps に取り組み始めた話 - Sansan Tech Blog
            • Evaluate the reliability of Retrieval Augmented Generation applications using Amazon Bedrock | Amazon Web Services

              AWS Machine Learning Blog Evaluate the reliability of Retrieval Augmented Generation applications using Amazon Bedrock Retrieval Augmented Generation (RAG) is a technique that enhances large language models (LLMs) by incorporating external knowledge sources. It allows LLMs to reference authoritative knowledge bases or internal repositories before generating responses, producing output tailored to

                Evaluate the reliability of Retrieval Augmented Generation applications using Amazon Bedrock | Amazon Web Services
              • How Recent Google Updates Punish Good SEO: 50-Site Case Study - Zyppy SEO Consulting

                How Recent Google Updates Punish Good SEO: 50-Site Case Study SEOs need to rethink “over-optimization” Are recent Google updates now targeting SEO practices to demote informational sites that are “too optimized?” Using metrics provided by Ahrefs (thank you, Patrick Stox!) and collecting thousands of data points across impacted sites, I conducted a 50-site case study to look for answers. To begin w

                  How Recent Google Updates Punish Good SEO: 50-Site Case Study - Zyppy SEO Consulting
                1