並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 5 件 / 5件

新着順 人気順

Databricksの検索結果1 - 5 件 / 5件

  • RAGによる社内ナレッジを活用したチャットボットの構築 - Qiita

    Databricksでは上記いずれのアプローチを選択した場合でも、効率的にLLMを開発・運用するための機能を提供可能ですが、本ブログではDatabricksのLLMプラットフォームとしての優位性をより具体的にご理解いただくため、元のモデルに対する追加トレーニングなしで最新のデータを活用可能であることから注目を集めている、RAG(Retrieval Augmented Generation)によるチャットボットのユースケースにフォーカスしてご説明します。 RAG(Retrieval Augmented Generation)のアーキテクチャ 参考ドキュメント:Databricks での Retrieval Augmented Generation (RAG) RAGは強力で効率的な生成AI技術であり、ドメイン固有の知識にアクセスする必要があるチャットボットやQ&Aシステムでの活用において多く

      RAGによる社内ナレッジを活用したチャットボットの構築 - Qiita
    • プロダクトエリア採用の1年を振り返って: プレイドのFY24の成果と今後の展望|PLAID

      こんにちは、プロダクトエリア採用責任者の韓 徹(kantetsu)です。(プレイドのプロダクトエリアとは、プロダクト開発を担うエンジニア・デザイナーやプロダクトマネジメント・グロースなどを担う人たちが所属している部門です。) 本記事では、プレイドのFY24(2023年10月~2024年9月)の採用活動の成果と今後の展望について紹介します。 この記事は採用活動に携わっているエンジニアやデザイナーの方、エンジニアやデザイナーと協力して採用活動をしている人事担当の方をはじめ、プロダクト組織づくりに携わっている・携わろうとしている方、技術広報に取り組んでいる方に読んでいただけると嬉しいです。 また、この記事を読む前に、なぜエンジニアだった私が採用に携わっているのかを知りたい方は去年の年末に書いたブログもあわせて読んでもらえると、この記事もより面白く読んでいただけると思います。 FY24の活動サマリ

        プロダクトエリア採用の1年を振り返って: プレイドのFY24の成果と今後の展望|PLAID
      • Gemma 2 2B 日本語ファインチューニング & TPUv3-8 + Kaggle Hub公開

        このノートブックでは、Googleが新たにリリースした軽量ながらも高性能な言語モデル Gemma 2 2B を、日本語データセット databricks-dolly-15k-ja でファインチューニングする方法を紹介します。さらに、KaggleのTPU v3-8を活用することで、効率的な学習を実現します。ファインチューニング後、モデルをKaggle Hubにアップロードする手順までを解説します。 この記事は、大規模言語モデル(LLM)の学習に興味がある初心者の方々を対象としています。 各ステップで丁寧な解説を加え、コードブロックには詳細なコメントを付与することで、スムーズに理解を進められるように工夫しました。 環境設定 まずは必要なライブラリをインストールし、TPUを使用するための環境設定を行います。 # 必要なライブラリのインストール !pip install -q -U keras-n

          Gemma 2 2B 日本語ファインチューニング & TPUv3-8 + Kaggle Hub公開
        • DatabricksにおけるSaaSデータ統合をノーコードで CDataが橋渡し

          CData Software Japanは、2024年11月13日、データコネクティビティプラットフォーム「CData Connect Cloud」とDatabricksのデータ仮想化機能「Lakehouse Federation」の製品連携を開始した。 Lakehouse Federationは、各種RDB・DWH に対してシームレスにクエリの実行が可能なクエリーフェデレーションプラットフォーム。様々なSaaSのデータをノーコードでつなげられるCData Connect Cloudと同製品が連携することで、統合データ分析基盤のDatabricksにおいて、RDB・DWH だけでなく各種SaaSとのデータ統合・連携が可能になる。 Databricksユーザーは、ノーコードでSaaSデータの分析環境を構築できるようになり、統合したデータは、Databricksの「Unity Catalog」

            DatabricksにおけるSaaSデータ統合をノーコードで CDataが橋渡し
          • DatabricksでSparkとDelta Lakeワークロードを最適化するための包括的ガイド - Qiita

            イントロダクション このドキュメントは、基本的なDatabriks、Apache Spark™、Delta Lakeのベストプラクティスと最適化テクニックのほぼ全てを一つの箇所にまとめることを狙いにしています。全てのデータエンジニアとデータアーキテクトは、最適化され、コスト効率が高く、効率的なデータパイプラインを設計、構築する際に活用することができます。コストは後付けのものとして考えるべきではなく、プロジェクト導入の際の最も重要な非機能要件として考えるべきです。このため、本書で議論されるベストプラクティスの全ては、データパイプラインの開発と本格運用時を通じて考慮されるべきです。本書はいくつかのセクションに分割っされ、それぞれが特定の問題定義にフォーカスし、それに対する全てのソリューションにディープダイブします。 Delta Lake - レイクハウスのフォーマット Delta Lakeはあ

              DatabricksでSparkとDelta Lakeワークロードを最適化するための包括的ガイド - Qiita
            1