Real[B!]新着記事・評価 - はてなブックマーク

Introducing DBRX: A New State-of-the-Art Open LLM
7 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2024/03/27 21:37

メダリオンアーキテクチャ
5 users
www.databricks.com

メダリオンアーキテクチャとはメダリオンアーキテクチャとは、レイクハウスのデータを論理的に整理するために用いられるデータ設計を意味します。データがアーキテクチャの 3 つのレイヤー（ブロンズ → シルバー → ゴールドのテーブル）を流れる際に、データの構造と品質を増分的かつ漸次的に向上させることを目的としています。メダリオンアーキテクチャは、「マルチホップ」アーキテクチャとも呼ばれます。レイクハウスアーキテクチャのメリットシンプルなデータモデルわかりやすく、導入が容易増分 ETL が可能未加工データからのテーブル再作成がいつでも可能ACID トランザクション、タイムトラベルレイクハウスとはレイクハウスは、データレイクとデータウェアハウスの優れた要素を取り入れた新しいデータプラットフォームアーキテクチャです。モダンレイクハウスは、拡張性と性能に優れたデータプラットフォームです。未加工データと
- テクノロジー
- 2023/11/08 18:12
- database
Best Practices for LLM Evaluation of RAG Applications
39 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2023/09/16 19:56
- rag
- LLM
- AI
- あとで読む
Introducing English as the New Programming Language for Apache Spark
20 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2023/06/30 11:19
Mosaic Research Hub
4 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- 学び
- 2023/05/07 11:24
Introducing MPT-7B: A New Standard for Open-Source, Commercially Usable LLMs
57 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2023/05/06 08:37
- LLM
- NLP
- 機械学習
- AI
- 人工知能
- あとで読む
Free Dolly: Introducing the World's First Truly Open Instruction-Tuned LLM
34 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2023/04/13 02:03
- AI
- LLM
- NLP
- あとで読む
- 文章
- 人工知能
- データ
Hello Dolly: Democratizing the magic of ChatGPT with open models
3 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2023/03/26 15:39
- 人工知能
MosaicBERT: Pretraining BERT from Scratch for $20
3 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- 暮らし
- 2023/03/11 08:34
- research
- あとで読む
スタースキーマ
5 users
www.databricks.com

スタースキーマとはスタースキーマとは、データベース内のデータを整理することで理解・分析しやすくなった多次元データモデルで、データウェアハウスやデータベース、データマート、その他のツールに適用できます。スタースキーマの設計は、大規模なデータセットへのクエリを実行するために最適化されています。 1990 年代にラルフ・キンボールによって発表されたスタースキーマは、反復的なビジネス定義の重複を減らすことによってデータの保存や履歴の管理、データの更新を効率的に行い、データウェアハウスでのデータの集計やフィルタリングを高速に行うことができます。ファクトテーブルとディメンションテーブルスタースキーマは、ビジネスデータをディメンション（時間や商品など）とファクト（金額や数量のトランザクションなど）に非正規化するために使用されます。スタースキーマの中央には 1 つのファクトテーブルがあり、ビジネスのフ
- 学び
- 2023/03/08 18:27
- db
What is a Data Lakehouse?
3 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- 学び
- 2023/01/07 20:59
- data
Mosaic Research | Databricks Blog
15 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2022/12/17 10:08
- 機械学習
- あとで読む
- AI
- 考察
- 技術
データボルト
4 users
www.databricks.com

データボルトとはData Vault（データボルト）とは、データモデリングのデザインパターンで、エンタープライズ規模の分析向けのデータウェアハウスを構築する際に使用されます。データボルトには、ハブ、リンク、サテライトの 3 種類のエンティティがあります。ハブは、ビジネスの中核となるコンセプトを、リンクは、ハブ間のリレーションシップを表します。サテライトは、ハブに属する情報やハブ間のリレーションシップに関するデータを格納します。データボルトは、レイクハウスのパラダイムを採用する組織に適したデータモデルです。データボルトのモデリング：ハブ、リンク、サテライトハブ：それぞれのハブは、顧客 ID、製品番号、車両識別番号（VIN）など、ビジネスの中核となるコンセプトを表します。ユーザーはビジネスキーを使用して、ハブに関する情報を取得します。ビジネスキーには、ビジネスコンセプト ID やシーケン
- テクノロジー
- 2022/09/19 14:57
MLOps（エムエルオプス）
3 users
www.databricks.com

MLOps は、エムエルオプスと読み、Machine Learning Operations の略語で、機械学習（Machine Learning）と運用（Operations）を組み合わせた言葉です。言葉のとおり、機械学習の開発チーム、運用チーム、データサインティストなどが連携し、機械学習モデルを迅速かつ効率的に実際のビジネスに最適化させるための手法を指します。開発チームと運用チームが連携し、円滑な開発を進める DevOps の考え方を拡張し、機械学習の分野に特化させたのが MLOps です。 MLOps の活用法MLOps は、機械学習や AI ソリューションの構築と品質向上に有効なアプローチです。MLOps のアプローチを取り入れることで、機械学習モデルの適切な監視、検証、ガバナンスを備えた CI/CD（継続的インテグレーションと継続的デリバリー）が可能になり、データサイエンティスト
- テクノロジー
- 2022/06/01 20:46
Parquet
6 users
www.databricks.com

Parquet と Delta Lakeオープンソースの Delta Lake プロジェクトは、Parquet 形式に基づいて構築され、さまざまな機能の追加により拡張されています。追加機能には、クラウドオブジェクトストレージの ACID トランザクション、タイムトラベル、スキーマの拡張、シンプルな DML コマンド（CREATE、UPDATE、INSERT、DELETE、MERGE）などがあります。Delta Lake は、順序付けられたトランザクションログを使用してこれらの重要な機能の多くを実装しています。これにより、クラウドのオブジェクトストレージ上におけるデータウェアハウス機能が可能になります。詳細は、こちらの動画 Delta Lake 詳細編：トランザクションログをご覧ください。
- テクノロジー
- 2022/05/21 10:17
- data
- memo
Announcing Databricks Serverless SQL: Instant, Managed, Secured and Production-ready Platform for SQL Workloads
3 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2021/08/31 17:39
- あとで読む
ラムダアーキテクチャ
5 users
www.databricks.com

ラムダアーキテクチャとはラムダアーキテクチャとは、膨大なデータ「ビッグデータ」を処理するアプローチです。ハイブリッドアプローチを使用してバッチ処理やストリーム処理メソッドへのアクセスを提供し、任意の関数を計算する問題を解決するために使用されます。ラムダアーキテクチャは3つのレイヤーから構成されています。バッチレイヤー新しいデータは、データシステムへのフィードとして継続的に提供されます。データはバッチレイヤーとスピードレイヤーに同時に供給されます。全てのデータを一度に調べ、最終的にストリームレイヤー内のデータを修正します。ここでは、多くの ETL と従来型のデータウェアハウスを見つけることができます。このレイヤーは、通常 1 日に 1 回または 2 回、事前定義されたスケジュールを使用して構築されます。バッチレイヤーには、次の 2 つの重要な機能があります。マスターデータセットの管理バッ
- 学び
- 2021/03/05 18:58
データと AI の企業 | Databricks
10 users
www.databricks.com

Databricks データインテリジェンスプラットフォームDatabricks は、AI とデータの融合と活用、成果の創出を支援します。
- テクノロジー
- 2020/11/26 15:26
- データ
- AI
データレイクとデータウェアハウスとは？それぞれの強み・弱みと次世代のデータ管理システム「データレイクハウス」を解説
4 users
www.databricks.com

Databricks では近年、独立した新しいデータ管理のためのオープンアーキテクチャである「データレイクハウス」を利用する多くのユースケースを見てきました。今回は、この新しいアーキテクチャと、かつてのアプローチであるデータウェアハウス（DWH: Data Warehouse）、データレイク（Data Lake）それぞれと比較して優れている点について解説します。データウェアハウス（DWH）とはデータウェアハウス（DWH）とは、膨大な量のデータを利用者の目的に応用しやすくするため、整理・格納する管理システムのことを指します。意思決定支援や BI（ビジネスインテリジェンス）アプリケーションにおいて広く利用されてきており、これには長い歴史があります。データウェアハウスの技術は、1980 年代後半の登場以来進化を続け、MPP アーキテクチャなどの並列処理技術の進歩によって、より大規模なデータ処
- テクノロジー
- 2020/11/25 15:42
Introducing the MLflow Model Registry--Machine Learning Model Hub
20 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2019/11/23 17:26
Databricks Customer Stories | Databricks
4 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2019/09/03 22:53
- 機械学習
- analytics
- data
- mlflow
Network performance regressions from TCP SACK vulnerability fixes
15 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2019/08/03 01:07
- network
- あとで読む
Fast Parallel Testing at Databricks with Bazel
3 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2019/07/25 06:13
- bazel
- testing
- data
- databriks
How to accelerate Scala Builds with Bazel
7 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2019/02/28 23:27
- bazel
How to Use MLflow, TensorFlow, and Keras with PyCharm
3 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2018/07/11 07:12
Introducing MLflow: an Open Source Machine Learning Platform
13 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2018/06/06 12:39
Apache Spark 2.3 with Native Kubernetes Support
8 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2018/03/07 08:31
- Spark
- Kubernetes
Introducing Apache Spark 2.2
3 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2017/07/12 10:41
- Spark
- あとで読む
Declarative Infrastructure with the Jsonnet Templating Language
3 users
www.databricks.com

Unified governance for all data, analytics and AI assets
- テクノロジー
- 2017/07/08 14:03

はてなブックマーク

はてなブックマーク

『Real-time Recommendations using Spark Comcast Labs』

Introducing DBRX: A New State-of-the-Art Open LLM

メダリオンアーキテクチャ

Best Practices for LLM Evaluation of RAG Applications

Introducing English as the New Programming Language for Apache Spark

Mosaic Research Hub

Introducing MPT-7B: A New Standard for Open-Source, Commercially Usable LLMs

Free Dolly: Introducing the World's First Truly Open Instruction-Tuned LLM

Hello Dolly: Democratizing the magic of ChatGPT with open models

MosaicBERT: Pretraining BERT from Scratch for $20

スタースキーマ

What is a Data Lakehouse?

Mosaic Research | Databricks Blog

データボルト

MLOps（エムエルオプス）

Parquet

Announcing Databricks Serverless SQL: Instant, Managed, Secured and Production-ready Platform for SQL Workloads

ラムダアーキテクチャ

データと AI の企業 | Databricks

データレイクとデータウェアハウスとは？それぞれの強み・弱みと次世代のデータ管理システム「データレイクハウス」を解説

Introducing the MLflow Model Registry--Machine Learning Model Hub

Databricks Customer Stories | Databricks

Network performance regressions from TCP SACK vulnerability fixes

Fast Parallel Testing at Databricks with Bazel

How to accelerate Scala Builds with Bazel

How to Use MLflow, TensorFlow, and Keras with PyCharm

Introducing MLflow: an Open Source Machine Learning Platform

Apache Spark 2.3 with Native Kubernetes Support

Introducing Apache Spark 2.2

Declarative Infrastructure with the Jsonnet Templating Language

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

『Real-time Recommendations using Spark Comcast Labs』

このページはまだブックマークされていません

キーボードショートカット一覧

公式Twitter

はてなのサービス

このページはまだ
ブックマークされていません