タグ

databricksに関するhkjnのブックマーク (3)

  • Databricks AI/BIのウォークスルー - Qiita

    Data + AI Summit 2024のキーノートが日時間での昨夜0時頃からスタートしました。なんとなく目が覚めたのでリアルタイム視聴していました。 Databricks + Tabular Unity CatalogのOSS化 Mosaic AI Model Training Fine-tuning / Mosaic AI Tool Catalog / Mosaic AI Agent Framework / Mosaic AI Agent Evaluation / MLflow 2.14 / Mosaic AI Gateway NVIDIAとのパートナーシップ強化 Liquid Clusteringのクラスタリングキーの自動選択 Databricks AI/BI などなど盛りだくさんであっという間に3時になっていました。Mosaic周りは別記事でカバーするつもりですが、まずは最後に

    Databricks AI/BIのウォークスルー - Qiita
  • [2023年12月版] Databricksとは何か? - Qiita

    Databricksの弥生です。Databricks Japanにjoinして3年が経ちました。 2021年には以下の記事を訳したり、 自分でもJupyter notebookとの比較記事を書いたりしました。 そして、他のソリューションアーキテクトの方によっても記事が書かれています。 しかし、Databricksは日進月歩で進化しています。2週間周期で新機能がリリースされるので、これらの記事も古くなってしまっている部分が少なからずあります。 と言うことで、2023年12月時点での「Databrikcsとは何か」を記事にします。 Databricksとは何か? まず、会社としてのDatabricksの説明をさせてください。同名のプラットフォームを提供している企業で、2013年に創業されました。今年でちょうど10年です。由来はユニークで、カルフォルニア大学バークレー校に在学していた大学院生と教

    [2023年12月版] Databricksとは何か? - Qiita
  • Delta Lake とは何か - connecting the dots

    はじめに 環境情報 Delta Lake (デルタレイク) とは Delta Lake の実体 Delta Lake の構造 Parquet と Delta の相違点 Parquetとは何か Parquetの構造 Parquet と Delta の違い Delta Lake が生まれた経緯: データレイクと Delta Lake の違い データレイクのメリット データレイクの課題 *Parquetで構築した場合 Delta Lake の特徴 ACIDトランザクションの担保 スケーラブルなメタデータ管理 バッチとストリーミングワークロードの統合 タイムトラベル (バージョン管理) CONSTRAINT句のサポート DML (データ操作言語) のフルサポート UPDATE DELETE MERGE 柔軟なスキーマ管理 1. スキーマ エンフォースメント 2. スキーマ エボリューション ストレ

    Delta Lake とは何か - connecting the dots
  • 1