タイトル「Databricks」を検索 - はてなブックマーク

1 - 40 件 / 85件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

Databricksの検索結果1 - 40 件 / 85件

Introducing MPT-7B: A New Standard for Open-Source, Commercially Usable LLMs | Databricks
- 57 users
- www.databricks.com
- テクノロジー
- 2023/05/06
Unified governance for all data, analytics and AI assets
- LLM
- NLP
- 機械学習
- AI
- 人工知能
- あとで読む
Databricks社がOSS化したSpark用ストレージレイヤ「Delta Lake」について - たけぞう瀕死ブログ
- 51 users
- takezoe.hatenablog.com
- テクノロジー
- 2019/05/03
先日開催されたSpark + AI Summit 2019にあわせてDatabricks社からSpark用のストレージレイヤ「Delta Lake」のOSS化が発表されました。 databricks.com GitHubリポジトリはこちら。 github.com Delta LakeはSparkのライブラリとして実装されており、分散ストレージ上で以下のような機能を提供します。 ACIDトランザクション（テーブル単位）タイムトラベル（任意の時点の過去データを参照可能）スキーマバリデーション（スキーマ変更も可能）実際に動かしてみる Delta Lakeの動作にはSpark 2.4.2以降が必要です。ローカルファイルシステムでも動作するのでspark-shellで動きを確認してみました。 $ bin/spark-shell --packages io.delta:delta-core_2.
- spark
- あとで読む
無料で商用利用も可能なオープンソースの大規模言語モデル「Dolly 2.0」をDatabricksが発表
- 44 users
- gigazine.net
- テクノロジー
- 2023/04/13
2023年3月に大規模言語モデル(LLM)「Dolly」を公開したDatabricksが、わずか2週間で、初のオープンソースの命令追従型LLMだという「Dolly 2.0」を発表しました。 Free Dolly: Introducing the World's First Open and Commercially Viable Instruction-Tuned LLM - The Databricks Blog https://www.databricks.com/blog/2023/04/12/dolly-first-open-commercially-viable-instruction-tuned-llm Databricks releases Dolly 2.0, the first open, instruction-following LLM for commercial
Databricks ＋ BigQueryでSSOTを実現しようとしている話 - バイセル Tech Blog
- 32 users
- tech.buysell-technologies.com
- テクノロジー
- 2022/10/28
テクノロジー戦略本部データサイエンス部の近藤です。バイセルはリユース事業を営む会社で急激な成長を遂げていますが、どちらかというと今まではテクノロジーにあまり頼ることなく成長してきました。そんな中、テクノロジーをちゃんと導入していけばどこまで成長するのか試してみたく、2022年7月にバイセルに入社しました。バイセルではSSOTの実現のために、RDBのデータをBigQueryにニアリアルタイムで同期する実装を進めていますが、新たにDatabricksの導入を決めました。バイセルにどういう課題があり、なぜDatabricksを導入するのかをお話しします。 SSOTとはバイセルの今の課題と未来どうやって課題を解決するのかなぜApache Sparkなのか Databricksの利点 Databricks導入後の世界データサイエンス部の野望 SSOTとはデータマネジメントでは「S
- データ
- あとで読む
[2024年3月版] Databricksのシステムアーキテクチャ
- 25 users
- speakerdeck.com/databricksjapan
- テクノロジー
- 2024/04/13
2024年3月版のDatabricksのシステムアーキテクチャについて説明します。
GitHub - databricks/scala-style-guide: Databricks Scala Coding Style Guide
- 24 users
- github.com/databricks
- テクノロジー
- 2015/03/18
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- scala
- Java
Databricks、無料で使えるオープンソースの大規模言語モデル『Dolly 2.0』をリリース。自社製データセットにより商用利用が可能に
- 24 users
- gamemakers.jp
- テクノロジー
- 2023/04/14
Databricks、命令追従型LLM『Dolly 2.0』をリリース Dolly 1.0ではできなかった商用利用が可能に商用利用のためにデータセット「databricks-dolly-15k」を作成 Databricksは、大規模言語モデル（以下、LLM）「Dolly」の最新バージョンである『Dolly 2.0』をリリースし、同社ブログにて発表しました。 Meet Dolly 2.0: the first open-source, instruction-following LLM that’s available for commercial use & doesn’t require you to pay for API access or share data with third parties. Now, anyone can create a powerful LLM th
- AI
- あとで読む
Tuning Java Garbage Collection for Apache Spark Applications - The Databricks Blog
- 21 users
- www.databricks.com
- テクノロジー
- 2015/05/29
Unified governance for all data, analytics and AI assets
- spark
- performance
- gc
- JVM
- scala
- java
- development
カケハシがDatabricksを導入した背景と技術選定のポイント - KAKEHASHI Tech Blog
- 21 users
- kakehashi-dev.hatenablog.com
- テクノロジー
- 2022/09/12
初めまして、カケハシのデータ基盤チームでデータエンジニアしている大木と申します。この度カケハシでは、全社的なデータ活用基盤のプラットフォームとしてDatabricksを採用し、2022/07より本格導入することとなりました。当記事では、カケハシがDatabricksを採用するに至った技術選定の背景について紹介させていただきます。 ※カケハシのデータ基盤の組成のお話はこちらの記事で詳しく紹介されておりますので良ければご覧ください。カケハシのデータ基盤アーキテクチャと課題まずカケハシのデータ基盤のアーキテクチャと抱えている課題について紹介します。 Databricks導入に伴い現在は一部変更が入りつつあるのですが、導入前のアーキテクチャとしては以下のような構成になっていました。様々なデータソースから収集した生データをAWSのS3に集約 Glue、Athena等のETLサービス、分散処
- あとで読む
Databricksで築く未来のデータメッシュ組織/The Datamesh Organization Built with Databricks
- 20 users
- speakerdeck.com/kakehashi
- テクノロジー
- 2024/01/17
Databricksで築く未来のデータメッシュ組織/The Datamesh Organization Built with Databricks
Databricksの生成AI戦略
- 18 users
- speakerdeck.com/taka_aki
- テクノロジー
- 2024/05/14
過去のウェビナーで使ったスライドです。
Databricks Container ServiceでTensorRT-LLMを動かしてみた - NTT Communications Engineers' Blog
- 17 users
- engineers.ntt.com
- テクノロジー
- 2024/04/26
本記事ではDatabricksのDatabricks Container Serviceを用いてNVIDIA社の推論ライブラリであるTensorRT-LLMを実行可能なNotebook環境を構築する方法を紹介します。目次目次はじめに Databricks Container Service NVIDIA TensorRT-LLM 解決したいこと TensorRT-LLM Container Imageの作成 Databricks Containers ベースイメージの変更 Pytorch バージョンの変更 TensorRT-LLMのインストール動作確認 Databricks環境設定 TensorRT-LLMのインポート Llama2 HF-7b-instruct モデルの変換 TensorRT-LLMの呼び出しまとめ参考文献はじめにこんにちは、NTTコミュニケーションズの露
- LLM
- development
- あとで読む
- blog
Beyond Hadoop ─Databricks共同創業者に訊くApache Sparkのポテンシャル | gihyo.jp
- 17 users
- gihyo.jp
- テクノロジー
- 2016/02/29
いまいちばん勢いのあるオープンソースプロダクトとして注目度の高いApache Spark。2月8日、東京・大井町きゅりあんで行われた「Hadoop / Spark Conference Japan 2016」は、国内で開催される初めてのSparkカンファレンスということもあり、1300人を超える登録者を集め、盛況のうちに幕を閉じました。今回、このカンファレンスの基調講演、そしてSparkセッションに登壇した、Databricks創業者のひとりにしてSparkの3代目リリースマスターでもあるレイノルド・シン（Reynold Xin）氏にインタビューする機会を得たので、その内容をご紹介します。 HadoopはSparkの“原点であり越えるべき目標” ─⁠─まずはレイノルドさんご自身の自己紹介をお願いできるでしょうか。Databricksという会社についてもご説明いただければ。シン氏：僕はDa
- Spark
- Hadoop
- OSS
- あとで読む
Data & AIのサミットで発表された新機能：DatabricksのEnglish SDK for Apache Sparkを試してみた - Qiita
- 15 users
- qiita.com/maroon-db
- テクノロジー
- 2023/07/03
Data & AIのサミットで発表された新機能：DatabricksのEnglish SDK for Apache Sparkを試してみたDatabrickspyspark-ai はじめに DatabricksのイベントData & AI Summitで非常に興味深いソリューションが発表されました。その名もEnglish SDK for Apache Spark. まだ開発の初期段階とのことですが、すでにGitにも公開されており、試すことができます。早速、Databricks上で使ってみました。ノートブックこちらにノートブックを公開しますので、Databricks環境にインポートしてお試しください。サンプルノートブック設定 pyspark-aiをインストールします。 LLMを指定します。OPEN AIを利用する場合、Secret Keyを取得し環境変数のOPENAI_API_K
- AI
- qiita
- あとで読む
Databricks、“オープン”な汎用LLM「DBRX」リリース　商用利用可
- 14 users
- www.itmedia.co.jp
- テクノロジー
- 2024/03/28
米AI企業のDatabricksは3月27日（現地時間）、“オープンな”汎用LLM「DBRX」を発表した。同社によると、DBRXは標準的なベンチマークで既存のすべてのオープンモデルより優れたパフォーマンスを発揮するという。ただし、マルチモーダルではない。 DBRXは、オープンソースプロジェクトMegaBlocksに基づいて構築されたMoE（Mixture of Experts；混合エキスパート）を採用した。このMoEは、他のMoEと比較してトレーニング速度が2倍以上、計算効率も最大2倍になるという。サイズは1320億パラメータと米MetaのLlama 2のほぼ2倍だが、速度はLlama 2の2倍という。言語理解、プログラミング、数学、ロジックのベンチマークで、Llama 2 70B、仏Mistral AIのMixtral 8x7B、米XのGrok-1、米OpenAIのGPT-3.5を上回
Databricksがオープンな大規模言語モデル「DBRX」をリリース、GPT-3.5やCodeLLaMA-70Bを上回る性能
- 13 users
- gigazine.net
- テクノロジー
- 2024/03/28
データ分析ツールなどを提供する企業のDatabricksが、2024年3月27日にオープンな汎用大規模言語モデル(LLM)である「DBRX」を発表しました。オープンライセンスでの配布となっており、月間アクティブユーザーが7億人以下の企業は無料で商用利用が可能となっています。 Introducing DBRX: A New State-of-the-Art Open LLM | Databricks https://www.databricks.com/blog/introducing-dbrx-new-state-art-open-llm DBRXはトランスフォーマーのデコーダーを使用するLLMで、「mixture-of-experts(MoE)」アーキテクチャが採用されています。パラメータの合計数は1320億となっていますが、全ての入力に反応するのは360億パラメータのみで、残りのパラメ
Databricksで分析業務がはかどっている話 - Qiita
- 12 users
- qiita.com/paulxll
- テクノロジー
- 2020/06/25
はじめにこんにちは。みなさま年末いかがお過ごしでしょうか。この記事はSupership Advent Calendar 2018 15日目です。私はデータビジネス事業部に所属しており、 Supershipの保有している広告配信ログを使った各種分析を担当しています。アドテク業界やWeb業界にお勤めのデータサイエンティスト・エンジニアの方にはご理解いただけるかと思いますが、 Web系のデータは巨大で(もちろん私たちSupershipも例外ではありません)、ストレスなく日常的に集計するとなるとなかなか大変です。そのような巨大なデータを分析するための分析基盤として近年いくつものプロダクトが開発されていますが、私たちのチームではDatabricks社のDatabricksを利用しています。このプロダクト、非常に便利ながらあまり日本語情報がなく、今ひとつ広まっていない印象です。そこで
- あとで読む
あのSpark開発の総本山Databricksは何を目指しているのか、共同創業者に聞く
- 12 users
- xtech.nikkei.com
- テクノロジー
- 2014/08/27
分散クラスターでのビッグデータ分析をインメモリーで高速に行うオープンソースソフトウエア（OSS）の「Spark」。その開発の中核を担う企業が米Databricksだ。Sparkを開発した米University of California Berkeley（UCB）の研究組織「AMPLab」からスピンアウトして、2013年に設立されたベンチャー企業である。同社の事業内容はあまり明らかになっていなかったが、2014年6月に開催したSparkのイベント「Spark Summit 2014」を機に、Sparkを手軽に利用できるようにするためのクラウドサービス「Databricks Cloud」を投入したり（関連記事：高速ビッグデータ分析をクラウドで、Spark開発元のDatabricksがサービス開始）、Hadoopディストリビューションベンダーと相次いで提携したりするなど（関連記事：次世代Ha
- spark
- BigData
- *あとで
高速ビッグデータ分析をクラウドで、Spark開発元のDatabricksがサービス開始
- 11 users
- xtech.nikkei.com
- テクノロジー
- 2014/07/02
Hadoopによる分散クラスター上で、高速なビッグデータ分析を可能にするフレームワークとして注目されている「Spark」（関連記事：次世代Hadoop最有力候補の「Spark」、動き始めたエコシステム）。そのSparkをホスティングしたクラウドサービスが始まる。 Sparkの開発元企業である米Databricksは、分散クラスターを自社で構築しなくとも、クラウド上でSparkを即利用できるサービス「Databricks Cloud」を開始した。2014年6月30日から米国で開催中のSparkのイベント「Spark Summit 2014」で明らかにした。現在はベータ版として限定的に公開している段階で、ベータユーザーを同社サイトで受け付けている。 Databricks Cloudでは、Sparkを構成する各種フレームワークを利用できる。SQLによるインタラクティブ分析用の「Spark SQ
- Spark
DataBricks，Sparkで構造化データを操作するSpark SQLを発表
- 11 users
- www.infoq.com
- テクノロジー
- 2014/04/25
Spring BootによるAPIバックエンド構築実践ガイド第2版何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...
［速報］マイクロソフト、Apache Sparkベースの分析プラットフォーム「Azure Databricks」発表。Connect(); 2017
- 10 users
- www.publickey1.jp
- テクノロジー
- 2017/11/16
［速報］マイクロソフト、Apache Sparkベースの分析プラットフォーム「Azure Databricks」発表。Connect(); 2017 マイクロソフトは11月16日（現地時間）に開催したオンラインイベント「Microsoft Connect(); 2017」において、Microsoft Azure上で提供するApache Sparkベースのデータ分析プラットフォーム「Azure Databricks」を発表しました。 Apache Sparkは、大規模なデータの分析や加工などを得意とするオープンソースの分散処理フレームワークです。Hadoopのように大量のサーバをクラスタとして分散処理を行います。 Databricksは、Apache Sparkの開発元企業です。マイクロソフトはそのDatabricksとの協業によって「Azure Databricks」を提供します。「Az
- service
- あとで読む
「Databricks とは？何ができるか」新入社員が感じたイケてる機能１０選 - Qiita
- 10 users
- qiita.com/kohei-arai
- テクノロジー
- 2022/08/19
目次はじめに背景と目的 Databricksとは何か機能紹介共通データエンジニアリング機械学習 Databricks SQL おわりにはじめにこんにちは。Databricks の新井です。Qiita 初投稿です。 2022年の7月よりソリューションアーキテクトとして働き始めました。お客様に弊社製品を知っていただき、導入いただく際の技術サポートを行う役割です。本記事では Databricks にご興味がある皆様に弊社プラットフォームを理解いただくために、新入社員の目線から便利だと感じた10個の機能をまとめました。今後も記事執筆を継続するモチベーションに繋がりますので「いいね」や記事の保存、SNSで共有いただけると嬉しいです。宜しくお願いいたします！背景と目的皆様の中には Databricks という会社に馴染みがない方も多いと思います。米国カリフォルニア州に本社が
- Databricks
「Spark」をクラウドサービスで利用すべき3つの理由--Databricks担当者に聞く
- 10 users
- japan.zdnet.com
- テクノロジー
- 2015/06/30
オープンソースプロジェクト「Apache Spark」は、いまやカリフォルニア大学バークレー校のAMPLabが生んだ成果の中で、もっとも有名なものと言えるかもしれない。Sparkを生んだAMPLabは、機械学習、クラウドコンピューティング、クラウドソーシングという3つの大きなトレンドをテーマとしており、アルゴリズムと機械、そして人の力を組み合わせて、ビッグデータから意味を引き出すことに取り組んでいる。 Sparkはもともと、AMPLabの別のプロジェクトである「Apache Mesos」を拡張するために書かれたものだが、人気が集まったため、開発者たちは2013年にAndressen Horowitsから資金を獲得して、スタートアップ企業Databricksを立ち上げた。同社は、データ分析のプロフェッショナルが簡単にSparkを利用できる、ホスティング型のクラウドプラットフォームを提供してい
データと AI の企業 | Databricks
- 10 users
- www.databricks.com
- テクノロジー
- 2020/11/26
プラットフォームDatabricks データインテリジェンスプラットフォームDatabricks は、AI とデータの融合と活用、成果の創出を支援します。
- データ
- AI
A Tale of Three Apache Spark APIs: RDDs, DataFrames, and Datasets - The Databricks Blog
- 8 users
- www.databricks.com
- テクノロジー
- 2016/07/16
Unified governance for all data, analytics and AI assets
- Spark
- dataset
Databricks - Sign In
- 8 users
- www.pokecrew.com
- 世の中
- 2016/07/17
- ポケモンGO
Introducing DBRX: A New State-of-the-Art Open LLM | Databricks
- 7 users
- www.databricks.com
- テクノロジー
- 2024/03/27
Unified governance for all data, analytics and AI assets
Databricks Community Edition で Spark に触れる - astamuse Lab
- 7 users
- lab.astamuse.co.jp
- テクノロジー
- 2017/06/01
山縣です。今回は Spark を無料で手軽に触れる Databricks Community Edition について書きたいと思います。 Databricks Community Editionとは Databricks は Databricks 社が提供しているSparkサービスで、Community Edition はその無料版にあたります。無料にもかかわらずメモリ6GBのAWSのインスタンスとNotebook が使えるというなかなか太っ腹なサービスです。弊社では Cloudera社の CDH のクラスタがありSparkもその上で動かしていますが、個人的にSpark そのものの動作を確認したり、異なるバージョンを触りたいときに時々使わせてもらっています。 Sparkの学習用環境としては十分な機能が備わっていると思いますので、簡単に紹介したいと思います。ユーザ登録 Commun
- Databricks
- Spark
Technical Preview of Apache Spark 2.0 Now on Databricks
- 6 users
- www.databricks.com
- テクノロジー
- 2016/05/12
Unified governance for all data, analytics and AI assets
kunishou/databricks-dolly-15k-ja · Datasets at Hugging Face
- 6 users
- huggingface.co
- テクノロジー
- 2023/04/13
This dataset was created by automatically translating "databricks-dolly-15k" into Japanese. This dataset is licensed under CC-BY-SA-3.0 Last Update : 2023-05-11 databricks-dolly-15k-ja https://github.com/kunishou/databricks-dolly-15k-ja databricks-dolly-15k https://github.com/databrickslabs/dolly/tree/master/data
Home | Databricks
- 6 users
- community.databricks.com
- テクノロジー
- 2015/03/19
Welcome to the Databricks Community Learn, network, and celebrate with data practitioners from around the world.
- Spark
Data Lakehouse Architecture | Databricks
- 6 users
- www.databricks.com
- テクノロジー
- 2014/07/24
Unified governance for all data, analytics and AI assets
- BigData
- Spark
- cloud
- data
- IT
Apache Sparkをベースにした、無償で使えるクラウドプラットフォーム「Databricks Community Edition」のベータ版が発表
- 6 users
- codezine.jp
- テクノロジー
- 2016/02/22
米Databricksは、「Apache Spark」をベースにしたクラウドプラットフォーム「Databricks」の無償版「Databricks Community Edition」のベータ版を、2月17日（現地時間）にサンフランシスコで開催されたイベント「Spark Summit East」で発表した。「Databricks Community Edition」は、開発者やデータサイエンティスト、データエンジニア、およびSparkを学びたいと考えているユーザーを対象にしており、マイクロクラスタやクラスタマネージャー、シンプルなアプリケーションの開発が可能なプロトタイプ作成環境を利用できる。また、IPython notebooksとの互換性を備えており、既存のIPython notebooksのインポートにも対応する。このほか、76000人以上が参加したオンライン学習コース「Intr
Databricks、Google Cloud上でレイクハウスの構築が可能に
- 6 users
- enterprisezine.jp
- テクノロジー
- 2021/02/18
米現地時間2月17日、Databricks（データブリックス）は、Google Cloud上でデータブリックスをグローバル規模で提供するための新たなパートナーシップを発表した。このパートナーシップにより、企業はデータブリックスを使用して、Google Cloud上に、Lakehouseアーキテクチャー（以下、レイクハウス）を構築できるようになるという。 Google Cloud上のデータブリックスは、Google BigQueryのオープンプラットフォームと統合され、Google Kubernetes Engine（GKE）を活用することで、コンテナ化されたクラウド環境でデータブリックスを展開できるようになる。この統合ソリューションにより、企業はAI主導の洞察力を解き放ち、インテリジェントな意思決定を可能にするとともに、最終的にデータ駆動型アプリケーションによるデジタルトランスフォーメーシ
- あとで読む
SaaS成功企業には共通する｢最初の100万人獲得｣のグロース戦略がある…Slack、Stripe、Figma、Databricksのケース
- 5 users
- www.businessinsider.jp
- テクノロジー
- 2021/03/04
こんにちは。パロアルトインサイトCEO・AIビジネスデザイナーの石角友愛です。リモートワークが定着するにつれ、以前私が書いた寄稿記事でも紹介したFigmaをはじめとしたB2B向けのSaaSツールの成長が著しくなっています。通常マーケティングなどが難しいと言われるB2B業界ですが、今回はこのようなB2B向けのSaaSツールを開発している会社が、｢最初の100万人のユーザーを獲得するためにどのような戦略をとっていったのか｣。また、その後のグロースフェーズにおいてどのようなKPIを作り成長を遂げたのかについて紹介したいと思います。
GitHub - databricks/spark-csv: CSV Data Source for Apache Spark 1.x
- 5 users
- github.com/databricks
- テクノロジー
- 2016/01/21
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- Spark
- CSV
GitHub - databricks/spark-perf: Performance tests for Apache Spark
- 5 users
- github.com/databricks
- テクノロジー
- 2014/08/24
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
Databricksクイックスタートガイド - Qiita
- 5 users
- qiita.com/taka_yayoi
- テクノロジー
- 2021/04/12
初めてDatabricksを利用される方向けに、マニュアルからピックアップしたコンテンツを翻訳したものになります。全文はDatabricks documentation | Databricks on AWSから参照できます。注意本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては英語ドキュメントを参照ください。こちらは翻訳時点の内容となります。可能な限りアップデートしていきますが、最新の状態でない箇所がある可能性をご了承ください。 AWSでの利用を想定したものとなっています。誤記、翻訳要望等ございましたら、コメントでご指摘いただけると幸いです。 Databricksフリートライアルへのサインアップ Databricksアカウントのセットアップとワークスペースの作成 Databricksアカウントのセットアップとワークスペースの作成(実践編) Databr
GitHub - databrickslabs/dolly: Databricks’ Dolly, a large language model trained on the Databricks Machine Learning Platform
- 5 users
- github.com/databrickslabs
- テクノロジー
- 2023/03/25
Databricks’ Dolly is an instruction-following large language model trained on the Databricks machine learning platform that is licensed for commercial use. Based on pythia-12b, Dolly is trained on ~15k instruction/response fine tuning records databricks-dolly-15k generated by Databricks employees in capability domains from the InstructGPT paper, including brainstorming, classification, closed QA,
- あとで読む
Databricks、ChatGPT風の大規模言語モデル「Dolly 2.0」。オープンソースで商用利用可能
- 5 users
- pc.watch.impress.co.jp
- テクノロジー
- 2023/04/13
- ai
- あとで読む