並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 901件

新着順 人気順

Databricksの検索結果241 - 280 件 / 901件

  • NVIDIA、機械学習をGPUで高速化するオープンソースプラットフォーム「RAPIDS」

    動画やグラフィックス製品のメーカーから人工知能(AI)関連製品の大手企業に転じたNVIDIAは、ドイツのミュンヘンで現地時間10月10日に開催された「GPU Technology Conference」の基調講演で、AIに関してまた新たな一歩を踏み出した。 ただし今回、NVIDIAが発表したのは、新しいGPUでも、ディープラーニングに使用する新たな独自のソフトウェア開発キット(SDK)でもない。今回発表したのは、GPUを利用した高速の分析や機械学習(ML)のための、オープンソースのGPUアクセラレーションプラットフォームだ。 高速なAI処理 一連のライブラリを提供するこの新しいプラットフォーム「RAPIDS」は、「scikit-learn」や「Pandas」にあるようなPythonインターフェースを擁する。ただしRAPIDSでは、1つまたは複数のGPU全体のアクセラレーションに、NVIDI

      NVIDIA、機械学習をGPUで高速化するオープンソースプラットフォーム「RAPIDS」
    • Apache Spark @Scale: A 60 TB+ production use case

      Facebook often uses analytics for data-driven decision making. Over the past few years, user and product growth has pushed our analytics engines to operate on data sets in the tens of terabytes for a single query. Some of our batch analytics is executed through the venerable Hive platform (contributed to Apache Hive by Facebook in 2009) and Corona, our custom MapReduce implementation. Facebook has

        Apache Spark @Scale: A 60 TB+ production use case
      • Introducing o1: OpenAI's new reasoning model series for developers and enterprises on Azure | Microsoft Azure Blog

        Products Popular View all products (200+) Azure Virtual Machines Azure Virtual Desktop Azure SQL Microsoft Copilot in Azure PREVIEW Azure AI Services Azure AI Studio Azure Cosmos DB Azure Kubernetes Service (AKS) Azure Arc​ Azure Migrate AI + machine learning Azure Machine Learning Azure AI Services Microsoft Copilot in Azure PREVIEW Azure OpenAI Service Azure AI Studio Azure AI Vision Azure AI Se

          Introducing o1: OpenAI's new reasoning model series for developers and enterprises on Azure | Microsoft Azure Blog
        • The best place on Region: Earth for inference

          This post is also available in 简体中文, 日本語, 한국어, Deutsch, Français and Español. Today, Cloudflare’s Workers platform is the place over a million developers come to build sophisticated full-stack applications that previously wouldn’t have been possible. Of course, Workers didn’t start out that way. It started, on a day like today, as a Birthday Week announcement. It may not have had all the bells and

            The best place on Region: Earth for inference
          • SaaSスタートアップが不況を乗り切るために留意したい6つのポイント【テッククランチ】

            寄稿者 Sudheesh Nair データ分析のためにGoogleのような直感的なインターフェースを構築したビジネスインテリジェンス企業、ThoughtSpotのCEO。ThoughtSpot以前はNutanixの社長を務めた。 景気が減速し、企業が支出を減らすなか、多くのスタートアップにとって今後数カ月が成功を左右する。ビジネスは「何としても成長する」という考え方から、より慎重な考え方へと移行しつつある。つまり、リーダーは状況に応じて積極的に行動することができるよう、どこで節約し、どこで金を効果的に使うか、またどの顧客が解約しそうかを知る必要がある。 SaaS企業は、こうした意思決定の拠り所となるデータにアクセスできるため、他の企業よりも有利な立場にあるだろう。顧客が製品を購入したということだけでなく、誰が、どのように、どれくらいの頻度で製品を使用しているかを知っている。経営陣は顧客行動

              SaaSスタートアップが不況を乗り切るために留意したい6つのポイント【テッククランチ】
            • TechCrunch

              Even with some criticisms, most VC think that the state's effort to track diversity data is worth it. Databricks has remained a hot startup at a time when interest from investors has cooled across the ecosystem. Just last month the company raised $500 million at an eye-popping $43 billion valuation. T

                TechCrunch
              • [翻訳] GPT-4 System Card (前編) - Qiita

                こちらの後半にあるGPT-4 System Cardの翻訳です。前後編の前編です。後編はこちら。Technical Reportはこちら。 Databricksのユーザー会でChatGPTの勉強会やります。 注意 本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。 脚注、参考文献、Appendixなどは本文をご覧ください。 アブストラクト 大規模言語モデル(LLM)は、ブラウジング、音声アシスタント、コーディングアシスタントツールを含む、我々の生活における多くのドメインで活用されており、非常に大きな社会的インパクトをもたらす可能性を持っています。[1, 2, 3, 4, 5, 6, 7]このシステムカードでは、モデルのGPTファミリーの最新のLLMであるGPT-4を分析します。[8, 9, 10]最初に、モデルの制限(例: 実際は誤っているの

                  [翻訳] GPT-4 System Card (前編) - Qiita
                • TechCrunch

                  Even with some criticisms, most VC think that the state's effort to track diversity data is worth it. Databricks has remained a hot startup at a time when interest from investors has cooled across the ecosystem. Just last month the company raised $500 million at an eye-popping $43 billion valuation. T

                    TechCrunch
                  • ビッグデータ処理「Spark」、深層学習対応進む

                    ビッグデータ処理のオープンソースソフトウエア(OSS)である「Apache Spark」のディープラーニング(深層学習)対応が進んでいる。Sparkの主要開発企業である米Databricksや米Intel、米Microsoft、米Verizon傘下の米Oath(旧Yahoo!)などが、Sparkの深層学習対応に熱心だ。 分散処理ソフトのSparkは、2014年ごろには機械学習の大規模化に欠かせない存在だと認識されていた。しかしその後の深層学習の台頭によって存在感が薄れていた。深層学習の高速化にはGPU(Graphics Processing Unit)が向いていることが分かり、米Googleが公開した「TensorFlow」などGPUに対応した深層学習フレームワークが人気を集めるようになったためだ。 ところがここに来て、Sparkを深層学習に対応させる動きが活発化している(表)。2017年

                      ビッグデータ処理「Spark」、深層学習対応進む
                    • Google Colab で Rinna-3.6B のLoRAファインチューニングを試す|npaka

                      「Google Colab」で「Rinna-3.6B」のLoRAファインチューニングを試したのでまとめました。 【注意】Google Colab Pro/Pro+ の A100で動作確認しています。VRAMは14.0GB必要でした。 1. Rinna-3.6B「OpenCALM-7B」は、「サイバーエージェント」が開発した、日本語LLMです。商用利用可能なライセンスで公開されており、このモデルをベースにチューニングすることで、対話型AI等の開発が可能です。 「Rinna-3.6B」は、「Rinna」が開発した、日本語LLMです。商用利用可能なライセンスで公開されており、このモデルをベースにチューニングすることで、対話型AI等の開発が可能です。 2. 学習「Google Colab」で「Rinna-3.6B」のLoRAファインチューニングを行います。データセットは@kun1em0nさんの「k

                        Google Colab で Rinna-3.6B のLoRAファインチューニングを試す|npaka
                      • Microsoft Build 2018 Day 1 Keynote

                        そんなわけでBuild 2018です。いつもの通りKeynoteをペタペタしますか。 Microsoft Build Build 2018 / News 日本語通訳付きはこちら Microsoft Build 基調講演 ※そういえば //build じゃなくなったね(去年もだっけ?) ※リンク周りはこちら オープニングはCharlotte Yarkoni氏から。去年はProject Emma(パーキンソン病を助けるプロジェクトのやつ)の紹介をしましたけどそのあたりの話から。AI周りなどのデベロッパーの紹介とか。どっかで見かけた人もいますね。世界のデベロッパーの紹介やMSP、スタートアップやパートナーの紹介など。 という感じでオープニングムービーです。 本編まちかね。最初はCEOのSatya氏から。ビルゲイツがAppleについて語るようになったとかMicrosoftは新しくなったとかでつかみ

                          Microsoft Build 2018 Day 1 Keynote
                        • Hadoop, Sparkその他分散処理フレームワークの2018年を占う | gihyo.jp

                          あけましておめでとうございます。 例年、Apache HadoopやApache Sparkを中心に並列分散処理ミドルウェアの動向や展望についてご紹介しています。 今年は NTTデータに所属する 岩崎正剛(Hadoopコミッタ⁠)⁠、猿田浩輔(Sparkコミッタ⁠)⁠、鯵坂明(Hadoopコミッタ/PMC)の3名でディスカッションした内容を元にお伝えします。 ディスカッション中の岩崎正剛氏 Hadoop 3.0リリース 昨年の新春特別企画では、「⁠2017年はHadoop 3.0がリリースされる年になるはずです。」と書きましたが、Hadoop 3.0.0が2017年12月13日にリリースされました。2017年の間に3.0.0-alpha2、3.0.0-alpha3、3.0.0-alpha4、3.0.0-beta1とリリースを重ね、なんとか2017年内に間に合った格好です。 2016年にリリ

                            Hadoop, Sparkその他分散処理フレームワークの2018年を占う | gihyo.jp
                          • SAP Crystal Reports, developer version for Microsoft Visual Studio: Updates & Runtime Downloads

                            "automatische backups" 1 "regelmäßige sicherung" 1 "SAP VARIANT CONFIGURAITION 2 "TypeScript" "Development" "FeedBack" 1 505 Technology Updates​ 53 1 @sapilm @archiving @sapiq 1 A Comprehensive Guide to Using OLE Objects in SAP ABAP 1 ABAP 29 ABAP 7.4 1 ABAP API 1 ABAP CDS VIEW 1 ABAP CDS Views 10 ABAP CDS Views - BW Extraction 3 ABAP CDS Views - CDC (Change Data Capture) 2 ABAP class 2 ABAP Cloud

                              SAP Crystal Reports, developer version for Microsoft Visual Studio: Updates & Runtime Downloads
                            • Cloud Data Warehouse Benchmark | Blog | Fivetran

                              Our newest benchmark compares price, performance and differentiated features for Redshift, Snowflake, BigQuery, Databricks and Synapse. Over the last two years, the major cloud data warehouses continue to make incremental improvements that give customers faster performance and lower cost. Contrary to popular belief, these vendors] make ongoing efficiency improvements that save customers money desp

                                Cloud Data Warehouse Benchmark | Blog | Fivetran
                              • Databricksで分析業務がはかどっている話 - Qiita

                                はじめに こんにちは。 みなさま年末いかがお過ごしでしょうか。 この記事はSupership Advent Calendar 2018 15日目です。 私はデータビジネス事業部に所属しており、 Supershipの保有している広告配信ログを使った各種分析を担当しています。 アドテク業界やWeb業界にお勤めのデータサイエンティスト・エンジニアの方にはご理解いただけるかと思いますが、 Web系のデータは巨大で(もちろん私たちSupershipも例外ではありません)、ストレスなく日常的に集計するとなるとなかなか大変です。 そのような巨大なデータを分析するための分析基盤として近年いくつものプロダクトが 開発されていますが、私たちのチームではDatabricks社のDatabricksを利用しています。 このプロダクト、非常に便利ながらあまり日本語情報がなく、今ひとつ広まっていない印象です。 そこで

                                  Databricksで分析業務がはかどっている話 - Qiita
                                • inu-ai/dolly-japanese-gpt-1b · Hugging Face

                                  \\n以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。\\n[SEP]\\n指示:\\n日本で一番広い湖は?\\n[SEP]\\n応答:\\n"}]},"cardExists":true,"config":{"architectures":["GPT2LMHeadModel"],"model_type":"gpt2","tokenizer_config":{"bos_token":"","cls_token":"[CLS]","eos_token":"","mask_token":"[MASK]","pad_token":"[PAD]","sep_token":"[SEP]","unk_token":""}},"createdAt":"2023-04-13T22:46:07.000Z","discussionsDisabled":false,"downloads":1

                                    inu-ai/dolly-japanese-gpt-1b · Hugging Face
                                  • Movie Recommendation with MLlib

                                    In this chapter, we will use MLlib to make personalized movie recommendations tailored for you. We will work with 10 million ratings from 72,000 users on 10,000 movies, collected by MovieLens. This dataset is pre-loaded in your USB drive under data/movielens/large. For quick testing of your code, you may want to use a smaller dataset under data/movielens/medium, which contains 1 million ratings fr

                                      Movie Recommendation with MLlib
                                    • PythonのData Appsフレームワーク Streamlit, Dash, Panel を比較(With ChatGPT) - Qiita

                                      PythonのData Appsフレームワーク Streamlit, Dash, Panel を比較(With ChatGPT)PythonDashPanelStreamlitChatGPT 皆さん、こんにちは!Python Advent Calender2023の6日目担当の小川英幸(X: ogawahideyuki)です。 データから洞察を得る過程で、その発見を他の人と共有し、さらなるインサイトを得ることは非常に価値があります。そのような役割を検討した際に、既存のツールでは物足りない一方、「アプリを一から作るのは大変だな…」と感じたことはありませんか? ここで登場するのがData Appsです。Pythonだけで手軽にデータアプリを作成できるこれらのツールは、データ分析者にとって強力な味方。特にStreamlit、Dash、Panelを、簡単に使えるフレームワークとして、私は注目し、活

                                        PythonのData Appsフレームワーク Streamlit, Dash, Panel を比較(With ChatGPT) - Qiita
                                      • dbtとDataformを比較し、dbtを使うことにした

                                        AuthorsTwitter@__Attsun__Published onWednesday, February 10, 2021 最近、業務で DWH / Datamart の整備やデータ品質の担保を効率的に行いたくなる事情があり、調査したところ dbt と Dataform がツールとして有力そうだったので、比較してみました。 TL;DRdbt は機能が充実しており、カスタマイズするポイントも多く様々な要件に対応できそうです。反面、理解し使いこなすための学習コストがかかります。Dataform は Web ビューによる開発体験が非常に良いです。機能もほとんどはわかりやすく、迷うことも少ないです。一方、dbt に比較して融通はききづらいです。どちらも十分な機能は備えている素晴らしいツールだと感じるので、どちらが良いかは要求や組織の置かれた状況次第でしょう。私の所属する会社 (Ubie,

                                          dbtとDataformを比較し、dbtを使うことにした
                                        • 更新できるデータレイクを作る 〜Apache Hudiを用いたユーザデータ基盤の刷新〜 - Gunosy Tech Blog

                                          広告技術部のUT@mocyutoです。 こちらの記事はGunosy Advent Calendar 2021の4日目の記事です。 昨日は内田さんの その設定、pyproject.tomlに全部書けます - Gunosyデータ分析ブログ でした 今回はApache Hudiを用いたユーザデータ基盤の刷新を紹介します。 背景 仕組み 課題 対応策 データの持ち方を変える Apache Hudiとは 構成 Glue + PySpark Athenaによる抽出 移行し終えて 背景 Gunosyの広告システムではユーザに対して最適な広告を届けるために、接触済みのユーザに対して何度も同じ広告を出さないようにする仕組みを提供しています。 例えば、すでにある広告Aをクリックしたユーザには広告Aは再度配信しないのような設定です。 仕組み この仕組みを実現するためには以下のようなアーキテクチャになっていました

                                            更新できるデータレイクを作る 〜Apache Hudiを用いたユーザデータ基盤の刷新〜 - Gunosy Tech Blog
                                          • ABCIでMPT-7Bのファインチューニングを試す|shi3z

                                            前提知識MPT-7Bは最近発表された商用利用可能な大規模言語モデルで、LLaMAに匹敵する性能を持っていると言われています。 ABCIは経産省が管轄する日本在住者なら誰でも安価に使えるスーパーコンピュータです。 (ただし登録がいろいろ大変なので法人が前提です/利用料は最低20万円から) 対象読者行間が読める人。本文が間違っていても自分でソースコードに手を加えて修正できるスキルがある人。ABCIを使えるポジションの人。 僕も人間なのでミスはよくありますし、備忘録とこれからやろうとする人のために書いています。質問は受け付けません(自分でなんとかしてください)。 準備思ったより大変だったのでメモ まず、大前提として自宅のA6000x2のマシンでできるかと思ったら、ダメだった(12:57更新。ウソ:A6000x2でちゃんとできました)。 まず、MPTはTransformerなのでRWKVと違い、V

                                              ABCIでMPT-7Bのファインチューニングを試す|shi3z
                                            • TechCrunch

                                              Databricks has remained a hot startup at a time when interest from investors has cooled across the ecosystem. Just last month the company raised $500 million at an eye-popping $43 billion valuation. T

                                                TechCrunch
                                              • 第14回 MySQL 8.0 & MySQL Cloud Service登場、PostgreSQL9.6 RC版リリース、Apache SparkとSpark SQLの最新動向のご紹介 | gihyo.jp

                                                MySQL 5.7向けとしても開発中のドキュメントストア機能もMySQL 8.0に組み込まれています。このほかオプティマイザヒントの追加やGIS機能の拡張などが行われています。9月にリリースされたMySQL 8.0.0 DMR1には含まれず、Labsリリースとして公開されたのが、Common Table Expressions(共通テーブル式)およびオプティマイザからインデクスを隠す機能であるInvisible Indexです。後者はインデックスの削除/再作成の処理を行わずにインデックス削除の影響を確認可能になります。どちらもMySQL 8.0のメインの開発ツリーに統合されることが想定されます。 MySQL Cloud Service オラクルが提供するクラウドサービスOracle Public Cloudの1メニューとしてMySQL Cloud Serviceが利用可能となりました。My

                                                  第14回 MySQL 8.0 & MySQL Cloud Service登場、PostgreSQL9.6 RC版リリース、Apache SparkとSpark SQLの最新動向のご紹介 | gihyo.jp
                                                • Developer eXperience Day 2024【参加無料・アーカイブ配信あり】|EventRegist(イベントレジスト)

                                                  2024年7月16日(月)と17日(火)の2日間にわたり「Developer eXperience Day 2024」(一般社団法人 日本CTO協会主催)を、オフライン・オンラインのハイブリッド形式で開催いたします。 【参加無料・アーカイブ配信あり】です。ぜひご参加ください! 開催概要 名称:Developer eXperience Day 2024 開催日:2024年7月16日(火)・17日(水) 開催形式:オフライン(現地参加)・オンライン配信 会場:浅草橋ヒューリックホール&カンファレンス アクセス:https://hulic-hall.com/access/ JR総武線「浅草橋駅(西口)」より徒歩1分 参加方法:事前申込制(参加費:無料) 申込サイト:本イベントサイトよりお申込みください 参加対象: ソフトウェア開発の第一線で挑戦するエンジニアをはじめ、テックリード、エンジニアリン

                                                    Developer eXperience Day 2024【参加無料・アーカイブ配信あり】|EventRegist(イベントレジスト)
                                                  • あのSpark開発の総本山Databricksは何を目指しているのか、共同創業者に聞く

                                                    分散クラスターでのビッグデータ分析をインメモリーで高速に行うオープンソースソフトウエア(OSS)の「Spark」。その開発の中核を担う企業が米Databricksだ。Sparkを開発した米University of California Berkeley(UCB)の研究組織「AMPLab」からスピンアウトして、2013年に設立されたベンチャー企業である。 同社の事業内容はあまり明らかになっていなかったが、2014年6月に開催したSparkのイベント「Spark Summit 2014」を機に、Sparkを手軽に利用できるようにするためのクラウドサービス「Databricks Cloud」を投入したり(関連記事:高速ビッグデータ分析をクラウドで、Spark開発元のDatabricksがサービス開始)、Hadoopディストリビューションベンダーと相次いで提携したりするなど(関連記事:次世代Ha

                                                      あのSpark開発の総本山Databricksは何を目指しているのか、共同創業者に聞く
                                                    • https://jp.techcrunch.com/2017/06/07/20170606deep-databricks/

                                                        https://jp.techcrunch.com/2017/06/07/20170606deep-databricks/
                                                      • 「Databricks とは?何ができるか」新入社員が感じたイケてる機能10選 - Qiita

                                                        目次 はじめに 背景と目的 Databricksとは何か 機能紹介 共通 データエンジニアリング 機械学習 Databricks SQL おわりに はじめに こんにちは。Databricks の新井です。Qiita 初投稿です。 2022年の7月よりソリューションアーキテクトとして働き始めました。 お客様に弊社製品を知っていただき、導入いただく際の技術サポートを行う役割です。 本記事では Databricks にご興味がある皆様に弊社プラットフォームを理解いただくために、新入社員の目線から便利だと感じた10個の機能をまとめました。 今後も記事執筆を継続するモチベーションに繋がりますので「いいね」や記事の保存、SNSで共有いただけると嬉しいです。宜しくお願いいたします! 背景と目的 皆様の中には Databricks という会社に馴染みがない方も多いと思います。 米国カリフォルニア州に本社が

                                                          「Databricks とは?何ができるか」新入社員が感じたイケてる機能10選 - Qiita
                                                        • DiscoverDev | Daily digest of engineering blog posts for software developers

                                                          Discover dev brings you a daily digest of the best engineering blogs from across the web! Handpicked by AI and a network of globally distributed nerds! Join us and thousands of fellow developers - Subscribe to our mailing list, follow us on Twitter or tap into our RSS feed (Feed burner)! [×] Subscribe to our weekly newsletter! We take your time and privacy seriously - no sharing of email, no spamm

                                                            DiscoverDev | Daily digest of engineering blog posts for software developers
                                                          • I interviewed at five top companies in Silicon Valley in five days, and luckily got five job offers

                                                            In the five days from July 24th to 28th 2017, I interviewed at LinkedIn, Salesforce Einstein, Google, Airbnb, and Facebook, and got all five job offers. It was a great experience, and I feel fortunate that my efforts paid off, so I decided to write something about it. I will discuss how I prepared, review the interview process, and share my impressions about the five companies. How it startedI had

                                                              I interviewed at five top companies in Silicon Valley in five days, and luckily got five job offers
                                                            • 本当に小さく機械学習プロダクトを始めるには - Qiita

                                                              Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? TL;DR マイクロサービス基盤がない、潤沢にエンジニアリソースがない、そんな現場にも機械学習プロジェクトをいい感じにプロダクトに乗せていく今風のやり方について考えたい。そのために現状世の中にある機械学習ツールを俯瞰したい。 プロダクトに乗せるとすると、デプロイで終わりではなくて、モデル再学習やモニタリングなども含めて考えたい。 はじめに 機械学習のサービスは内部のアルゴリズムが複雑であっても、そのサービス自体に求められることが多くなかったり、学習と推論時で必要なリソースが異なったりというところからマイクロサービスアーキテクチャと相性が

                                                                本当に小さく機械学習プロダクトを始めるには - Qiita
                                                              • Azure status history | Microsoft Azure

                                                                Mitigation Statement - Azure Virtual Desktop issues accessing available resources list for US regions What happened? Between 18:46 UTC and 20:36 UTC on 16 September 2024, customers using Azure Virtual Desktop, whose end user connections were dependent on a subset of infrastructure in the East US region, had users who experienced issues creating new connections. In addition, Azure Virtual Desktop a

                                                                • 高速ビッグデータ分析をクラウドで、Spark開発元のDatabricksがサービス開始

                                                                  Hadoopによる分散クラスター上で、高速なビッグデータ分析を可能にするフレームワークとして注目されている「Spark」(関連記事:次世代Hadoop最有力候補の「Spark」、動き始めたエコシステム)。そのSparkをホスティングしたクラウドサービスが始まる。 Sparkの開発元企業である米Databricksは、分散クラスターを自社で構築しなくとも、クラウド上でSparkを即利用できるサービス「Databricks Cloud」を開始した。2014年6月30日から米国で開催中のSparkのイベント「Spark Summit 2014」で明らかにした。 現在はベータ版として限定的に公開している段階で、ベータユーザーを同社サイトで受け付けている。 Databricks Cloudでは、Sparkを構成する各種フレームワークを利用できる。SQLによるインタラクティブ分析用の「Spark SQ

                                                                    高速ビッグデータ分析をクラウドで、Spark開発元のDatabricksがサービス開始
                                                                  • 「Apache Spark 1.4」が公開--R言語をサポート、機械学習パイプラインAPIが安定版に

                                                                    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 分析クラスタフレームワーク「Apache Spark」は、人気の統計向けプログラミング言語「R」へのアクセスを提供することでデータサイエンティストの仕事を容易にすることを目指す。 一般公開された最新の「Apache Spark 1.4」では、Python 3のサポートに加えてRもサポートされた。R言語ユーザーはR言語向けのAPIである「SparkR」を利用して、大規模なデータセットを直接利用できる。 SparkRはカリフォルニア大学バークレー校のAMPLabで開発されたもので、Apache SparkにRのフロントエンドを提供するものだ。Sparkの分散型コンピュータエンジンを利用して、ユーザーは大規模なデータ解析をRシェルから動かすこ

                                                                      「Apache Spark 1.4」が公開--R言語をサポート、機械学習パイプラインAPIが安定版に
                                                                    • TechCrunch

                                                                      Even with some criticisms, most VC think that the state's effort to track diversity data is worth it. Databricks has remained a hot startup at a time when interest from investors has cooled across the ecosystem. Just last month the company raised $500 million at an eye-popping $43 billion valuation. T

                                                                        TechCrunch
                                                                      • Introduction to loading data  |  BigQuery  |  Google Cloud

                                                                        Send feedback Stay organized with collections Save and categorize content based on your preferences. Introduction to loading data This document provides an overview of loading data into BigQuery. Methods of loading data You can load (or ingest) data into BigQuery in several ways: Batch load a set of data records. Stream individual records or batches of records. Use queries to generate new data and

                                                                          Introduction to loading data  |  BigQuery  |  Google Cloud
                                                                        • TechCrunch

                                                                          Even with some criticisms, most VC think that the state's effort to track diversity data is worth it. Databricks has remained a hot startup at a time when interest from investors has cooled across the ecosystem. Just last month the company raised $500 million at an eye-popping $43 billion valuation. T

                                                                            TechCrunch
                                                                          • Windows Virtual Desktop | Microsoft Azure

                                                                            Products Popular View all products (200+) Azure Virtual Machines Azure Virtual Desktop Azure SQL Microsoft Copilot in Azure PREVIEW Azure AI Services Azure AI Studio Azure Cosmos DB Azure Kubernetes Service (AKS) Azure Arc​ Azure Migrate AI + machine learning Azure Machine Learning Azure AI Services Microsoft Copilot in Azure PREVIEW Azure OpenAI Service Azure AI Studio Azure AI Vision Azure AI Se

                                                                            • Data warehousing and enterprise information management | Microsoft

                                                                              Products Popular View all products (200+) Azure Virtual Machines Azure Virtual Desktop Azure SQL Microsoft Copilot in Azure PREVIEW Azure AI Services Azure AI Studio Azure Cosmos DB Azure Kubernetes Service (AKS) Azure Arc​ Azure Migrate AI + machine learning Azure Machine Learning Azure AI Services Microsoft Copilot in Azure PREVIEW Azure OpenAI Service Azure AI Studio Azure AI Vision Azure AI Se

                                                                                Data warehousing and enterprise information management | Microsoft
                                                                              • About connecting the dots.

                                                                                この記事は,AWS Analytics Advent Calendar 2022 の 5 日目の記事になります. qiita.com 11/8 に Amazon Athena が Query Result Reuse をサポートしました.この機能,要するにクエリ結果のキャッシュが使えるようになったとのことで,似たようなクエリを何度も試すような場合には,結果を高速に取得できるようになります.この記事では,実際にいくつかのパターンで利用して,どのくらい効果が出るかを確認できればと思います. aws.amazon.com 試してみる 集計データ まずはマネコン上のクエリエディタから,実際にクエリを投げてみたいと思います.ちなみにこの機能は Athena のバージョン 3 エンジンでのみ使用可能なため,古いバージョンのエンジンを使っている方は,マネコンの左側メニュー Workgroups から,エ

                                                                                  About connecting the dots.
                                                                                • データメッシュの概念について理解する - connecting the dots

                                                                                  はじめに データの利活用が進まない原因 データメッシュとは何か データメッシュアーキテクチャ データメッシュアーキテクチャの特徴 サイロ化されたデータ基盤との大きな違い データメッシュの思想 1. ドメイン主導によるデータオーナーシップ ドメインとは何か データ所有権の一元化の課題 ドメイン主導のデータオーナーシップ ドメイン主導のテクノロジースタック選定 2. プロダクトとしてのデータ データプロダクトとは何か 3. プラットフォームとしてのセルフサービス型データ基盤 セルフサービス型データ基盤とは セルフサービス型データ基盤を構成するリソースとツール 中央IT組織とドメインのそれぞれに求められる役割と責任 4. ドメインと中央による分担管理型データガバナンス ドメインと中央による分担管理型データガバナンスとは ガバナンスの定義 データメッシュを実現するには まとめ 参考 はじめに Fo

                                                                                    データメッシュの概念について理解する - connecting the dots