[B! data] ktykogmのブックマーク

ktykogm id:ktykogm

dataに関するktykogmのブックマーク (35)

データメッシュ内のアーキテクチャと機能 | Cloud アーキテクチャセンター | Google Cloud
デジタルトランスフォーメーションを加速お客様がデジタルトランスフォーメーションに乗り出したばかりでも、あるいはすでに進めている場合でも、Google Cloud は困難な課題の解決を支援します。
ktykogm 2024/03/11
data

organization

architecture

Google

cloud

gcp
リンク
GitHub - dbt-labs/dbt-core: dbt enables data analysts and engineers to transform their data using the same practices that software engineers use to build applications.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
ktykogm 2024/02/21
DB

data

analysis
リンク
LookML か ELT か？LookML をおすすめする 3 つの理由 | Google Cloud 公式ブログ
※この投稿は米国時間 2024 年 2 月 3 日に、Google Cloud blog に投稿されたものの抄訳です。背景 LookML は、エンタープライズデータ分析にビジネスロジックとガバナンスを適用する優れたツールです。しかし、LookML の機能は、Dataform や DBT のようなウェアハウス内の「ELT」変換ツールの機能と一緒にされることがよくあります。これらのツールは類似しているように見えるため、ユーザーはどちらかを選ぶ必要があると考えがちです。この投稿では、お客様がデータ分析スタックに LookML と ELT ツールの両方を使用するべき理由について、特に LookML の重要性を中心に説明します。続編の記事では、LookML と ELT のレイヤ間でビジネスロジックと変換を設計する方法について説明します。 LookML の簡単な説明 LookML を初めて使
ktykogm 2024/02/19
Google

cloud

data

analysis

insight

Visualization
リンク
BigLake: データレイクとデータウェアハウスを複数のクラウド間で統合 | Google Cloud 公式ブログ
※この投稿は米国時間 2022 年 4 月 7 日に、Google Cloud blog に投稿されたものの抄訳です。組織が管理および分析すべき貴重なデータの量は、驚異的なスピードで増加し続けています。このようなデータは、データウェアハウス、データレイク、NoSQL ストアなど、複数の場所に分散して保存されることが多くなってきました。組織のデータがますます複雑化して異なるデータ環境に拡散されると、サイロが出現し、リスクや費用が増します。特にそのデータを移動する必要が生じた場合にはそれが顕著になります。これは Google Cloud のお客様を見ても明らかであり、お客様はこのことについて支援を必要としています。こうした状況を受けてこのたび発表するのが、データウェアハウスとデータレイクを統合するストレージエンジン、BigLake です。BigLake は基盤となるストレージ形式やシ
ktykogm 2024/02/19
Google

cloud

data
リンク
Google の新サービス「 BigLake 」とは？特徴やメリット、ユースケースまで徹底解説！ | 株式会社トップゲート
削除する Google Service TGカルチャーアプリケーション開発コンサルティングセミナーテックブログデザインデジタルプロダクト開発開発実績ニュース 2025年の崖(1) 5G(1) AI(39) AI Hub(1) AI Platform(1) AlloyDB(12) AlloyDB for PostgreSQL(6) AlphaZero(1) Analytics HUB(1) Android(11) Android アプリ(1) Anthos(6) API(12) API エコノミー(1) APP(2) App Engine(2) App Maker(2) AppServer(1) AppSheet(3) arduino(1) Authentication(1) AutoML(4) AWS(12) AWS (Amazon Web Services)(1) AWS
ktykogm 2024/02/17
Google

cloud

BigQuery

data
リンク
GitHub - FavioVazquez/ds-cheatsheets: List of Data Science Cheatsheets to rule the world
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
ktykogm 2024/02/04
data

ML

cheatsheet
リンク
集中 vs 分散、データメッシュ（Data Mesh) とは？ - Qiita
この記事はインフォマティカ Advent Calendar 2022 Day14 の記事として書かれています。はじめにデータマネジメントのエバンジェリストをやっているもりたくです。本日は、先日解説した「データファブリック」と並んで関心の高いデータマネジメントワードである「データメッシュ」について解説したいと思います。この記事を読んだ人が「データメッシュとは何でどう実現すべきものか、データファブリックとの違いは何か？」を少しでも理解できれば嬉しく思います。データメッシュとは何か？データメッシュという用語は、2019年にZhamak Dehghaniによって最初に定義されています。よりディープにデータメッシュについて知りたい方は、本記事を読んだ後に、以下の情報を熟読することをお薦めします。 How to Move Beyond a Monolithic Data Lake to
ktykogm 2024/01/23
data

architecture

platform
リンク
Data Mesh Architecture
Many organizations have invested in a central data lake and a data team with the expectation to drive their business based on data. However, after a few initial quick wins, they notice that the central data team often becomes a bottleneck. The team cannot handle all the analytical questions of management and product owners quickly enough. This is a massive probl em because making timely data-driven
ktykogm 2024/01/23
data

architecture

platform
リンク
How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh
How to Move Beyond a Monolithic Data Lake to a Distributed Data Mesh Many enterprises are investing in their next generation data lake, with the hope of democratizing data at scale to provide business insights and ultimately make automated intelligent decisions. Data platforms based on the data lake architecture have common failure modes that lead to unfulfilled promises at scale. To address these
ktykogm 2024/01/23
data

architecture

platform
リンク
LLM開発のためのデータエンジニアリング - Qiita
LLM開発のためのデータエンジニアリング MLOps Advent Calendar 2023の24日目です。 Stability AIでデータ系のソフトウェアエンジニアをやっているcvuskです。主な仕事は日本語LLMのためのデータ開発です。Stability AIでは日本語LLMも各種開発しています。LLMの学習というと大量のGPUを用意して巨大なデータでモデルを学習する、というキラキラしたイメージ（？）が強いかもしれませんが、データが重要かつ苦労が耐えない課題であることは他の機械学習やディープラーニングモデルと違いありません。日本語のテキストデータは英語ほど入手しやすいわけではないのと同時に、データエンジニアリングや品質面でもいろいろと大変なことが多々あります。今回はLLMのためのテキストデータの用途やエンジニアリングについて整理します。 LLMの学習 LLMの学習は大きく分けて事前
ktykogm 2023/12/25
LLM

data
リンク
データインシデント対応プロセス | ドキュメント | Google Cloud
フィードバックを送信データインシデント対応プロセスコレクションでコンテンツを整理必要に応じて、コンテンツの保存と分類を行います。このコンテンツの最終更新日は 2022 年 9 月で、作成時点の状況を表しています。お客様の保護の継続的な改善のために、Google のセキュリティポリシーとシステムは変更される場合があります。 Google が最も重視しているのは、顧客データのための安全な環境を維持することです。Google は顧客データを保護するために、厳格なプロセス、専門家によるインシデント対応チーム、多層構造の情報セキュリティとプライバシーインフラストラクチャを組み合わせた、業界最先端の情報セキュリティオペレーションを実行しています。このドキュメントでは、Google Cloud でデータインシデントの管理と対応を行う際の原則となるアプローチについて説明します。 Clou
ktykogm 2023/09/05
SRE

data

incident
リンク
Google Colaboratory
Sign in
ktykogm 2023/05/23
Google

python

AI

programming

data

ML

learn
リンク
Tidy Data
JSS Journal of Statistical Software MMMMMM YYYY, Volume VV, Issue II. http://www.jstatsoft.org/ Tidy Data Hadley Wickham RStudio Abstract A huge amount of effort is spent cleaning data to get it ready for analysis, but there has been little research on how to make data cleaning as easy and effective as possible. This paper tackles a small, but important, component of data cleaning: data tidying. T
ktykogm 2023/02/21
statistics

data

paper
リンク
株式会社ネオブラッド
--------------------------------- 最近、偽サイトでクレジットカードの情報を入力させて決済は銀行口座振り込みなどのパターンがあります。クレジットカードの情報を入力してしまったら、その時点から情報の悪用される危険があります。決済していなくても、購入していなくても入力したら、すぐにカード会社にご相談ください。 -------------------------------- 偽サイトのメールアドレス：2024年1月4日収集 ajydxad@oralfoot.site https://njcwba.fastrule.top/ ( CICIBELLA-SPORTS- ) と名乗る偽サイト 1）----------------aiehy@flatwait.sitehttps://sngdet.ethnicdj.top/( seedcoms ) と名乗る偽サイト
ktykogm 2023/02/16
security

crime prevention

data
リンク
ChatGPTを筆頭に信じられないレベルでAIが進化しているが「なぜAIがこんなにも『急激に』質が良くなったかを」を研究者本人たちですら説明できない
Takuya Kitagawa/北川拓也 @takuyakitagawa 近年のAIの進化は実は理解されていない。 ChatGPTを筆頭に、信じられないレベルでAIが進化している。そう、本当に信じられないレベルなのは、なぜAIがこんなにも「急激に」質が良くなったかを、誰も説明できないからだ。おそらく発明した研究者本人たちですら。どういうことか。 1/n 2023-01-29 10:51:36 Takuya Kitagawa/北川拓也 @takuyakitagawa AIの精度を定量化したとき、数年前までは研究の進化と共に、少しずつ精度があがっていった。研究の進化とは 1. モデルやアルゴリズムの進化 2. 計算量の増加 3. データ量の増加などだ。１０年ほど前にAIがもてはやされた時は、Deep Learningといったモデルの進化が重要だった。 2/n 2023-01-29 1
ktykogm 2023/02/06
AI

data
リンク
GitHub - ent/ent: An entity framework for Go
English | 中文 | 日本語 | 한국어 Simple, yet powerful entity framework for Go, that makes it easy to build and maintain applications with large data-models. Schema As Code - model any database schema as Go objects. Easily Traverse Any Graph - run queries, aggregations and traverse any graph structure easily. Statically Typed And Explicit API - 100% statically typed and explicit API using code generation.
ktykogm 2022/11/10
go

data

migration

framework

schema
リンク
GitHub - pola-rs/polars: Dataframes powered by a multithreaded, vectorized query engine, written in Rust
>>> import polars as pl >>> df = pl.DataFrame( ... { ... "A": [1, 2, 3, 4, 5], ... "fruits": ["banana", "banana", "apple", "apple", "banana"], ... "B": [5, 4, 3, 2, 1], ... "cars": ["beetle", "audi", "beetle", "beetle", "beetle"], ... } ... ) # embarrassingly parallel execution & very expressive query language >>> df.sort("fruits").select( ... "fruits", ... "cars", ... pl.lit("fruits").alias("lite
ktykogm 2022/11/07
data

rust

python

Node.js
リンク
はじめに — Python早見帳
Python早見帳は、プログラムと実行例をカタログ的に提示しながら、Pythonの言語仕様やライブラリを紹介しています。Pythonの基礎を素早く習得したり、ライブラリやオブジェクトの使い方を確認することができます。
ktykogm 2022/10/14
python

study

data

analysis
リンク
Python Data Science Handbook | Python Data Science Handbook
This website contains the full text of the Python Data Science Handbook by Jake VanderPlas; the content is available on GitHub in the form of Jupyter notebooks. The text is released under the CC-BY-NC-ND license, and code is released under the MIT license. If you find this content useful, please consider supporting the work by buying the book!
ktykogm 2022/08/11
python

data
リンク
Machine Learning Cheat Sheets for ML Engineers & Data Scientist.
ktykogm 2022/08/09
ML

data

cheatsheet
リンク
1 2 次のページ