[B! dask] dannのブックマーク

dann id:dann

daskに関するdannのブックマーク (23)

Understanding Performance — Dask documentation
dann 2023/10/15
dask

performance
リンク
Run a single task per worker with dask-mpi
dann 2023/10/15
dask
リンク
MVAPICH2 for Intel MIC
dann 2023/10/15
dask
リンク
Python for High Performance Computing: Dask for parallel data operations
dann 2023/10/15
dask
リンク
dask-examples/machine-learning.ipynb at main · dask/dask-examples
dann 2023/10/15
dask
リンク
dask-examples/dataframe.ipynb at main · dask/dask-examples
dann 2023/10/15
dask
リンク
dask-mpi/dask_mpi/core.py at main · dask/dask-mpi
dann 2023/10/14
dask
リンク
Start dask-mpi problem
dann 2023/10/14
“initialize(interface="ib0.8066", nthreads=1)”

dask
リンク
How to Create dask-scheduler.json · Issue #3416 · dask/dask
dann 2023/10/14
dask
リンク
Dask & Ray
Another tool that deserves mention: Dask. The idea: recreate the API from Pandas (and NumPy and Scikit-Learn) as much as possible, but do lazy evaluation, and allow distributed computation (like Spark). As a demo, let's recreate the Most-Viewed Wikipedia Pages solution in Dask… [Complete code: dask_wikipedia.py] Dask Basic setup: import the Dask DataFrame functionality, and create a client to work
dann 2023/10/14
dask
リンク
Dask on HPC - Initial Work
dann 2023/10/14
dask
リンク
GitHub - wmlba/ECS-Dask: Dask on ECS Fargate
dann 2023/10/14
dask

ecs
リンク
NeMo Data Curator - NVIDIA Docs
dann 2023/10/14
dask
リンク
blog/dedup.md at main · huggingface/blog
dann 2023/10/14
dedupe

text

dask

spark
リンク
Large-scale Near-deduplication Behind BigCode
dann 2023/10/14
deduplication

dask

spark
リンク
1100万行・32GB超の巨大CSVファイルの基本統計量を4GBメモリマシンで算出する - Qiita
はじめにこの記事は，Kaggle Advent Calendar 2022第6日目の記事になります。本記事では、 32GB超のCSVデータの基本統計量を、小規模マシンでも省メモリかつ高速に計算するテクニックについて解説します。 Kaggleコンペに限らず、マシンスペックが低いため、大きなデータセットを満足に処理できず困っている毎回行うファイル読み込みが遅いので、もっと高速化したい ⚡ といった悩みや課題を抱えている方の参考になれば幸いです。モチベーションデータ分析業務やKaggle等のコンペティションで初めてのデータセットを扱う場合、いきなり機械学習アルゴリズムを行うことはまず無く、最初にデータ観察を行うのが一般的です。テーブルデータであれば、各カラムの基本統計量（最小値、最大値、平均、分散、四分位数）などを計算・可視化し、データクレンジングの要否や特徴量設計の方針などを検
dann 2023/06/06
dask
リンク
Dask, Pandas, and GPUs: first steps
dann 2022/03/23
dask
リンク
Dask-MPI with GPUs — Dask-MPI 2022.4.0+75.g3d4742e.dirty documentation
dann 2022/03/23
dask

mpi

gpu
リンク
How Dask-MPI Works — Dask-MPI 2022.4.0+75.g3d4742e.dirty documentation
dann 2022/03/23
dask
リンク
GitHub - dask/dask-mpi: Deploy Dask using MPI4Py
dann 2022/03/23
dask

mpi
リンク
1 2 次のページ

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx