[B! PyTorch] misshikiのブックマーク

misshiki id:misshiki

PyTorchに関するmisshikiのブックマーク (559)

TorchTPU: Running PyTorch Natively on TPUs at Google Scale- Google Developers Blog
The challenges of building for modern AI infrastructure have fundamentally shifted. The modern frontier of machine learning now requires leveraging distributed systems, spanning thousands of accelerators. As models scale to run on clusters of O(100,000) chips, the software that powers these models must meet new demands for performance, hardware portability, and reliability. At Google, our Tensor P
misshiki 2026/04/30
GoogleがTorchTPUを紹介。PyTorchをTPU上でネイティブ実行し、PrivateUse1、3種のEager mode、torch.compile+XLA、DDP/FSDPv2/DTensor、MPMD対応で少ない変更と高性能を両立する狙い。

PyTorch
リンク
Monarch: an API to your supercomputer – PyTorch
misshiki 2026/04/10
MetaのPyTorch向け分散フレームワークMonarch。単一Python APIで大規模クラスタを扱い、Kubernetes対応、EFA/ROCm対応、分散SQLテレメトリ、TUI/OSSダッシュボード強化などを追加。

Meta

PyTorch

Python
リンク
PyTorch Foundation Welcomes Helion as a Foundation-Hosted Project to Standardize Open, Portable, and Accessible AI Kernel Authoring – PyTorch
misshiki 2026/04/08
PyTorch FoundationがMeta開発のHelion採択。Python DSLでAIカーネルを記述し、Triton等へコンパイル。数百実装を自動チューニングし移植性向上。ExecuTorchはPyTorch Coreへ統合。

Meta

Python

PyTorch
リンク
PyTorch 2.10+TorchAO: Powering AIPC scenarios on Intel® Core™ Ultra Series 3 processors – PyTorch
misshiki 2026/03/21
“Intel Core Ultra Series 3プロセッサの主な特徴と、PyTorchにおける最新の改良点を紹介。これらの技術革新により、PCおよびエッジコンピューティング環境において、より幅広いAIシナリオを実現することが可能になりました。”

PyTorch
リンク
Building Voice Agents with ExecuTorch: A Cross-Platform Foundation for On-Device Audio – PyTorch
misshiki 2026/03/21
PyTorchがExecuTorchによる音声AI基盤を紹介。5モデル・4タスクの参照実装を公開し、CPU/GPU/NPUでLinux/macOS/Windows/Android/iOSに展開可能。LM Studioは本番で採用。

PyTorch

音声処理
リンク
MXFP8 Training for MoEs: 1.3x training speedup vs BF16 for Llama4 Scout on GB200 cluster using TorchAO and TorchTitan – PyTorch
misshiki 2026/03/15
“MoE（Mixture of Experts）モデル向けMXFP8トレーニング：TorchAOとTorchTitanを使用したGB200クラスタ環境において、Llama4 ScoutモデルのBF16方式と比較してトレーニング速度が1.3倍向上”

自然言語処理

PyTorch
リンク
最新のPyTorchで軽量OCRモデルPARSeqをTensorRT化する - NTT docomo Business Engineers' Blog
こんにちは。イノベーションセンターの加藤です。普段はコンピュータビジョンの技術開発やAIシステムの検証に取り組んでいます。今回は最新版のPyTorchを使って軽量なTransf ormerベースOCRモデルであるPARSeq(Permuted Autoregressive Sequence)をTensorRTモデルに変換して高速化した取り組みについて紹介します。 PARSeqとは PARSeqのTensorRT化 PyTorch Lightningによるモデル変換 AutoregressiveとIterative refinementがTensorRT化できない問題 Autoregressive modeのTensorRT化 TorchDynamoの機嫌をとる Iterative refinementのTensorRT化評価まとめ PARSeqとは PARSeq1はVision Tra
misshiki 2026/03/11
軽量OCRモデルPARSeqを最新PyTorch環境でTensorRT化。NARは直接変換、ARとrefinementは実装を分割・改修して対応。IIIT-5KでAR 2.58倍、NAR 3.07倍の高速化を確認。

OCR

PyTorch
リンク
FlexAttention + FlashAttention-4: Fast and Flexible – PyTorch
TL;DR: On Hopper and Blackwell GPUs, FlexAttention now has a FlashAttention-4 backend. We added support in PyTorch to automatically generate CuTeDSL score/mask modification functions, and to JIT-instantiate FlashAttention-4 for custom attention variants. This leads to performance gains of 1.2× to 3.2× over the existing Triton implementation on compute-bound workloads. FlexAttention recap FlexAtten
misshiki 2026/03/06
PyTorchがFlexAttentionにFlashAttention-4バックエンドを追加。Hopper/Blackwell向けで、既存Triton比1.2〜3.2倍高速化。CuTeDSL自動生成とJIT実体化でカスタムattentionの柔軟性と性能向上を狙う。

PyTorch
リンク
Pyrefly Now Type Checks PyTorch – PyTorch
We’re excited to share that PyTorch now leverages Pyrefly to power type checking across our core repository, along with a number of projects in the PyTorch ecosystem: Helion, TorchTitan and Ignite. For a project the size of PyTorch, leveraging typing and type checking has long been essential for ensuring consistency and preventing common bugs that often go unnoticed in dynamic code. Migrating to P
misshiki 2026/02/20
PyTorchがRust製Python型チェッカー「Pyrefly」を採用。mypy比約9倍高速な型チェックで巨大コードベースのバグ検出やCI効率を改善。IDE補完や開発体験の向上も狙い、エコシステム全体へ展開。

PyTorch

Python
リンク
Introduction to PyTorch | 0byte
# Each row is one house: [bedrooms, bathrooms, size, age, price] houses = torch.tensor([ [2, 65, 15, 285], [3, 95, 8, 425], [4, 120, 25, 380], [3, 88, 42, 295], [5, 180, 3, 675], [2, 58, 50, 245] ], dtype=torch.float32) You might be wondering, not all data is numbers. Sometimes we have words, images, or even 3D mesh data. If that's the case, we need a step in between. We need to find a way to map
misshiki 2026/02/18
“PyTorch入門わかりやすく視覚的に解説した入門ガイド。”

PyTorch

ディープラーニング
リンク
Mooncake Joins PyTorch Ecosystem – PyTorch
misshiki 2026/02/15
MooncakeがPyTorchエコシステムに参加。 Mooncake は大規模言語モデル（LLM）の推論でボトルネックになりがちなメモリ問題（memory wall）を解決するための高性能 KVCache 転送・共有ストレージ機能を提供します。

PyTorch
リンク
GPU マシンに直接 PyTorch 環境を構築するときの手順と注意点 - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 手元の古い GPU マシンに PyTorch 環境を構築しようとして、昔やったように構築したら動きませんでした (PyTorch と GPU の不整合で)。エラーメッセージから原因はわかるし解決も難しくないですが、そもそも最初から失敗しない手順を記します。先に注意点のまとめ手元の GPU マシンに直接 PyTorch 環境を構築するとき、(昔に環境構築が上手くいった経験がある人ほど) 以下の点に注意が要ると思います。近年の PyTorch には CUDA ランタイムが同梱されているため [1]、別途 CUDA をインストールしてお
misshiki 2026/01/13
近年のPyTorchはCUDAランタイム同梱なので基本はCUDA本体を別途入れずGPUドライバだけでOK。

PyTorch
リンク
Warp Specialization in Triton: Design and Roadmap – PyTorch
misshiki 2026/01/13
“本稿では、Tritonにおけるワープ特殊化機能（「autoWS」）の現在の設計方針を概説するとともに、今後の開発計画についてご説明します。”

PyTorch
リンク
GitHub - obround/mytorch: Automatic differentiation implemented in python, inspired by Pytorch (easily extensible)
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
misshiki 2026/01/05
“PyTorchのAPIに準拠した、拡張性の高い自動微分機能をPythonで実装しています。数値計算にはNumPyを利用しています。実装方式はPyTorchと同様で、グラフベースの逆伝播型自動微分を採用しています。”

Python

PyTorch

数学

ディープラーニング
リンク
M5 Mac + PyTorchで爆速深層学習 - Qiita
はじめに赤石です。すごく久しぶりに投稿します。個人目的で現在利用中のMac(Macbook Pro M1)は、約５年前に購入しました。別に不自由はないのですが、そろそろ買い換えてもいいかと思い、最新のMacBook Pro(M5)を購入しました。ディープラーニングとか、PyTorchの本を書いている人間なので、ローカルで動く環境を作ろうと、関係ソフトを一式導入しました。その手順メモを書くつもりだったのですが、その過程で驚いたことがあります。クラウドのColab+T4環境で学習に約５分かかる、書籍用のPyTorchサンプル学習コードをローカルのMac(M5)で動かしたところ、なんと30秒で学習が終わってしまったのです。この環境では、mpsが使えることがわかり、そちらに差し替えたら今度は１分でした。いまだにわけわからないのですが、手順を一通り説明しますので、M5 Macをお持ちの方
misshiki 2026/01/04
普通のクラウド GPU で数分かかるような PyTorch の学習をM5 Mac で 30～51 秒にできた。Apple の M シリーズ + PyTorch の MPS の組み合わせがかなり高速であるという体験レポ。

PyTorch

Mac
リンク
GitHub - pytorch/executorch: On-device AI across mobile, embedded and edge for PyTorch
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
misshiki 2025/12/25
“ExecuTorch は、スマートフォンからマイクロコントローラーまで、デバイス上でAIモデルを展開するためのPyTorchの統合ソリューションです。”

PyTorch

Python

プログラミング

人工知能
リンク
LLMのCUDAカーネルを自作しよう!
本記事は、LLM・LLM活用 Advent Calendar 2025 21日目の記事です。はじめに pytorchは、Meta社が開発した機械学習・深層学習のためのpythonライブラリです。ユーザーは、pytorchを使用することで、画像分類モデルや強化学習モデルをはじめとし、大規模言語モデルや拡散モデルなど、多種多様なニューラルネットワークモデルを構築することが可能です。また、pytorch内部では、CPU、TPU、GPUといった様々なプロセッサ向けに最適化された処理が実装されており、これらのプロセッサ間を容易に切り替えて使用することが可能です。例えば、大規模言語モデルの推論処理をGPU上で行いたい場合は、以下のように記述します。このようにユーザーは、入力テンソルとモデルインスタンスに対して.to("cuda")をつけるだけで、GPUを使用した処理が実行可能です。GPUを使用した
misshiki 2025/12/23
“GPT2モデルの各層のforward処理、backward処理のCUDA関数のスクラッチ実装方法 pytorchのカスタムクラスを作成し、そこからCUDAカーネルを実行する方法日本語データセットを使用した自作GPT2モデルの学習方法”

PyTorch

自然言語処理

プログラミング
リンク
LLM開発の裏で行われるデバッグ作業: PyTorch DCP
はじめに Turing CTO室に所属している東京科学大学(Institute of Science Tokyo)の藤井です。本記事は、LLM, VLM開発の裏で行われるリアルなデバッグ作業の様子を紹介します。 LLM, VLMの開発の裏には本記事で紹介するような地道なデバッグ作業が多数あるのですが、なかなかその実態が伝わっていないように思います。できるだけ詳細にデバッグ作業の様子を記しましたので、実際の現場で行われている作業を追体験いただけますと幸いです。 Background まず、デバッグ作業を行う前の背景と経緯について説明します。学習に使用している依存関係の継続的なupdateのために、学習ライブラリが新しいversionのPyTorch、CUDA Toolkitで動作するかどうか常に検証しています。本記事では、その作業を行う中で問題に直面し、何が問題なのか突き止めるまでの過
misshiki 2025/11/14
“PyTorch実装の仕様変更のいずれかを原因と考え、調査を開始することにしました。以下では、デバッグ作業の様子を時系列順に説明します。”

PyTorch

プログラミング
リンク
https://x.com/SemiAnalysis_/status/1988486601710989697
- 1 user
- x.com
- 学び
misshiki 2025/11/13
“ROCm PyTorchユニットテストCIは過去3ヶ月で改善されましたが、残念ながらROCmトランク統合テストは大幅に後退しました。”

PyTorch

ディープラーニング
リンク
AI開発の重要基盤「PyTorch」の発明者がMetaを退職
AIの開発に用いられている機械学習ライブラリ「PyTorch」の発明者であるソウミス・チンタラ氏が、Metaを退職したことを発表しました。PyTorch開発プロジェクトは他のメンバーに引き継がれます。 Leaving Meta and PyTorch https://soumith.ch/blog/2025-11-06-leaving-meta-and-pytorch.md.html Leaving Meta and PyTorch I'm stepping down from PyTorch and leaving Meta on November 17th. tl;dr: Didn't want to be doing PyTorch forever, seemed like the perfect time to transition right after I got back f
misshiki 2025/11/11
“機械学習ライブラリ「PyTorch」の発明者であるソウミス・チンタラ氏が、Metaを退職したことを発表しました。PyTorch開発プロジェクトは他のメンバーに引き継がれます。”

PyTorch
リンク
1 2 3 4 5 6 7 8 9 10 次のページ