nissaxのブックマーク - はてなブックマーク

(数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門
(数式を使わない) Transf ormer の直感的な説明 RNN の欠点 Transf ormer はこれをどう解決したか Transf ormer の動作原理複数の要素間の関係を考慮する (Self-Attention、自己注意) 要素の順序を考慮する (Positional Encoding、位置エンコーディング) まとめ概要: ChatGPT などで使われている Transf ormer モデルは、ニューラルネットワークの世界にいくつかの革新的なアイデアをもたらした。本記事では、プログラマに理解しやすい形でそれらのアイデアを解説する。実際に使われている数学の詳細には触れない。 (技術的解説については元論文 Attention is All You Need か、その注釈版である The Annotated Transf ormer を参照のこと。日本語ではこの解説がわかり
nissax 2023/02/27
リンク
真面目なプログラマのためのディープラーニング入門
はじめに: 本講座は「機械学習ってなんか面倒くさそう」と感じているプログラマのためのものである。本講座では「そもそも機械が『学習する』とはどういうことか?」「なぜニューラルネットワークで学習できるのか?」といった根本的な疑問に答えることから始める。そのうえで「ニューラルネットワークでどのようなことが学習できるのか?」という疑問に対する具体例として、物体認識や奥行き認識などの問題を扱う。最終的には、機械学習のブラックボックス性を解消し、所詮はニューラルネットワークもただのソフトウェアであり、固有の長所と短所をもっていることを学ぶことが目的である。なお、この講座では機械学習のソフトウェア的な原理を中心に説明しており、理論的・数学的な基礎はそれほど厳密には説明しない。使用環境は Python + PyTorch を使っているが、一度原理を理解してしまえば環境や使用言語が
nissax 2022/03/21
リンク
1

はてなブックマーク

タグ

ブックマーク / euske.github.io (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / euske.github.io (2)

(数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門

真面目なプログラマのためのディープラーニング入門

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス