iteのブックマーク - はてなブックマーク

(数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門
(数式を使わない) Transf ormer の直感的な説明 RNN の欠点 Transf ormer はこれをどう解決したか Transf ormer の動作原理複数の要素間の関係を考慮する (Self-Attention、自己注意) 要素の順序を考慮する (Positional Encoding、位置エンコーディング) まとめ概要: ChatGPT などで使われている Transf ormer モデルは、ニューラルネットワークの世界にいくつかの革新的なアイデアをもたらした。本記事では、プログラマに理解しやすい形でそれらのアイデアを解説する。実際に使われている数学の詳細には触れない。 (技術的解説については元論文 Attention is All You Need か、その注釈版である The Annotated Transf ormer を参照のこと。日本語ではこの解説がわかり
ite 2023/04/16
ChatGPT

ai

programming

transformer

あとで読む
リンク
おわりに - なぜ機械学習はうさん臭く感じられるのか? / 真面目なプログラマのためのディープラーニング入門
本講座では計8回にわたり、ディープニューラルネットワークの原理と実装について説明してきた。ニューラルネットワークの原理は基本的には勾配降下法であり、その基盤となっているのが関数の微分可能性である。ニューラルネットワークにはさまざまな形態が存在するが、画像処理・画像認識の場合は畳み込みニューラルネットワークが非常に有効であることがわかっている。また、ニューラルネットワークの出力形式や損失関数を変えることにより、ニューラルネットワークが物体検出や奥行き推定など、さまざまなタスクに利用可能であることを紹介した。さて、本講座は「真面目なプログラマのための」ディープラーニング入門、と銘打っている。真面目なプログラマとは何か? 諸説いろいろあるだろうが、多くのプログラマは、ソフトウェア開発において仕様の明確さや、システムの効率・堅牢性、そして保守のしやすさといったものを追求
ite 2022/03/22
「ニューラルネットワークは上記のように不確定な要素が多く、できれば使わないに越したことはない」これに尽きる。通常のアルゴリズムで処理が可能なら、機械学習を使うべきではない。必要な所で最小限使う物。
リンク
1

はてなブックマーク

タグ

ブックマーク / euske.github.io (2)

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第2週）

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / euske.github.io (2)

(数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門

おわりに - なぜ機械学習はうさん臭く感じられるのか? / 真面目なプログラマのためのディープラーニング入門

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第2週）

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス