yuisekiのブックマーク - はてなブックマーク

(数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門
(数式を使わない) Transf ormer の直感的な説明 RNN の欠点 Transf ormer はこれをどう解決したか Transf ormer の動作原理複数の要素間の関係を考慮する (Self-Attention、自己注意) 要素の順序を考慮する (Positional Encoding、位置エンコーディング) まとめ概要: ChatGPT などで使われている Transf ormer モデルは、ニューラルネットワークの世界にいくつかの革新的なアイデアをもたらした。本記事では、プログラマに理解しやすい形でそれらのアイデアを解説する。実際に使われている数学の詳細には触れない。 (技術的解説については元論文 Attention is All You Need か、その注釈版である The Annotated Transf ormer を参照のこと。日本語ではこの解説がわかり
yuiseki 2023/03/05
あとで読む
リンク
おわりに - なぜ機械学習はうさん臭く感じられるのか? / 真面目なプログラマのためのディープラーニング入門
本講座では計8回にわたり、ディープニューラルネットワークの原理と実装について説明してきた。ニューラルネットワークの原理は基本的には勾配降下法であり、その基盤となっているのが関数の微分可能性である。ニューラルネットワークにはさまざまな形態が存在するが、画像処理・画像認識の場合は畳み込みニューラルネットワークが非常に有効であることがわかっている。また、ニューラルネットワークの出力形式や損失関数を変えることにより、ニューラルネットワークが物体検出や奥行き推定など、さまざまなタスクに利用可能であることを紹介した。さて、本講座は「真面目なプログラマのための」ディープラーニング入門、と銘打っている。真面目なプログラマとは何か? 諸説いろいろあるだろうが、多くのプログラマは、ソフトウェア開発において仕様の明確さや、システムの効率・堅牢性、そして保守のしやすさといったものを追求
yuiseki 2022/03/27
あとで読む
リンク
真面目なプログラマのためのディープラーニング入門
はじめに: 本講座は「機械学習ってなんか面倒くさそう」と感じているプログラマのためのものである。本講座では「そもそも機械が『学習する』とはどういうことか?」「なぜニューラルネットワークで学習できるのか?」といった根本的な疑問に答えることから始める。そのうえで「ニューラルネットワークでどのようなことが学習できるのか?」という疑問に対する具体例として、物体認識や奥行き認識などの問題を扱う。最終的には、機械学習のブラックボックス性を解消し、所詮はニューラルネットワークもただのソフトウェアであり、固有の長所と短所をもっていることを学ぶことが目的である。なお、この講座では機械学習のソフトウェア的な原理を中心に説明しており、理論的・数学的な基礎はそれほど厳密には説明しない。使用環境は Python + PyTorch を使っているが、一度原理を理解してしまえば環境や使用言語が
yuiseki 2022/03/23
あとで読む
リンク
真面目なプログラマのためのディープラーニング入門
はじめに: 本講座は「機械学習ってなんか面倒くさそう」と感じているプログラマのためのものである。本講座では「そもそも機械が『学習する』とはどういうことか?」「なぜニューラルネットワークで学習できるのか?」といった根本的な疑問に答えることから始める。そのうえで「ニューラルネットワークでどのようなことが学習できるのか?」という疑問に対する具体例として、物体認識や奥行き認識などの問題を扱う。最終的には、機械学習のブラックボックス性を解消し、所詮はニューラルネットワークもただのソフトウェアであり、固有の長所と短所をもっていることを学ぶことが目的である。なお、この講座では機械学習のソフトウェア的な原理を中心に説明しており、理論的・数学的な基礎はそれほど厳密には説明しない。使用環境は Python + PyTorch を使っているが、一度原理を理解してしまえば環境や使用言語が
yuiseki 2022/03/21
あとで読む
リンク
1

はてなブックマーク

タグ

ブックマーク / euske.github.io (4)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / euske.github.io (4)

(数式を使わない) Transformer の直感的な説明 / 真面目なプログラマのためのディープラーニング入門

おわりに - なぜ機械学習はうさん臭く感じられるのか? / 真面目なプログラマのためのディープラーニング入門

真面目なプログラマのためのディープラーニング入門

真面目なプログラマのためのディープラーニング入門

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス