[B! RNN][rnn] petite_blueのブックマーク

petite_blue id:petite_blue

RNNとrnnに関するpetite_blueのブックマーク (14)

GitHub - BlinkDL/RWKV-LM: RWKV is an RNN with transformer-level LLM performance. It can be directly trained like a GPT (parallelizable). So it's combining the best of RNN and transformer - great performance, fast inference, saves VRAM, fast training, "inf
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
petite_blue 2023/03/27
rnn

lmm

rwkv
リンク
完全フリーで3GBのVRAMでも超高速に動く14B大規模言語モデルRWKVを試す｜shi3z
Transf ormerは分散できる代償として計算量が爆発的に多いという不利がある。一度みんなが忘れていたリカレントニューラルネットワーク(RNN)もボケーっとしている場合ではなかった。なんと、GPT3並の性能を持つ、しかも完全にオープンな大規模言語モデルが公開されていた。そのなもRWKV(RuwaKuvと発音しろと書いてある。ルワクフ?) RWKVはRNNなのでGPUメモリをそれほど大量に必要としない。 3GBのVRAMでも動くという。時間がない方はビデオをご覧ください僕の失敗は、何も考えずにgit lfs installでディレクトリごとコピーしようとしたこと。このディレクトリには過去のモデルデータが全部あるので、ひとつ30GBのモデルデータを何十個もダウンロードしようとしていて終わらなかったのだ。モデルデータは一とつあれば十分なのでひとつだけにする。次に、chatのリポ
petite_blue 2023/03/27
rnn

lmm

rwkv
リンク
GitHub - BlinkDL/ChatRWKV: ChatRWKV is like ChatGPT but powered by RWKV (100% RNN) language model, and open source.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
petite_blue 2023/01/23
chatgpt

ai

deep learning

rnn
リンク
レトリバ勉強会資料：深層学習による自然言語処理２章
3. 本日の内容 • 発展的なニューラルネットワークの紹介 • 再帰ニューラルネット(RNN) • ゲート付き再帰ニューラルネット(LSTM・GRU) • 木構造再帰ニューラルネット(木構造RNN) • 畳み込みニューラルネット(CNN) © 2017 Retrieva, Inc. 3 4. 2.6 再帰ニューラルネット • 可変長の入力を扱うことに優れたネットワーク構造 • 前の時刻の隠れ状態ベクトルと現時刻の入力ベクトルを使って、現在の隠れ状態ベクトルを更新 • 任意の長さの入力履歴を考慮した出力を得ることができる • 状態変数の数を大きくすれば、原理的には前の入力をすべて考慮できる • 単語などを各時刻の入力とするとテキストは可変長の入力列となる。→RNNがテキスト処理に向いていそう。 © 2017 Retrieva, Inc. 4 5. 2.6.1 再帰ニューラルネットのモデ
petite_blue 2017/10/04
rnn

deep learning

nlp
リンク
Sentencepiece : ニューラル言語処理向けトークナイザ - Qiita
少し時間が経ってしまいましたが、Sentencepiceというニューラル言語処理向けのトークナイザ・脱トークナイザを公開しました。MeCabやKyTeaといった単語分割ソフトウエアとは趣旨や目的が異なるソフトウェアですので、少し丁寧にSentencepieceの背景、応用、実験結果等をお話したいと思います。サブワードニューラル言語処理の中心となる要素技術にLSTM (RNN)があります。テキスト(トークン列)を低次元のベクトルに符号化したり、ベクトルからテキストを復号化したり、その応用範囲は多岐にわたります。ニューラル機械翻訳 (NMT) は、LSTMによる符号化・復号化を組み合わせて翻訳を行います。 ↓↓↓↓↓↓↓ あなたの記事の内容 NMTのアーキテクチャは従来法と大きく異なりますが、入出力はこれまでと同様、なにかしらのトークン列です。どのような列でもよいのですが、慣習的に単語列が
petite_blue 2017/04/07
AI

機械学習

nlp

rnn
リンク
Neural Network Learns to Generate Voice (RNN/LSTM)
[VOLUME WARNING] This is what happens when you throw raw audio (which happens to be a cute voice) into a neural network and then tell it to spit out what it's learned. This is a recurrent neural network (LSTM type) with 3 layers of 680 neurons each, trying to find patterns in audio and reproduce them as well as it can. It's not a particularly big network considering the complexity and size of the
petite_blue 2017/03/29
rnn
リンク
教師なしRNNによる連続した不完全情報（主にテキスト）の補完 - にほんごのれんしゅう
教師なしRNNによる連続した不完全情報（主にテキスト）の補完背景 Google（や、過去の私のブログの投稿）などで低解像度の映像を高解像度化する方法は、GANを使うことでわりとうまくいきました。テキストにも同じような問題が適応できるのかって思うことがあります。RNNはすでに記述されている文字をヒントとして次の文字を予想することができます。その特性を利用して、情報が失われたテキストから復元を試みる例を示します。 (また、戦時中の戦艦に乗っていた搭乗員の劣化した手記から情報を復元したいという思いがあります。手記の海水に沈み腐敗が進んでいたり、筆記が乱れていて解析が困難であったりという点を補完できれば良いと思います。彼らの思い、可能な限り現代に蘇らせたいと思います。) 先行研究今回は見当たらない（ほんとに存在しないんだったら、論文出したい）手法 RNNで欠落した連続する情報を周辺の単語
petite_blue 2017/03/06
rnn

機械学習

deep learning
リンク
http://arxiv.org/pdf/1510.07211
petite_blue 2017/01/27
RNNによるプログラム自動生成

deep learning

RNN
リンク
New Neural Network Building Block Allows Faster and More Accurate Text Understanding
New Neural Network Building Block Allows Faster and More Accurate Text Understanding
petite_blue 2016/12/13
RNN

QRNN

deep learning

機械学習
リンク
http://arxiv.org/pdf/1611.01576v1
petite_blue 2016/12/13
RNN

QRNN

deep learning

機械学習
リンク
LSTMを超える期待の新星、QRNN - Qiita
RNN「これってもしかして」 CNN「わたしたちのモデルが・・・」「「入れ替わってる～～～！？」」というわけでQRNN、QUASI-RECURRENT NEURAL NETWORKSとは、RNNの機構をCNNで「疑似的(QUASI)に」実装するというモデルです。これにより、既存のRNN(というかLSTM)が抱えていたいくつかの問題の解決を試みています。元論文は以下となります。 QUASI-RECURRENT NEURAL NETWORKS 作者によるブログ作者の方のブログにChainerのサンプルコードがあったので、それを元にTensorFlowで実装してみました。早く動かしたい！という方はこちらを見てみてください。 icoxfog417/tensorflow_qrnn (Starを頂ければ励みになります m(_ _)m) 本記事では、この研究のモチベーションとそのアプローチについ
petite_blue 2016/12/13
rnn

LSTM

機械学習

qrnn

deep learning
リンク
新たなRNNと自然言語処理 - こんな夢を見た
先月のとある勉強会で使ったスライドを今更ながら貼ります。そこそこの「seq2seqやAttentionほどは脚光を浴びていない、RNNの基礎部分の改良や知見」を載せることを趣旨にしています。口頭のみでの説明も多かったり、読み込みが浅かったり、量重視だったりして、スライドの各説明は特に詳しくないです。まだまだ十分に検証されていないことや納得しきれない（論文著者の）言明も多々ありますので、読む際は、ふわふわと話半分に小耳に挟むくらいがちょうどいっか〜と思って読んでください。新たなRNNと自然言語処理 from hytae 需要と質はさておき英語版もあります。 Recent Progress in RNN and NLP from hytae
petite_blue 2016/07/30
NLP

機械学習

rnn

lstm
リンク
The Unreasonable Effectiveness of Recurrent Neural Networks
May 21, 2015 There’s something magical about Recurrent Neural Networks (RNNs). I still rem ember when I trained my first recurrent network for Image Captioning. Within a few dozen minutes of training my first baby model (with rather arbitrarily-chosen hyperparameters) started to generate very nice looking descriptions of images that were on the edge of making sense. Sometimes the ratio of how simpl
petite_blue 2015/11/01
deep learning

rnn

LSTM
リンク
GitHub - yusuketomoto/chainer-char-rnn: karpathy's char-rnn (https://github.com/karpathy/char-rnn) implementation by Chainer
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
petite_blue 2015/10/29
Chainer

RNN

deep learning
リンク
1