gengohouseのブックマーク / 2023年1月24日 - はてなブックマーク

gengohouse id:gengohouse

2023年1月24日のブックマーク (3件)

【PyTorch】GPTをPrompt-tuningしてみた | 株式会社AI Shift
こんにちは．AIチームの二宮です．本記事では，最近話題のPrompt-tuningのご紹介と，実装・実験・分析を行ってみました．はじめに近年，言語モデルの大規模化が著しいです．例えば，huggingfaceで公開されている日本語版のいくつかの言語生成モデルGPTのパラメタ数は以下になります． (M: million, B: billion) rinna/japanese-gpt2-xsmall: 37M rinna/japanese-gpt2-medium: 336M rinna/japanese-gpt-1b: 1.3B abeja/gpt-neox-japanese-2.7b：2.7B naclbit/gpt-j-japanese-6.8b：6.8B BERT-baseが約110M，BERT-largeが約340Mであることを考えると，非常に大規模であることを実感しますね．最近話
gengohouse 2023/01/24
“【PyTorch】GPTをPrompt-tuningしてみた”
リンク
日本語ビジネスニュースコーパスを学習したBART事前学習済モデルの紹介
日本語ビジネスニュースコーパスを学習したBART事前学習済モデルを紹介します。
gengohouse 2023/01/24
リンク
Transformerアーキテクチャと自然言語処理の発展
1. はじめにはじめまして、この投稿がZennの初投稿となります。初学者ゆえ至らない点や、不適切な表現があるとは思いますが都度ご指摘していただけると幸いです。この記事についてですが、先月から自然言語処理を今のトレンドであるTransf ormerを主軸に勉強し始めており、インプットだけでなくアウトプットのためZennを書こうと思ったのがきっかけです。 (同様にQiitaにてベイズに関するアウトプットも行なっています。) また、参考資料については下にも書いてはいますが「Transf ormerによる自然言語処理」をメインにしています。といってもこの本は誤翻訳がひどいので自分で調べながらやる必要があり、二度手間になるかもです。ただ内容としては初学者の自分でも理解でき、GitHubに公開されているJupiter Notebookと同時に進めれば誤翻訳もまあ修正できると感じたので個人的には良い
gengohouse 2023/01/24
リンク
- 2023年1月25日
- 2023年1月24日
- 2023年1月23日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx