BitNetでMNISTを学習させて見えてきた性質｜shi3z

テクノロジーカテゴリーの変更を依頼記事元:

note.com/shi3zblog

22 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

BitNetでMNISTを学習させて見えてきた性質｜shi3z

かれこれ一ヶ月弱くらいBit Netと格闘している。Bit Netは、Microsoftが発明したと主張している1-Bit(1.58... かれこれ一ヶ月弱くらいBit Netと格闘している。Bit Netは、Microsoftが発明したと主張している1-Bit(1.58ビットとも言われる)量子化ニューラルネットワークのことだ。僕はその辺に落ちてるコードを使って最初の最初はlossが2くらいまで下がったのだが、そもそもLLMはlossが1を切らないと実用性がない。それ以降は6とか良くて5とかなのでたまたま最初に試したのがうまく行ったようだ。しかしいつまで経っても良くならないのでBit Netの性質を根本的に見直す必要があるのでは?と思い、初心に帰って論理回路を学習させようとした。 Bit Netのコードベースははちさんのコードと、Microsoftの公式な論文の実装を併用した。まず試したのはこのようなコード from bit net import * import torch from torch import optim im

ブックマークしたユーザー

balaem2024/03/30
einherjar2024/03/30
Wacky2024/03/25
midas365452024/03/25
dambiyori2024/03/25
millfi2024/03/25
jack09092024/03/25
makopy_inside2024/03/25
moritata2024/03/25
R2M2024/03/25
tantan00ai2024/03/25
triceratoppo2024/03/24
fm3152024/03/24
urtz2024/03/24
ZAORIKU2024/03/24

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx