[B! LLM] moritataのブックマーク

moritata id:moritata

LLMに関するmoritataのブックマーク (3)

BitNetでMNISTを学習させて見えてきた性質｜shi3z
かれこれ一ヶ月弱くらいBit Netと格闘している。Bit Netは、Microsoftが発明したと主張している1-Bit(1.58ビットとも言われる)量子化ニューラルネットワークのことだ。僕はその辺に落ちてるコードを使って最初の最初はlossが2くらいまで下がったのだが、そもそもLLMはlossが1を切らないと実用性がない。それ以降は6とか良くて5とかなのでたまたま最初に試したのがうまく行ったようだ。しかしいつまで経っても良くならないのでBit Netの性質を根本的に見直す必要があるのでは?と思い、初心に帰って論理回路を学習させようとした。 Bit Netのコードベースははちさんのコードと、Microsoftの公式な論文の実装を併用した。まず試したのはこのようなコード from bit net import * import torch from torch import optim im
moritata 2024/03/25
学習

勉強

LLM
リンク
上司「オンプレでチャットAI作って」 - Qiita
PythonでRinna社が提供している対話LLM rinna/japanese-gpt-neox-3.6b-instruction-sft を動かすことで、ローカルで動作するChatGPTのような対話AIソフトを作成しました！筆者自身もLLMや自然言語AIに全く詳しくなく1、Pythonに触ったのも久々だったのですが、言語モデルを手元で動かすのは案外簡単(大嘘2)だったため、本記事ではその紹介をしたいと思います！ ↑アイキャッチのこれは成果物であるTauri製アプリです。内部でPython3によって前述のrinna言語モデルを動かすことで実現しています(後述)。リポジトリ: https://github.com/anotherhollow1125/rinna_gpt リリース: https://github.com/anotherhollow1125/rinna_gpt/releas
moritata 2023/06/22
ai

Qiita

github

python

インストール

install

LLM

ChatGPT
リンク
Understanding Large Language Models
Large language models have taken the public attention by storm – no pun intended. In just half a decade large language models – transf ormers – have almost completely changed the field of natural language processing. Moreover, they have also begun to revolutionize fields such as computer vision and computational biology. Since transf ormers have such a big impact on everyone’s research agenda, I wan
moritata 2023/06/05
学習

機械学習

LLM
リンク
1