xiangzeのブックマーク / 2023年8月23日

xiangze id:xiangze

2023年8月23日のブックマーク (5件)

Boosting image generation by intersecting GANs with Diffusion models
xiangze 2023/08/23
機械学習

gan

拡散モデル
リンク
拡散確率モデル (1) スコアマッチング – Transformers, Diffusers | ClassCat® Chatbot
拡散確率モデル (1) スコアマッチングこのノートブックは拡散確率モデルに基づく新しいクラスの生成モデルを調べます [1]。このクラスのモデルは熱力学からの考察にインスパイアされていますが [2]、ノイズ除去スコアマッチング [3]、ランジュバン動力学と自己回帰デコーディングへの強い類似性もまた持っています。ノイズ除去拡散暗黙モデル [4] のより最近の開発についても考察します、これはサンプリングを高速化するためにマルコフ連鎖の必要性を迂回します。このワークに由来し、wavegrad モデル [5] についても考察します、これは同じコア原理に基づきますが、音声データのためにこのクラスのモデルを適用しています。拡散モデルの内部動作を完全に理解するため、関連トピックの総てをレビューします。そのため、説明を 4 つの詳細なノートブックに分割します。スコアマッチングとランジュバン動力学。拡
xiangze 2023/08/23
リンク
「わたしの話」を体系的に覚えてもらいながらLLMと会話する技術MemoChat登場 | AIDB
人々の日常生活におけるコミュニケーションの形態が多岐にわたる中、人工知能（AI）との対話も一般的になりつつあります。スマートフォンのアシスタントからカスタマーサポートのチャットボットまで、AIとの会話は私たちの生活の一部となっています。しかし、大規模言語モデル（LLM）のチャットボットでさえも、人間と同じように長い会話を維持するのは容易ではありません。特に、会話が長くなると、一貫性のある応答を返すことが難しくなることが多いのです。そこで、この記事では、最新の研究「MemoChat: Tuning LLMs to Use Memos for Consistent Long-Range Open-Domain Conversation」に焦点を当てます。この研究では、LLMが長い会話でも一貫性を保ち、人間のような対話を提供できるようにするための新しい方法が提案されています。この記事を通し
xiangze 2023/08/23
リンク
GitHub - chengwei0427/hm-lio: A Hash-map based Lidar-Inertial Odometry (A simple reproduction of fastlio 1.0 with Hash-map).
xiangze 2023/08/23
リンク
1790億パラメーターに挑戦…情通機構「大規模言語モデル」日本語を猛特訓！ニュースイッチ by 日刊工業新聞社
情報通信研究機構（ＮＩＣＴ）が１７９０億パラメーターの大規模言語モデル（ＬＬＭ）の開発を進めている。高品質な日本語データを学習させており、日本社会の常識を備えたモデルになると期待される。ＮＩＣＴが学習データを保有しているため、データとモデルの両面から誤情報生成の対策を検証できる。これは日本が人工知能（ＡＩ）を使いこなし、リスクに対応していく知見になる。ＮＩＣＴは産学官に成果を提供する。「学習途中だが、出来はいまいち。この苦労がＬＬＭ開発の基礎になる」―。ＮＩＣＴの鳥澤健太郎フェローは開発中のＬＬＭの手応えをこう説明する。７月に４００億パラメーターのＬＬＭを発表し、現在は１７９０億パラメーターのＬＬＭを開発中だ。巨大なＡＩモデルの学習はリスクが高い。学習の途中で計算が破綻することがたびたび起こるのだ。そこで破綻を防ぎつつ精度の高い計算を限られたメモリーで実行することがノウハウになる。例
xiangze 2023/08/23
LLM
リンク
- 2023年8月26日
- 2023年8月23日
- 2023年8月22日