deejayrokaのブックマーク - はてなブックマーク

LLM Revolutionizing Software Development: Validating Large-Scale Language Models in Integrated Development Environments (IDEs) Using a New Evaluation Harness

deejayroka 2024/04/18

リンク

Wavelet Diffusion: The fastest diffusion model

deejayroka 2024/04/17

リンク

Health-LLM: The Potential of Large-Scale Linguistic Models to Change the Future of Health Care

deejayroka 2024/03/10

リンク

Meta Achieves Unexpected Improvements in Bayesian Optimization

deejayroka 2024/02/27

リンク

プロンプトを高性能に最適化するPrompt Tuningとは？

3つの要点 ✔️ 凍結した汎用LLMのPrompt部分のみを学習するPrompt Tuningを提案 ✔️ Fine-tuningに近い精度を叩き出した ✔️ 大幅なパラメータ削減を可能にする The Power of Scale for Parameter-Efficient Prompt Tuning written by Brian Lester, Rami Al-Rfou, Noah Constant (Submitted on 18 Apr 2021 (v1), last revised 2 Sep 2021 (this version, v2)) Comments: Accepted to EM NLP 2021 Subjects: Computation and Language (cs.CL) code：本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれ

deejayroka 2024/01/22

“Promptに当たる入力テキストに対して、パラメータ調節可能なPrompt（Soft Prompt）が追加されているのが分かります。これは、学習ベクトルとして与えられます”

リンク

AIエージェント同士を議論させる評価フレームワーク、ChatEvalが登場！

3つの要点 ✔️ 複数のエージェントを自律的に議論させ評価を行うマルチエージェントフレームワークであるChatEvalを提案 ✔️ Debater Agents同士のグループディスカッションにより、人間のアノテーターに近い評価が可能に ✔️ 評価プロセスにおける多様な役割を持つアノテーターの必要性を実証 ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate written by Chi-Min Chan, Weize Chen, Yusheng Su, Jianxuan Yu, Wei Xue, Shanghang Zhang, Jie Fu, Zhiyuan Liu (Submitted on 14 Aug 2023) Comments: Published on arxiv. Subjects:

deejayroka 2023/10/18

リンク

動画から視聴者の行動を予測することを可能にしたマルチモーダルモデルが登場！

3つの要点 ✔️ コンテンツとそれに対応する受け手の行動から構成されたデータセットであるThe Content Behavior Corpus(CBC)を作成 ✔️ behavior tokensを用いて学習を行う大規模マルチモーダルモデルであるLarge Content and Behavior Models(LCBM) を提案 ✔️ 様々なタスクにおいて、GPT-3.5・GPT-4と同等以上の性能を発揮した Large Content And Behavior Models To Understand, Simulate, And Optimize Content And Behavior written by Ashmit Khandelwal, Aditya Agrawal, Aanisha Bhattacharyya, Yaman K Singla, Somesh Singh,

deejayroka 2023/10/05

“これまでLLMの学習用データの前処理時に除去されてきた受け手の行動であるbehavior tokensを学習に用いることがコンテンツシミュレーションと行動のシミュレーションの推論に有効”

リンク

経験から自律的に学習を行うLLMエージェント、ExpeLが登場！

3つの要点 ✔️ トレーニングタスクから自律的に学習する新しいLLMエージェントであるExpeLを提案 ✔️ Experience GatheringとInsights Extractionの2つのモジュールによりエージェントが経験から自律的に学習を実行 ✔️ タスクの経験を蓄積し自律的な学習を行うことにより、比較実験において既存手法を上回る性能を発揮 ExpeL: LLM Agents Are Experiential Learners written by Andrew Zhao, Daniel Huang, Quentin Xu, Matthieu Lin, Yong-Jin Liu, Gao Huang (Submitted on 20 Aug 2023) Comments: Published on arxiv. Subjects: Machine Learning (cs.LG

deejayroka 2023/10/05

“Reflextionのような自己改善手法はタスク内の改善を促進しますが、ExpeLはタスク間の学習を可能にするため、特定のドメインに依存しないせず、既存研究にはない汎用性を獲得しています”

AI

リンク

BILCO for accurate and fast alignment of time deviations between time series data series

deejayroka 2023/04/24

リンク

時系列予測に深層学習モデルが本当に必要？

3つの要点 ✔️ 時系列予測の領域で、最近深層学習モデルによる性能向上が急速に進んでいます。しかし、古典的な機械学習モデルはもう必要ないのかということで、この大規模な調査と比較実験が行われました。 ✔️ 古典的学習モデルの代表としてGBRTが使われています。深層学習モデルが実現した系列間の依存性の表現を入力の特徴量エンジニアリングベースのウィンドウ化で代替しました。 ✔️ 前処理により、改良GBRTは単変量、多変量両方のデータセットに対して、数多くの深層学習モデルと同等あるいは大きく上回る性能を示しました。 Do We Really Need Deep Learning Models for Time Series Forecasting? written by Shereen Elsayed, Daniela Thyssens, Ahmed Rashed, Hadi Samer Joma

deejayroka 2022/10/06

リンク

マルチモーダル・エンドツーエンド・トランスフォーマー

3つの要点 ✔️ ViTベースのVLPモデルをエンドツーエンドで学習する方法を検討するためのフレームワーク ✔️ モデル設計を四つの要素に分解して検討 ✔️ 4M枚の画像による事前学習で最先端モデルに匹敵する性能を達成 An Empirical Study of Training End-to-End Vision-and-Language Transf ormers written by Zi-Yi Dou, Yichong Xu, Zhe Gan, Jianfeng Wang, Shuohang Wang, Lijuan Wang, Chenguang Zhu, Pengchuan Zhang, Lu Yuan, Nanyun Peng, Zicheng Liu, Michael Zeng (Submitted on 3 Nov 2021 (v1), last revised 18 Ma

deejayroka 2022/09/27

“TransformerベースのVLPモデルをエンドツーエンドで事前学習させる方法を調査”

AI

リンク

時系列トランスフォーマーレビュー

3つの要点 ✔️ 近年発表され始めた時系列データ用Transf ormerの包括的レビュー ✔️ ネットワーク構造と、アプリケーション（予測、異状検知、分類）の両面から分類され、Transf ormerの強みや限界がレビューされています。 ✔️ 将来の展開として、事前学習、GNN、NASとの組み合わせについて解説されています。 Transf ormers in Time Series: A Survey written by Qingsong Wen, Tian Zhou, Chaoli Zhang, Weiqi Chen, Ziqing Ma, Junchi Yan, Liang Sun (Submitted on 15 Feb 2022 (v1), last revised 7 Mar 2022 (this version, v3)) Comments: Published on arxiv

deejayroka 2022/09/26

リンク

ImageNet事前学習モデルのプルーニングは下流タスクでどのように機能するか？

3つの要点 ✔️ プルーニングを行ったImageNet事前学習済みモデルの転移学習性能を調査 ✔️ 漸進的スパース化・正則化・LTHなどのプルーニング手法について分析 ✔️ 様々なPruning手法が転移学習時に異なる挙動を示すことを実証 How Well Do Sparse Imagenet Models Transfer? written by Eugenia Iofinova, Alexandra Peste, Mark Kurtz, Dan Alistarh (Submitted on 26 Nov 2021 (v1), last revised 21 Apr 2022 (this version, v5)) Comments: CVPR2022. Subjects: Computer Vision and Pattern Recognition (cs.CV); Artifici

deejayroka 2022/09/12

“プルーニング手法によりImageNet事前学習済みモデルのスパース化を行ったときの転移学習性能について広範な分析を行った結果、ImageNet分類精度が同等でも、下流タスクや学習設定によって異なる性能が得られることが示

AI

リンク

自己教師あり対照学習が成功するために必要なデータセットの条件とは？

3つの要点 ✔️ 4つの大規模画像データセットで自己教師あり対照学習について分析 ✔️ データ量、データドメイン、データの質、タスク粒度の観点からデータセットの影響を調査 ✔️ 自己教師あり学習が成功するための好ましいデータセット条件についての知見を示す When Does Contrastive Visual Representation Learning Work? written by Elijah Cole, Xuan Yang, Kimberly Wilber, Oisin Mac Aodha, Serge Belongie (Submitted on 12 May 2021 (v1), last revised 4 Apr 2022 (this version, v2)) Comments: CVPR 2022 Subjects: Computer Vision and Pa

deejayroka 2022/09/05

“事前学習時のデータ量、データセットのドメイン、データの質、タスクの粒度などが自己教師あり対照学習SimCLRにもたらす影響について調査”

AI

リンク

ImageNetの学習で得た頑健性は転移学習で下流タスクに活かせるか？

3つの要点 ✔️ アーキテクチャの違いは頑健性の転移に関係している ✔️ 全層を再学習させる条件下ではTransf ormerアーキテクチャは、データ拡張を用いたCNNよりも効果的である ✔️ 物体検出やセマンティックセグメンテーションよりも、画像分類に対するImageNetからの転移が困難である Does Robustness on ImageNet Transfer to Downstream Tasks? written by Yutaro Yamada, Mayu Otani (Submitted on 8 Apr 2022) Comments: CVPR 2022 Subjects: Computer Vision and Pattern Recognition (cs.CV) code：本記事で使用している画像は論文中のもの、紹介スライドのもの、またはそれを参考に作成したものを

deejayroka 2022/09/02

“精度がクリーンな画像に対する精度と比べ、どの程度低下するかを計算することによって、ImageNet分類モデルのノイズに対する頑健性を測定しました。”

AI
ai

リンク

DayDreamer: Dreamerがついに実ロボットに！

3つの要点 ✔️ Dreamerが実世界の４つのロボットに対して学習することが出来ることを示した ✔️ 4足歩行ロボットを１時間程度で背中を地面に向けた状態から回転して立ち上がり、前進する事を可能にした ✔️ 画像を入力としてロボットが物体を掴み、そして別の場所に置くことを、sparse rewardを用いて学習することができた DayDreamer: World Models for Physical Robot Learning written by Philipp Wu, Alejandro Escontrela, Danijar Hafner, Ken Goldberg, Pieter Abbeel (Submitted on 28 Jun 2022) Comments: Published on arxiv. Subjects: Robotics (cs.RO); Artific

deejayroka 2022/08/28

“本研究では、data collectionとモデルの更新、つまりworld model、actor、そしてcriticの更新を分離し、一つのスレッドではactorがデータを集め続け、それと同時に別のスレッドでモデルの更新を行うことで、より効率的な学習を行

ai
AI

リンク

不正確な擬ラベルを用いた半教師ありセグメンテーション

3つの要点 ✔️ 不正確な擬ラベルを学習に用いる、新しい半教師ありセグメンテーション手法である$U^2PL$を開発した。 ✔️ 擬ラベルをエントロピーによって正確と不正確に分類し、不正確ラベルを各クラスの負サンプルのキューとして用いた。 ✔️ 様々なベンチマーク実験において、本論文手法はSOTAを記録した。 Semi-Supervised Semantic Segmentation Using Unreliable Pseudo-Labels written by Yuchao Wang, Haochen Wang, Yujun Shen, Jingjing Fei, Wei Li, Guoqiang Jin, Liwei Wu, Rui Zhao, Xinyi Le (Submitted on 8 Mar 2022 (v1), last revised 14 Mar 2022 (this