タグ

ブックマーク / ai-scholar.tech (7)

  • 複数のペルソナを割り当てることでLLMの優れた問題解決能力を引き出すアプローチが登場!

    3つの要点 ✔️ 複数のペルソナによるフィードバックを繰り返す事でLLMの多様な専門知識を引き出すアプローチであるSolo Performance Prompting(SPP)を提案 ✔️ 複数の詳細なペルソナを割り当てることでLLMの優れた問題解決能力が引き出されることを発見 ✔️ Chain-of-Thought Promptingとの比較実験により、SPPの有効性を実証 Unleashing Cognitive Synergy in Large Language Models: A Task-Solving Agent through Multi-Persona Self-Collaboration written by Zhenhailong Wang, Shaoguang Mao, Wenshan Wu, Tao Ge, Furu Wei, Heng Ji (Submitted

    複数のペルソナを割り当てることでLLMの優れた問題解決能力を引き出すアプローチが登場!
  • 世界で戦ってきたリサーチエンジニアから学ぼう

    AIが遅れていると言われています。確かに進んでいるとは言えませんが、ではどう遅れているのか?なぜ遅れているのか?どこが遅れているのか?明確にはわかりません。でも今後AIをどんどん活用し、世界と戦おうとしていくのであれば、世界で戦ってきた人に聞くのがいいのではないでしょうか? 今回は世界全体にAIという言葉を大きく印象付けた囲碁AIAlphaGo」を生み出したことでも有名なGoogle DeepMindにてリサーチエンジニアとして働き、現在日SDGsを達成するためのAI開発支援に焦点を当てた株式会社Recursiveを設立しているTiago Ramalho(ティアゴ・ラマル)さんにAI開発の雰囲気からプロジェクト周りのお話をお聞きしました。 企業紹介 株式会社Recursiveは、AI技術とビジネスアイデアを通してSDGsの達成を目的とした2020年8月創業のスタートアップです。

    世界で戦ってきたリサーチエンジニアから学ぼう
  • 論文を読むこととは、cvpaper.challengeが見据える先は

    今回CVPR2020の論文読破でもインタビューさせていただきましたcvpaper.challengeの代表である片岡裕雄(かたおかひろかつ)様にcvpaper.challengeの目的や活動内容、AI論文についてお話をお聞きしました。日でも組織としては日トップの論文情報が集まるcvpaper.challengeを見ていきましょう。ご経歴については以下の通りです。 ・名前 片岡裕雄(かたおかひろかつ) ・所属 国立研究開発法人 産業技術総合研究所 人工知能研究センター 主任研究員、cvpaper.challenge 主宰 ・経歴 2014年 慶應義塾大学大学院理工学研究科修了、博士(工学) 2011年 カリフォルニア大学リバーサイド校 Visiting Scholar 2013、2014年 ミュンヘン工科大学 Visiting Scientist 2014年 東京大学JSPS特別研究員(

    論文を読むこととは、cvpaper.challengeが見据える先は
  • TimeSformer:3DCNNを超えて動画像を捉えるTransformer

    3つの要点 ✔️ 動画像のための時空間Self-Attentionを4種考案した. ✔️ 3DCNNモデルと比較して,学習速度が速く,テスト効率が向上した. ✔️ 3DCNNモデルでは数秒の動画しか処理できなかったが,数分の長い動画に適用することも可能になった. Is Space-Time Attention All You Need for Video Understanding? written by Gedas Bertasius, Heng Wang, Lorenzo Torresani (Submitted on 9 Feb 2021 (v1), last revised 9 Jun 2021 (this version, v4)) Comments: Accepted to ICML 2021 Subjects: Computer Vision and Pattern Reco

    TimeSformer:3DCNNを超えて動画像を捉えるTransformer
  • 畳み込みニューラルネットワークは形状のグローバル情報に対して鈍感であることが判明

    UCLA認知心理学のチームは、CNNが物体を識別する方法は人間の視覚プロセスとは大きく異なるという興味深い研究を発表しています。論文では、CNNは局所的な特徴にはアクセスしている一方で、全体的形状に敏感ではない(グローバルオブジェクトの形状に基づいて分類されない)ことが示されています。 【参照】:Deep convolutional networks do not classify based on global object shape 画像認識タスクにおける形状情報の役割 畳み込みニューラルネットワーク(Convolutional Neural Network, 通称CNN)は、視覚野の特徴抽出の仕組みをモデル化したもので、画像解析において高い性能を発揮してきました。CNNは、何層にもわたって積み上げられたネットワークから構成されており、人間の手を介さずネットワークの学習を通して画像特

    畳み込みニューラルネットワークは形状のグローバル情報に対して鈍感であることが判明
  • 知識蒸留で効果的な教師の条件とは?

    3つの要点 ✔️ 知識蒸留を成功させる効果的な方法について検討 ✔️ 一貫した(consistent)・忍耐強い(patient)教師が重要であることを特定 ✔️ ResNet-50モデルでImageNet 82.8%のTop-1精度を達成 Knowledge distillation: A good teacher is patient and consistent written by Lucas Beyer, Xiaohua Zhai, Amélie Royer, Larisa Markeeva, Rohan Anil, Alexander Kolesnikov (Submitted on 9 Jun 2021 (v1), last revised 21 Jun 2022 (this version, v2)) Comments: CVPR2022. Subjects: Comput

    知識蒸留で効果的な教師の条件とは?
  • 動画認識専用の時空間DataAugmentation!

    3つの要点 ✔️ 画像認識で用いられているDataAugmentationを動画認識に拡張 ✔️ RandAugmentやCutmixを時間方向に拡張 ✔️ 1st Visual Inductive Priors (1stVIPriors)等の少ないデータセットのタスクでSoTAと競合する結果 Learning Temporally Invariant and Localizable Features via Data Augmentation for Video Recognition written by Taeoh Kim, Hyeongmin Lee, MyeongAh Cho, Ho Seong Lee, Dong Heon Cho, Sangyoun Lee (Submitted on 13 Aug 2020) Comments: European Conference on

    動画認識専用の時空間DataAugmentation!
  • 1