masadreamのブックマーク - はてなブックマーク

テキスト・音声・視覚からマルチモーダルに感情を認識: Sonyが提案したM2FNet！

3つの要点 ✔️ テキスト・音声・動画の特徴を活用した感情認識で高精度を達成！ ✔️ Transf ormerにより発話間の関係を、Multi-Head Attentionによりモダリティ間の関係を学習！ ✔️ 動画特徴では"表情"だけでなく"シーン全体"のコンテクストを利用する必要性を示した M2FNet: Multi-modal Fusion Network for Emotion Recognition in Conversation written by Vishal Chudasama, Purbayan Kar, Ashish Gudmalwar, Nirmesh Shah, Pankaj Wasnik, Naoyuki Onoe (Submitted on 5 Jun 2022) Comments: Accepted for publication in the 5th Mul

masadream 2023/01/30

*ai_ml
*tech

リンク

時系列異状検知にもTransformer

3つの要点 ✔️ いよいよ多変量時系列異状検知にもTransf ormerが現れました ✔️ グラフも含めた深層学習により多変量の時系列の表現力は向上してきましたが、まだ単一時点に限ります ✔️ Transf ormerのグローバルおよび長期の連関に対しての表現力を活かして、改造したAnomaly-Attentionを含む2分岐の構造で従来のSOTAを超える性能を確認しています Anomaly Transf ormer: Time Series Anomaly Detection with Association Discrepancy written by Jiehui Xu, Haixu Wu, Jianmin Wang, Mingsheng Long (Submitted on 6 Oct 2021 (v1), last revised 13 Feb 2022 (this version,

masadream 2022/04/22

*tech
*ai_ml

リンク

ついに出た！本当にDETR！物体検出の革新的なパラダイム

3つの要点 ✔️ ついにTransf ormerを物体検出に応用 ✔️ End-to-endなモデルを実現し、人手による設計を削減 ✔️ 物体検出を直接的な集合予測問題として再定義 End-to-End Object Detection with Transf ormers written by Nicolas Carion, Francisco Massa, Gabriel Synnaeve, Nicolas Usunier, Alexander Kirillov, Sergey Zagoruyko (Submitted on 26 May 2020 (v1), last revised 28 May 2020 (this version, v3)) Comments: Published by arXiv Subjects: Computer Vision and Pattern Reco

masadream 2020/06/15

リンク

Googleが開発！機械学習アルゴリズムを進化的検索で全自動生成する AutoML-Zero

3つの要点 ✔️ AutoML-Zeroは基本的な数学演算の操作だけで、完全な機械学習アルゴリズムを自動的に発見 ✔️ Back Propagationで学習するニューラルネットワークすら発見 ✔️ 人間の先入観に捉われない新たな解法の創造に期待が持てます。 AutoML-Zero: Evolving Machine Learning Algorithms From Scratch written by Esteban Real, Chen Liang, David R. So, Quoc V. Le (Submitted on 6 Mar 2020) Comments: accepted by arXiv Subjects: Machine Learning (cs.LG); Neural and Evolutionary Computing (cs.NE); Machine Learn

masadream 2020/04/05

リンク

パラメータ数を激減させる新しい畳み込み「MixConv」解説！

３つの要点その１パラメータ数を激減させる新しい畳み込みMixConvを提案その２ MixConv層を含んだモデルをAIに自動生成(=NAS)させることでMixNetを開発その３ MixNetはMobileNet-V3やMnas Netなどの小型画像認識モデルのみならずResNet-153に対してはパラメータ数1/9程度で性能を凌いだ MixConv: Mixed Depthwise Convolutional Kernels written by Mingxing Tan, Quoc V. Le (Submitted on 22 Jul 2019 (v1), last revised 1 Dec 2019 (this version, v3)) Journal reference: BMVC 2019 Subjects: Computer Vision and Pattern

masadream 2020/02/11

リンク

カメラにシールを貼るだけでディープラーニングを誤認識させる攻撃方法が登場

3つの要点 ✔️カメラにシールを貼るだけでディープラーニングを誤認識させることが可能になった ✔️対象物を異なる角度や距離で撮影しても誤認識させられることを動画データで検証 ✔️顔認証用のカメラにシールを貼っておくことでシステムに気づかれずに他人になりすましたりできてしまうかもしれないディープラーニングによる画像分類は高い性能を誇りますが、画像に摂動を加えるだけで、人間の目ではほぼ違いがないのにディープラーニングが他のカテゴリであると誤認識してしまう adversarial attack という攻撃方法が知られています。この adversarial attack にどのように対応するかは、実世界でディープラーニングを含んだシステムを運用していく上で重要になるだけでなく、人間の認識とディープラーニングによる認識の違いを理解するのにも重要であり、一つの大きな研究テーマにもなっています。こ

masadream 2019/11/02

リンク

はてなブックマーク

タグ

ブックマーク / ai-scholar.tech (6)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス