[B! Deep Learning][ai] petite_blueのブックマーク

petite_blue id:petite_blue

Deep Learningとaiに関するpetite_blueのブックマーク (53)

Online Label Smoothingの実装と評価 - Qiita
はじめに過学習防止効果があるとされるLabel Smoothingだが、これに改良を加えたというOnline Label Smoothingの論文を見つけたので、tf.kerasで実装して評価して見た。 Online Label Smoothingとはまず、Label Smoothingについて簡単に説明する。画像分類のタスクにおいては、正解のラベルとしてOne Hotのベクトルを使用する。これは正解のクラスに対応する値だけが1.0でその他は0.0となったもの。これは当然の様に思えるが、このまま学習させると「過学習を招く」、及び「モデルが自信を持ちすぎてしまう」といった問題があるとして、Inceptionモデルの論文で提案されたのが、Label Smoothingである。具体的には、学習時のラベルとして「正解のクラスの値は少し割り引いて、減らした値は全てのクラスに均等に分割して加
petite_blue 2023/03/05
ai

deep learning
リンク
Deep Learningにおける知識の蒸留 | Code Craft House
ここ数年のDeep Learningの発展は目覚ましく、急速に実用化が進んでいます。タスクによっては人間に匹敵する精度に達しているものもあり、システムの一部品としてデプロイする場面も増えてくると思います。そこで問題になるのが計算機資源の制約です。学習時には大量の学習データを用意し、GPUなどの計算資源で数時間や数日かかるような学習をしますが、推論時には限られたメモリや計算資源のもとで動作させる必要があります。リアルタイムに大量の入力データを捌く必要があったり、スマートフォンやエッジデバイスなどで動作させる場合には、この制約はさらに強くなります。深くて大きいモデルの方が精度が出るが、実用を考えると軽量なモデルにする必要がある。こういった場面で最近よく使われる手法として、知識の蒸留 (Knowledge Distillation) と呼ばれる方法があります。これは、（典型的には）大きくて複
petite_blue 2023/03/05
ai

deep learning
リンク
GitHub - BlinkDL/ChatRWKV: ChatRWKV is like ChatGPT but powered by RWKV (100% RNN) language model, and open source.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
petite_blue 2023/01/23
chatgpt

ai

deep learning

rnn
リンク
AI 激動の年！2022年の人工知能10大トレンドと必読論文
petite_blue 2023/01/03
ai

deep learning

論文
リンク
コンピュータビジョン分野のトップカンファレンスであるECCV2022からワークショップの模様を紹介（前編） - NTT Communications Engineers' Blog
目次目次はじめに ECCV2022概要 Workshop Instance-Level Recognition Workshop Keynote talk: Image Search and Matching Kaggle Google Universal Image Embedding Challenge Keynote talk: Few-Shot Learning for Object Aware Visual Recognition Language Assisted Product Search Granularity aware Adaptation for Image Retrieval over Multiple Tasks Where in the World is this Image? Transf ormer-based Geo-localization in t
petite_blue 2022/12/10
ai

deep learning

cv

画像認識

画像検索
リンク
OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
こんちには。データアナリティクス事業本部機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。個人的には、いくら認識が凄いって言っても、実際日本語は微妙なんじゃないかな…？と思っていたのですが… ですが… … … … おお！？(上記はGitHubにあるWER: Word Error Rateのグラフです) これは！？これは結構良さげな数値を出している！？(たぶん) ってことで元音声屋さんとしては、これは試すしかない！ということで動かしてみました！(投稿は翌日になってしまいましたが…) なお、本記事では論文内容の詳細などには触れませんのでご了承ください。(後日できたらがんばります) いますぐ使いたい人向け今すぐ使いたい方は、Hugging Faceでブラウザから書き起こしを試
petite_blue 2022/09/24
AI

deep learning
リンク
言語処理のニューラルネットワークモデルが脳の働きと同じ構造をしているという仮説
脳がどのように時間を把握するのかという研究や選択的に恐怖やトラウマなどの記憶を消去する実験など、「脳がどのように機能して、脳のどこで何をするのか？」という疑問は依然として不明な点が多くなっています。そのような脳の働きについて、言語処理の深層学習モデルであるTransf ormerが、脳の機能を追跡する類似モデルとして役に立つことが示されました。 Quanta Magazine https://www.quantamagazine.org/how-ai-transf ormers-mimic-parts-of-the-brain-20220912/ Relating transf ormers to models and neural representations of the hippocampal formation | OpenReview https://openreview.net/f
petite_blue 2022/09/15
AI

deep learning
リンク
U-Net：ディープラーニングによるSemantic Segmentation手法
※このネットワーク図では具体例として入力画像と特徴マップのサイズも記載されているが、U-Netは全結合層を持たないため、入力画像サイズを固定する必要はない。この論文では細胞と背景のセグメンテーションが目的なので出力は2チャンネル(2クラス分類)。 Encoder-Decoder構造 U-NetもFCNやSegNetと同様に全結合層を持たず、畳み込み層で構成されている。U-NetもSegNetのようにほぼ左右対称のEncoder–Decoder構造で、Encoderのpoolingを経てダウンサンプリングされた特徴マップをDecoderでアップサンプリングしていく。 U-NetとSegNetの大きな違いは、Encoderの各層で出力される特徴マップをDecoderの対応する各層の特徴マップに連結(concatenation)するアプローチを導入した点。このアプローチはスキップ接続と呼ばれて
petite_blue 2022/09/10
AI

deep learning
リンク
【論文読解】U2-Net: Going Deeper with Nested U-Structure for Salient Object Detection - Qiita
【論文読解】U2-Net: Going Deeper with Nested U-Structure for Salient Object DetectionDeepLearningSaliencyMap 概要 $\mathrm{U}^2$-NetというSaliency Object Detection（SOD）のためのネットワーク構造を提案している論文を読んだので紹介します。 SODは画像中の目立つ物体の領域を特定するというタスクですが、本論文で提案している$\mathrm{U}^2$-NetはSOTAを達成しているほか、軽量バージョンでも当時のSOTAに匹敵する精度を実現しています。また、論文の段階ではSODを主な適用先とみなしていたようですが、直感的にわかるように、本手法は一般的なセマンティックセグメンテーションやエッジ検出のようなタスクにも使えることが明らかになってきています。つ
petite_blue 2022/09/10
AI

deep learning
リンク
[論文紹介] U^2-Net
Xuebin Qin, Zichen Zhang, Chenyang Huang, Masood Dehghan, Osmar R. Zaiane, Martin Jagersand 概要 U-Net をネストした構造の U^2-Net を提唱し、画像の中から「興味の対象」を抽出する SOD(Salient Object Detection) タスクにおいて、SOTA を達成。また、パラメータ数を抑えた U^2-Net^\dagger では、パラメタサイズがたかだか 4.7M にもかかわらず、既存の手法と遜色のない精度を達成した。既存の手法と違い、 ImageNet による事前学習を行わず、フルスクラッチで訓練しているため、ImageNet と分布の異なる画像であっても利用可能。検証画像 (c) および (d) を見ると、他の手法よりも精度良く物体を抽出できていることがわかる。モデルサ
petite_blue 2022/09/10
AI

deep learning
リンク
コンピュータビジョン分野における世界最高峰の国際会議CVPR2022からワークショップの模様を紹介（前編） - NTT Communications Engineers' Blog
目次目次はじめに CVPR2022概要 Workshop on Image Matching: Local Features & Beyond SuperPoint and SuperGlue: Lessons Learned Large-scale 3D reconstruction Deployment - Successes, Challenges, Open Probl ems Unstructured Object Matching using Co-Salient Region Segmentation Nerfels: Renderable Neural Codes for Improved Camera Pose Estimation Feature Query Networks: Neural Surface Description for Camera Pose Re
petite_blue 2022/07/29
AI

deep learning

画像認識
リンク
Thoth Children | 知識と質問が集まる技術学術情報集積所
隠れマルコフモデル(HMM, Hidden Markov Model)は、内部の観測できない状態を外部で観測できる状態から推定する技術. 内部の状態は確率でどれかの状態に遷移し、遷移した先で決まった確率で観測される状態を出力する.ビタビアルゴリズムで内部の最も考えられる状態遷移を予測し、Forward-Barckwardアルゴリズムで各時刻、各状態の確率を算出し、BaumWelchアルゴリズムでそもそもモデルのパラメータを推定する.
petite_blue 2022/07/24
技術

あとで読む

AI

deep learning

機械学習
リンク
GitHub - axinc-ai/ailia-models: The collection of pre-trained, state-of-the-art AI models for ailia SDK
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
petite_blue 2022/07/24
ai

機械学習

deep learning

あとで読む
リンク
最適輸送と自然言語処理
2022-03-14, 言語処理学会第28回年次大会でのチュートリアル「最適輸送と自然言語処理」のスライドです。当日利用版から増補改訂しました。講演動画 (YouTube)
petite_blue 2022/06/25
nlp

AI

deep learning
リンク
DALL·E mini by craiyon.com on Hugging Face
Discover amazing ML apps made by the community
petite_blue 2022/06/19
AI

deep learning

nlp

transformer
リンク
【AI最新論文】2022年に読むべき「機械学習/ディープラーニングの最新論文」30選 - Qiita
＜目次＞はじめに第1回：コンピュータビジョン編第2回：自然言語処理編第3回：強化学習編第4回：実務応用編次回予告 1. はじめに GAN（敵対的生成ネットワーク）講座現場で使える XAI（Explainable AI）講座現場で使える自然言語処理実践講座ディープラーニング最新論文対策講座スキルアップAIでは、上記の4講座を始めとして、現在、そしてこれから注目されるであろう最先端の機械学習/ディープラーニング技術に関する講座を開講しております。このような講座を開講していく中で、スキルアップAIの講師陣が注目している最先端技術をぜひ知りたいというお声を多くいただきました。そこで、自動機械学習（AutoML）を専門としICMLなどのトップカンファレンスへの論文採択経験もある斉藤と、需要予測・異常検知など様々な分野で機械学習/ディープラーニングの産業応用に取り組んできた小縣が
petite_blue 2022/06/09
ai

機械学習

deep learning

論文
リンク
Metaが言語・画像・音声など複数分野に適応できる自己学習型AI「data2vec」を発表
Facebookを運営するMetaがあらゆる分野に適応できる自己学習型AI「Data2vec」を開発したと発表しました。 Data2vec: The first high-performance self-supervised algorithm that works for speech, vision, and text https://ai.facebook.com/blog/the-first-high-performance-self-supervised-algorithm-that-works-for-speech-vision-and-text Introducing the First Self-Supervised Algorithm for Speech, Vision and Text | Meta https://about.fb.com/news/2022/01
petite_blue 2022/01/23
機械学習

deep learning

ai
リンク
畳み込み+Attention=最強？最高性能を叩き出した画像認識モデル「CoAtNet」を解説！ - Qiita
1. CoAtNetの解説 1.1 畳み込みとSAの復習コンピュータビジョンで用いられている大きな仕組みに畳み込みとSelf-Attention(=SA)があります。畳み込みではEfficientNet、SAではViTが有名ですね。EfficientNetについてはこちらの拙著記事、ViTについてはこちらの拙著記事をご参照ください。CoAtNetでは、この畳み込みとSAの良いとこ取りをしたブロックを作ることが一番の目的になっています。畳み込みとSAの式を復習しておきましょう。ここでは畳み込みの中でもDW(=Depthwise)畳み込みを取り扱います。そして、本論文では分かりやすさを優先しているのか、式の細かいところ(SAにおけるqkvの埋め込みなど)はあえて排除しているように見えるので、理解しやすいです。 1.1.1 畳み込みの式本論文では、畳み込みの中でもDW(=Depthwise)
petite_blue 2021/11/17
deep learning

機械学習

AI

画像認識
リンク
DALL·E: Creating images from text
We’ve trained a neural network called DALL·E that creates images from text captions for a wide range of concepts expressible in natural language. DALL·E is a 12-billion parameter version of GPT-3 trained to generate images from text descriptions, using a dataset of text–image pairs. We’ve found that it has a diverse set of capabilities, including creating anthropomorphized versions of animals and
petite_blue 2021/01/06
AI

deep learning

素材
リンク
「いらすとや」は要らなくなっちゃう？テキストで説明するとそれに沿った何パターンもの画像を生成するOpenAIが凄まじい
小猫遊りょう（たかにゃし・りょう） @jaguring1 毎日、数学をやっています。抽象度の高い数学が好きで、公理的集合論や数理論理学、圏論に興味があるけど、もっと具体的で実用的な数学も好きです。AI 技術と、それがもたらす社会的影響についてよく考えていますが、基本的にテクノロジー全般の最新動向に興味があります。良さげな講義動画を見つけたら、ツイートするようにしてます。小猫遊りょう（たかにゃし・りょう） @jaguring1 うおぉ、、新年早々、超激ヤバなニューラルネットをOpenAIが2つ発表してきた（DALL-EとCLIP）。視覚データとテキストの両方を用いたAIシステムで、DALL-Eは、テキストで説明すると、それっぽい画像を生成。こんなの創造性以外の何者でもない。テキスト+画像版GPT-3っぽい openai.com/blog/tags/mult… pic.twitter.com/
petite_blue 2021/01/06
AI

deep learning
リンク
1 2 3 次のページ