somemoのブックマーク / 2022年6月1日

somemo id:somemo

2022年6月1日のブックマーク (6件)

sun********さんのMy知恵袋 - Yahoo!知恵袋
投稿内容の掲載場所について知恵袋で投稿された内容は、質問のカテゴリや投稿内容によってLINEヤフー株式会社および、LINEヤフー株式会社の子会社・関連会社が提供するサービスに掲載される場合があります。 ※詳細はヘルプをご参照ください
somemo 2022/06/01
リンク
RNNからTransformerまでの歴史を辿る～DNNを使ったNLPを浅く広く勉強～ - arutema47's blog
Amazon Prime 一ヶ月無料 Seq2seqからBERTまでのNLPモデルの歴史をざっとまとめる。 DNNは知ってるけどTransf ormerってなんだかわからない、って人におすすめです。 Abst. 画像認識にもTransf ormerが使われることが多く、DeepRLやGPT-3といったNLPモデルも身近になってきています。"Attention is 何?"と言えなくなってきたので勉強しました。 Feedforward NetworksからSeq2Seq, Attention機構からTransf ormer登場、そしてBERT GPTといった最新モデルまでの流れを広く浅く記述する予定。またKaggle NLPコンペの上位解法から利用例を探る。 Tl;DR Transf ormerはSelf-Attentionという機構でデータ内の時系列的特徴を抽出でき、従来のRNNを始めとするNN
somemo 2022/06/01
リンク
GitHub - ohmsha/PyOptBook: 岩永二郎・石原響太・西村直樹・田中一樹共著『Pythonではじめる数理最適化－ケーススタディでモデリングのスキルを身につけよう－』（オーム社、2021年）のサポートページです。
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
somemo 2022/06/01
https://www.ohmsha.co.jp/book/9784274227356/
リンク
物体検出ライブラリの紹介と所感 - arutema47's blog
記事について画像はDetectron2より物体検出をほとんど使っていない方を対象として、2021年末の物体検出ライブラリを俯瞰することが本記事の目的。ある程度物体検出の経験ある方は学ぶことは少ないと思う。またあくまで書いてあるのは筆者の感想であるので人によっては全く違う意見になることもあるかと。また本記事ではモデルの技術的な説明はありません。それらについて理解を深める際は参考ページや元論文を当ってみると良いかと思います。また大変遅くなりましたが、本記事はKaggleアドベントカレンダー（裏）の24日目でもあります（年明けちゃってすみません）。 qiita.com 記事について紹介するライブラリ一覧所感アンサンブルについて精度vs速度トレードオフライブラリ紹介 yolov5 学習について推論について Yolox 学習について Efficientdet 学習コード torc
somemo 2022/06/01
リンク
CPUとGPUのマルチスレッディングの違いについて - arutema47's blog
"Locality is efficiency, Efficiency is power, Power is performance, Performance is King", Bill Dally マルチスレッディングとは？ CPUとGPUのマルチスレッディングの違いをブログにまとめていたけど例によって誰も興味なさそう— arutema47 (@arutema47) 2021年8月16日つぶやいたら読みたい方が多そうだったので完成させました。マルチスレッディングとはメモリ遅延を隠蔽しスループットを上げるハードウェアのテクニックです。ただCPUとGPUで使われ方がかなり異なるため、その違いについて考えてみる記事です。（SIMDについて並列プログラミングの観点から触れるべきでしたが、時間無いマルチスレッディングに注目するため初版では省きました。）本記事について本記事はCPUとG
somemo 2022/06/01
リンク
ViT時代の終焉？MetaFormerの論文紹介と実証実験 - Qiita
著者たちによるGitHubにはPoolFormerとして実装されているが、ここでは論文の趣旨を尊重してより抽象的なMetaFormerとして実装し、TokenMixingを変更できるようにしている。 def ChannelMLP(x, mlp_ratio, normalize, drop_path=0.0, prefix='' ): dense_kwargs = { 'kernel_initializer':'he_normal', 'bias_initializer': tf.keras.initializers.RandomNormal(stddev=1e-2), } in_shape = x.shape dim = in_shape[-1] mlp_dim = dim*mlp_ratio shortcut = x # norm x = normalize(x, name = pref
somemo 2022/06/01
リンク
- 2022年6月2日
- 2022年6月1日
- 2022年5月31日