Sortable and searchable compilation of video dataset Author: Antoine Miech Last Update: 17 October 2019
動画の持つ情報量は、動画内の物体の一連の動きが意味を持つなど、画像に比べてはるかに大きな可能性を秘めています。しかし、”動画”に対する機械学習の発展はまだその多くが未開拓と言えるでしょう。この記事では、先週Google BrainとDeep Mindが開発した”動画認識”への新たなモデル「Temporal Cycle-Consistency」について紹介します。 参考論文 : Temporal Cycle-Consistency Learning 先週Google BrainとDeep Mindが”動画認識”の新しい論文を発表しました。 この論文では、動画認識の発展として、ある特定の動きをする複数の動画の足並み(動作始めから動作終わりまでの一連の動き)を揃える動画解析モデル”Temporal Cycle-Consistency Learning(TCCL)”を提案しています。 例えば、ピッ
最新のRegion CNN(R-CNN)を用いた物体検出入門 ~物体検出とは? R-CNN, Fast R-CNN, Faster R-CNN, Mask R-CNN~DeepLearningR-CNNfaster-r-cnn物体検出PyTorch (参考):2022年における物体検出ライブラリについてまとめました。 更新履歴 Mask R-CNNについて加筆(12/13)。 F-RCNNのAnchorについて記述(12/23)。 Chainerのrepoについて追記(1/3/19)。 Detectronについて追記(3/28/19)。 高速化について追記(9/10/19)。 Torchvision FasterRCNNについて追記(7/6/20) SSD,YOLOについて準備中。 本記事は2018に記述したものです。RCNNの基本などは本記事の記述からさほど大きな変化はないものの、Eff
TL;DR default で準備されているモデルで embedding を得る場合、 Module class の call メソッドに input を渡して実行するようになっている モデルは Tensorflow Hub が提供するものをダウンロードしてきて “default” とかで所定の tensor を名前引きして結果を得るようになっている モデルの情報がちゃんと残ってないのが辛い… 最近 TensorFlow Hub の NLP モデルで embedding を作って色々試したりしている。 主な用途としては(複数)文を入力としてその embedding で類似度を計算したりとかそういう感じ。 使っていると Universal Sentence Encoder (USE) が(BERT とか ELMo と比べて)良い性能を発揮しているが、こやつの詳しい情報があまりない。 論文を読
みなさんこんにちは。くにです。 データ分析の世界に足を踏み入れてから9年が過ぎました。 分析実務未経験でキャリアチェンジできたのは幸運としか言えませんが、ある意味無知だったからこそ無謀な挑戦ができたのかもしれません。この挑戦の泥臭い記録は、この記事に書きました。 ポジションは変われど、データを扱う仕事をまだ続けています。 私は実務で手を動かしつつ、不格好に失敗しながら学んできました。わからないことにぶつかるたびに本を買い、その本でわからないことがあればまた本屋に行き、自分が少しでも理解できそうな本を探して買いました。そして、気になる参考文献があれば、それも買って読んでみる…。 こんな生活を続けているうちに、部屋が本だらけになってしまいました。 正直に言って読み切ったという実感のある本はありません。しかし、実務で何かしらお世話になった本は数多くあり、そういう本は手放さずに手元に置いています。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く