この記事はMobility Technologies Advent Calendar 2021の18日目です。 こんにちは、AI技術開発AI研究開発第二グループの劉です。私はドラレコ映像から標識などの物体を見つける物体検出技術を開発しているのですが、その精度を改善していくためにはまず検出エラーを細かく分析することが重要です。本記事では、物体検出のエラー分析に関する論文である”TIDE: A General Toolbox for Identifying Object Detection Errors”を解説すると共に、その著者らが公開しているツールを実際に使ってみた結果をご紹介をしたいと思います。 はじめに本記事では、以下の論文を取り上げます。コンピュータビジョンで最も有名な国際学会の一つであるECCV(European Conference on Computer Vision)で202
自然言語処理において,単語認識(形態素解析や品詞推定など)の次に実用化可能な課題は,ある課題において重要な用語の認識であろう.この際の重要な用語は,一般に単語列であり,多くの応用においてそれらに種別がある.一般的な例は,新聞記事における情報抽出を主たる目的とした固有表現であり,人名や組織名,金額などの 7 つか 8 つの種別(固有表現クラス)が定義されている.この重要な用語の定義は,自然言語処理の課題に大きく依存する.我々はこの課題をレシピ(調理手順の文章)に対する用語抽出として,レシピ中に出現する重要な用語を定義し,実際にコーパスに対してアノテーションし,実用的な精度の自動認識器を構築する過程について述べる.その応用として,単純なキーワード照合を超える知的な検索や,映像と言語表現のマッチングによるシンボルグラウンディングを想定している.このような背景の下,本論文では,レシピ用語タグセット
We identify label errors in the test sets of 10 of the most commonly-used computer vision, natural language, and audio datasets, and subsequently study the potential for these label errors to affect benchmark results. Errors in test sets are numerous and widespread: we estimate an average of at least 3.3% errors across the 10 datasets, where for example label errors comprise at least 6% of the Ima
AI needs to face up to its invisible worker problem AI研究者はそろそろ 「見えない労働者」問題に 向き合うべきだ 最近の人工知能(AI)の華々しい成果の背後には、米国の最低賃金にも満たない賃金で、機械学習モデルに入力するデータのラベル付けなどの作業を請け負うギグワーカーたちの存在がある。こうした「見えない労働者」の現状について、ウェストバージニア大学のサイフ・サベージ博士に話を聞いた。 by Will Douglas Heaven2020.12.24 239 152 6 22 最も成功し、最も広く使われている機械学習モデルは、その多くが何千人という低賃金のギグワーカーの助けを借りて訓練されている。世界中で、何百万人という労働者が、アマゾンのメカニカル・タークといったプラットフォームから収入を得ている。このようなプラットフォームのおかげで
どうも緒方@conta_です。 みなさんAI頑張ってますか? きっと昼はGPUサーバーを回して、夜は結果待ちでビールサーバーを回してる人が多いことでしょう。 機械学習を実際のプロダクトに活用する場合、自分が解きたいタスクがそのままオープンなデータセットで解決できることは少ないので、まず最初に課題となるのはデータセット作成です。 実際にカメラやセンサーを取り付けて収集したり、Webからクローリングしてきたり、事業会社であれば自社のデータセットに教師ラベルをつけることで新しいタスクに取り組むことが可能になるでしょう。 よく疑問になるポイントとして、データセットの量と質は、多ければ多いほど良く、高品質であれば高品質であるほど良いのですが教師データを作成するのは一苦労です。 *下記アノテーションの量や質について実験した結果がまとまってます tech-blog.abeja.asia もちろん少数デー
2018年に新しく出たiPad(第6世代)を買いました。iPadは第2世代とiPadmini第2世代を持っているのですが、前者は実家へ後者は子供がたまに使っています。今回、購入に至ったのは、アップルペンシルが対応となった事、そしてPDFデータを隙間時間に読まないといけなくなった事があります。 PDFを読むときのアプリ Liquid Textの使用 Liquid Textの値段 Liquid Textと端末の限界 Liquid Textの有料版の細かい機能はこちらの記事を参照 PDFを読むときのアプリ 購入したのはsimフリーの32GBモデルです(容量はクラウドがあるのと、iPhone8が256GBなので、そこまで求めてないのもあります) さて、iPadでPDFを読む際は何のアプリを使うかをいつも迷います。iPad miniの時はPDF Expertを活用していました。 PDF Expert
追記20200816 LiquidTextは,その後も順調にアップデートを繰り返し,昨今ではWindows版とmacOS版がリリースされるに至ってインターフェイスも統一されました。 (これを書いている時点で期間限定で20%OFFセールをしています。) アノテーション機能が柔軟になったり,マルチドキュメントの管理ができるようになったり,今後はサブスクリプションでクラウドサービスを立ち上げるようです。アプリからサービスへの転換でシンプルさがなくなるのは残念ですが,複数の端末からクラウドで連携できるようになるのは重要です。 現在でも情報整理を伴うPDFビューア兼アノテーションアプリとしての独自性は陰り無く,定番アプリとして対価を払う価値はあると思います。 PDF文書を読みながら情報や要点の整理の作業をしたいことがあります。書類に下線やメモなどの書き込みをするだけでなく,必要な部分を抜き出して整理
IBIS 2021 https://ibisml.org/ibis2021/ における最適輸送についてのチュートリアルスライドです。 『最適輸送の理論とアルゴリズム』好評発売中! https://www.amazon.co.jp/dp/4065305144 Speakerdeck にもアップロードしました: https://speakerdeck.com/joisino/zui-shi-shu-song-ru-men
Data labeling is a necessary but often slow process that impedes the development of interactive systems for modern data analysis. Despite rising demand for manual data labeling, there is a surprising lack of work addressing its high and unpredictable latency. In this paper, we introduce CLAMShell, a system that speeds up crowds in order to achieve consistently low-latency data labeling. We offer a
Anitha Kannan , Simon Baker , Krishnan Ramnath , Juliet Fiss , Dahua Lin , Lucy Vanderwende , Rizwan Ansary , Ashish Kapoor , Qifa Ke , Matt Uyttendaele , Xin-Jing Wang , Lei Zhang KDD '14 Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining | August 2014 Published by ACM Press Publication Images can be used to convey many different concepts or illustr
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く