タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

アノテーションに関するshunkeenのブックマーク (2)

  • ChatGPTはクラウドワーカーより優秀か データのラベル付け作業で検証 結果は?

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 スイスのチューリッヒ大学に所属する研究者らが発表した論文「ChatGPT Outperforms Crowd-Workers for Text-Annotation Tasks」は、機械学習向け大規模データセットを作成するためのラベル付け作業(アノテーション)において、ChatGPTと人ではどちらがパフォーマンスが良いかを検証した研究報告である。 多くの機械学習モデルでは、学習やテストを行うために高品質なラベル付きデータを必要とする。科学の進歩のため、研究者が特定分野の大規模なラベル付きデータセットを作成して公開する。あとの研究者らは、このデータセット

    ChatGPTはクラウドワーカーより優秀か データのラベル付け作業で検証 結果は?
    shunkeen
    shunkeen 2023/04/05
    他のモデルの学習にOpenAIのモデルの出力を使うのは規約違反だったような気がするが、この使い方はOKなのだろうか。モデルの蒸留とかやりたい放題になりそう。
  • 機械学習案件の売り上げが3倍に 画像素材サイト「PIXTA」がアノテーション部門設立

    画像素材サイト「PIXTA」などを運営するピクスタは、画像にアノテーション(画像を説明する情報)を付与する専門部署を立ち上げたと発表した。背景には、機械学習案件での売り上げは1年で3倍に拡大した経緯があるという。 画像素材サイト「PIXTA」などを運営するピクスタは1月19日、画像にアノテーション(画像を説明する情報)を付与する専門部署を立ち上げたと発表した。海外開発拠点のPIXTA VIETNAMと連携し発足する。背景には、機械学習案件での売り上げが1年で3倍に拡大したいきさつがあるという。 同社ではこれまでも機械学習用素材として画像データの提供を行っていた。アノテーション付き画像も以前から提供していたが、提携企業に付与を依頼していたという。ピクスタ内で専門部門を発足したことにより、条件によっては従来の半分の期間での納品や約6~7割のコスト抑制が可能になるとしている。 付与できるアノテー

    機械学習案件の売り上げが3倍に 画像素材サイト「PIXTA」がアノテーション部門設立
    shunkeen
    shunkeen 2023/01/20
    アノテーション(注釈)の付与は、物によっては手間がかなりかかりそう。汎用的なモデルだと、だいたいの注釈でいいけど、工場のネジに特化した画像の注釈とか品質管理やってる人じゃないと無理ゲーだし。
  • 1