タグ

アノテーションに関するmisshikiのブックマーク (21)

  • 【AWS SageMaker】SageMaker Ground Truthで手持ちの画像をラベリングしてみた - Qiita

    背景 AWS SageMakerについて勉強していたところ、SageMaker Ground Truthは画像にラベリングを行うものとあったので、実際に触ってみました。 試した事(概要) 漫画家の矢吹健太郎先生の作品である「ToLoveる-ダークネス-」のヒロインキャラクター画像に対して、キャラクター名をラベリングしてみました。 例えば、 これは「ヤミ」のラベルを付けて、 これは「モモ」のラベルを付けてみる形です。 試した事(詳細) 1. S3にラベリングを行いたい画像をアップロード 今回は12枚の画像(pngファイル)をアップロードしました。 2. SageMaker Ground Truthにて、ラベリングジョブを作成 どこに保存されている画像に、どのようなラベリングを行うのか、作業者は誰か、等の設定をしたジョブを作成します。 まずは、マネジメントコンソールのSageMaker画面の左

    【AWS SageMaker】SageMaker Ground Truthで手持ちの画像をラベリングしてみた - Qiita
  • 20分で分かる Human-in-the-Loop 機械学習におけるアノテーションとヒューマンコンピューターインタラクションの真髄

    第8回 Data-Centric AI勉強会 ~Human-in-the-Loop機械学習 特別回~の発表内容です。 https://dcai-jp.connpass.com/event/315963/ 書籍「Human-in-the-Loop 機械学習」において、翻訳を担当した章(1,7,8,11,12章)の内容を抜粋して紹介します。Human in the loop 機械学習において重要な概念であるアノテーションとヒューマンコンピューターインタラクションについて、著者の機械学習エンジニアとしての実例を交えつつ説明します。 Amazon での書籍リンク https://amzn.to/47u5tFz

    20分で分かる Human-in-the-Loop 機械学習におけるアノテーションとヒューマンコンピューターインタラクションの真髄
    misshiki
    misshiki 2024/05/10
    全26ページのスライド資料。
  • アノテーションにおけるUIの工夫 - CADDi Tech Blog

    こんにちは、MLOpsチームです。先日OCRモデルを学習するためのアノテーションにおいて、作業効率を検証するためのPoCとしてアノテーションUIを開発しました。記事ではこのアノテーションUIにおける工夫について、試用によって得られた知見をまじえつつ紹介します。 はじめに アノテーションUIを開発することとなった背景について説明します。 アノテーションUIとは アノテーションUI機械学習の学習データを作成するためのUIです。アノテーションUIはアノテーション作業の効率に強く影響し、アノテーション作業によって得られる学習データの量は機械学習の精度に大きく寄与します。したがって、アノテーションUI機械学習において最も重要なコンポーネントのひとつといえます。 UIを開発した背景 キャディではOSSツールなどのUIを用いてアノテーションが行われていましたが、ここに独自の工夫を導入すれば入力効率

    アノテーションにおけるUIの工夫 - CADDi Tech Blog
    misshiki
    misshiki 2024/04/22
    “アノテーションUIは機械学習の学習データを作成するためのUIです。アノテーションUIにおける工夫について、試用によって得られた知見をまじえつつ紹介します。”
  • Stability AIが「Stable Video 3D」を発表  単一画像から「回しても形が崩れない」3Dビデオ生成を実現 | Ledge.ai

    Top > 学術&研究 > Stability AIが「Stable Video 3D」を発表  単一画像から「回しても形が崩れない」3Dビデオ生成を実現

    Stability AIが「Stable Video 3D」を発表  単一画像から「回しても形が崩れない」3Dビデオ生成を実現 | Ledge.ai
    misshiki
    misshiki 2024/03/27
    “Stability AIは2023年3月19日、単一の画像から高品質な3Dビデオを生成できる新技術「Stable Video 3D」(SV3D)を発表した。”
  • 『Human-in-the-Loop 機械学習』 - ジョイジョイジョイ

    共立出版さまより『Human-in-the-Loop 機械学習』をご恵贈いただきました。一通り読み終えたので感想を共有します。 映り込みが激しくて写真を撮るのが難しいことで有名な表紙 書は機械学習モデルを訓練するためのデータを人間がどのように用意するかという問題を扱っています。書の前半では能動学習というラベル付けデータの選び方の技法が、書の後半では人間が付けたラベルの管理方法やラベル付けのための適切なインターフェースが紹介されています。 機械学習におけるデータをいかに作るかということは私自身とても注目している領域です。『Active Learning from the Web(能動学習を使ってウェブから機械学習データを収集する)』という論文を書いたこともありますし、PDF 翻訳サービスの Readable では能動学習に基づいたアノテーションを実際に行っています。そのため書は非常に

    『Human-in-the-Loop 機械学習』 - ジョイジョイジョイ
    misshiki
    misshiki 2023/12/28
    “今までほとんど無かった、機械学習用のデータを作成するための書籍です。実用性を強く重視しており、まさに今から機械学習データを用意しようと考えている方にとっては大いに役立つ本だと思います。”
  • GPT-4V と Segment Anything で楽々アノテーション

    これは GO Inc. Advent Calendar 2023 の 12 日目の記事です。 私 kzykmyzw は GO 株式会社でコンピュータビジョンに関する研究開発から実装までを担当しており、記事もコンピュータビジョンに関連しますが、会社での業務とは無関係です。あまり専門的に深い話はしませんが、ある程度知識のある方を対象としていますのでコンピュータビジョンに関する一般的な用語は解説せずに使います。 はじめに 2023 年の 9 月頃に画像認識が可能な GPT-4V(ision) が ChatGPT 経由で使えるようになり、2023 年 11 月 6 日に行われた Open AI DevDay で API 経由でも使えるようになったことが発表されました。主な使い方はやはり画像を自然言語で説明させることかと思いますが、普段は物体検出やセマンティックセグメンテーション(以下セマセグ)と

    GPT-4V と Segment Anything で楽々アノテーション
    misshiki
    misshiki 2023/12/13
    SAM (Segment Anything Model) によるセグメンテーションで物体にID番号を付与し、それをGPT-4Vに入力することで、セマンティックセグメンテーションのアノテーションを自動化。
  • GPT-4はラベリングのタスクにおいて人間のエリート並の力を発揮し2万時間と6000万円以上を節約してくれる

    専門家とクラウドワーカーによって行われたラベリング作業と、GPT-4を用いたラベリング作業を比較したところ、GPT-4の作業内容はクラウドワーカーの平均的な作業内容よりも専門家の作業内容に近いものだったことがわかりました。GPT-4に任せることで節約可能な時間は2万時間、節約可能なコストは50万ドル(約6620万円)に上ります。しかし、この事実はクラウドワーキングの先行きが厳しいことも示唆しています。 [2304.03279] Do the Rewards Justify the Means? Measuring Trade-Offs Between Rewards and Ethical Behavior in the MACHIAVELLI Benchmark https://doi.org/10.48550/arXiv.2304.03279 GPT-4 Outperforms Eli

    GPT-4はラベリングのタスクにおいて人間のエリート並の力を発揮し2万時間と6000万円以上を節約してくれる
    misshiki
    misshiki 2023/04/17
    “専門家とクラウドワーカーによって行われたラベリング作業と、GPT-4を用いたラベリング作業を比較し、GPT-4の作業内容はクラウドワーカーの平均的な作業内容よりも専門家の作業内容に近いものだったことがわかり”
  • ChatGPTはクラウドワーカーより優秀か データのラベル付け作業で検証 結果は?

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 スイスのチューリッヒ大学に所属する研究者らが発表した論文「ChatGPT Outperforms Crowd-Workers for Text-Annotation Tasks」は、機械学習向け大規模データセットを作成するためのラベル付け作業(アノテーション)において、ChatGPTと人ではどちらがパフォーマンスが良いかを検証した研究報告である。 多くの機械学習モデルでは、学習やテストを行うために高品質なラベル付きデータを必要とする。科学の進歩のため、研究者が特定分野の大規模なラベル付きデータセットを作成して公開する。あとの研究者らは、このデータセット

    ChatGPTはクラウドワーカーより優秀か データのラベル付け作業で検証 結果は?
    misshiki
    misshiki 2023/04/05
    “結果から、サンプル全体のアノテーションや教師あり学習のための大規模データセットをChatGPTを用いて低コストで作ることができる可能性を示唆”
  • Using Amazon SageMaker with Point Clouds: Part 1- Ground Truth for 3D labeling | Amazon Web Services

    We will train our detector to specifically detect cars since that’s the most common class in our dataset (32616 of the 42816 total objects in the dataset are labeled as cars). Solution overview In this series, we cover how to visualize and label your data with Amazon SageMaker Ground Truth and demonstrate how to use this data in an Amazon SageMaker training job to create an object detection model,

    Using Amazon SageMaker with Point Clouds: Part 1- Ground Truth for 3D labeling | Amazon Web Services
    misshiki
    misshiki 2023/03/13
    “3D データを取得して、Amazon SageMaker Ground Truth でラベル付けできる形式に変換する方法を示しま”
  • 機械学習案件の売り上げが3倍に 画像素材サイト「PIXTA」がアノテーション部門設立

    画像素材サイト「PIXTA」などを運営するピクスタは、画像にアノテーション(画像を説明する情報)を付与する専門部署を立ち上げたと発表した。背景には、機械学習案件での売り上げは1年で3倍に拡大した経緯があるという。 画像素材サイト「PIXTA」などを運営するピクスタは1月19日、画像にアノテーション(画像を説明する情報)を付与する専門部署を立ち上げたと発表した。海外開発拠点のPIXTA VIETNAMと連携し発足する。背景には、機械学習案件での売り上げが1年で3倍に拡大したいきさつがあるという。 同社ではこれまでも機械学習用素材として画像データの提供を行っていた。アノテーション付き画像も以前から提供していたが、提携企業に付与を依頼していたという。ピクスタ内で専門部門を発足したことにより、条件によっては従来の半分の期間での納品や約6~7割のコスト抑制が可能になるとしている。 付与できるアノテー

    機械学習案件の売り上げが3倍に 画像素材サイト「PIXTA」がアノテーション部門設立
    misshiki
    misshiki 2023/01/19
    “画像にアノテーション(画像を説明する情報)を付与する専門部署を立ち上げたと発表した。海外開発拠点のPIXTA VIETNAMと連携し発足する。背景には、機械学習案件での売り上げが1年で3倍に拡大し”
  • 【自動運転】信号機認識に挑む / 走行画像15,000枚のアノテーションとYOLOXモデルによる深層学習実践

    こんにちは。TURING株式会社でインターンをしている、東京大学学部3年の三輪と九州大学修士1年の岩政です。 TURINGは完全自動運転EVの開発・販売を目指すスタートアップです。私たちの所属する自動運転MLチームでは完全自動運転の実現のため、AIモデルの開発や走行データパイプラインの整備を行っています。 完全自動運転を目指すうえで避けて通れない課題の一つに信号機の認識があります。AIが信号機の表示を正しく理解することは、自動運転が手動運転よりも安全な運転を達成するために欠かせません。信号機を確実に認識したうえで、周囲の状況を総合的に判断して車体を制御し、安全かつ快適な走行を実現する必要があります。 TURINGでは信号機の認識に取り組むため、15,000枚規模のデータセットを準備し、高精度なモデルのための調査・研究を開始しました。この記事ではデータセットの内製とその背景にフォーカスしつつ

    【自動運転】信号機認識に挑む / 走行画像15,000枚のアノテーションとYOLOXモデルによる深層学習実践
    misshiki
    misshiki 2023/01/06
    “信号機の認識に取り組むため、15,000枚規模のデータセットを準備し、高精度なモデルのための調査・研究を開始。データセットの内製とその背景にフォーカスしつつ、YOLOXを用いた試作モデルについても最後に紹介”
  • 目指すは、AI革命のインフラ アノテーションツールでAI開発を10倍速くする | & JAFCO POST | ジャフコ グループ株式会社

    起業を決めた背景や、事業が軌道に乗るまでの葛藤、事業を通じて実現したい想いを聞く「起業家の志」。 第31回は、週刊東洋経済「すごいベンチャー100 2022年最新版」に選ばれたFastLabel株式会社代表取締役の上田英介氏に登場いただき、担当キャピタリスト松孝之からの視点と共に、これからの事業の挑戦について話を伺いました。 【プロフィール】 FastLabel株式会社 代表取締役 上田英介(うえた・えいすけ) 九州大学理学部物理学科情報理学出身。株式会社ワークスアプリケーションズでソフトウェアエンジニアとして会計製品の開発に2年間従事。2年目にエンジニアとして初となるロサンゼルス支社へ赴任。アメリカの商習慣に合わせたAI-OCR請求書管理サービスを設計・開発。その後、イギリスのAIベンチャーでMLOps基盤の開発や、大手銀行のDXプロジェクトを推進。AIの社会実装をする中で感じた原体験

    目指すは、AI革命のインフラ アノテーションツールでAI開発を10倍速くする | & JAFCO POST | ジャフコ グループ株式会社
    misshiki
    misshiki 2022/11/11
    “「FastLabel」を活用すれば、最初の100件ほどのデータを手作業で分類したあとは、残り数万件のデータをAIが自動的に学習し、振り分けていきます。”
  • 1万5000件のデータ整備がたった3時間に――アノテーション作業効率化に“人力”で挑むスタートアップに話を聞いた

    スマートフォンアプリを使ったクラウドソーシングでデータを整備、その効果は AI機械学習に必要なデータ整備、活用について有識者にインタビューする連載。前回は、AIが学習するためのデータにラベル付けを行う「アノテーション」を自動化する企業、FastLabelに話を聞いた。 今回は、アノテーション作業をスマホアプリで提供し、クラウドソーシング化することで素早いデータ生成を実現しているAPTOの代表取締役 高品良氏に、アノテーションに対する同社のアプローチなどについて話を聞いた。 APTOは、AIに必要な教師データを作成するアノテーション支援プラットフォームの運営やデータ収集支援事業を手掛ける、2020年に創業したスタートアップ企業だ。同社は、アノテーション作業をクラウドソーシングで効率化できるスマートフォン用アプリ「harBest」を開発、運営している。アノテーション作業の依頼があると、それ

    1万5000件のデータ整備がたった3時間に――アノテーション作業効率化に“人力”で挑むスタートアップに話を聞いた
  • 水とお酒をどう見分ける? AIプロジェクトの成否を分ける、アノテーションの重要性を有識者に聞いた

    AI活用のボトルネックはデータの整備 AIの利用が拡大している。B2C(Business to Consumer)領域でメガプラットフォーマーが提供するサービスだけでなく、B2B(Business to Business)領域のビジネスITにおいてもAIの採用が増えている。 その一因に、企業が保存しているデータの増加がある。特に、IoTセンサーやWeb接続できるカメラなど、日々蓄積される非構造化されたデータは、人間が確認できる容量をはるかに超えている。そこでAIを使ってそのデータを活用したいと考える企業が増えているからだ。 しかし、データをAIで分析するためには準備が必要である。AIが判別できるように、データに「ラベル付け」を行わなければいけない。この作業を「アノテーション」というが、ここに膨大な時間が費やされているという。 その課題解決に目を付け、2020年に創業した企業がFastLab

    水とお酒をどう見分ける? AIプロジェクトの成否を分ける、アノテーションの重要性を有識者に聞いた
    misshiki
    misshiki 2022/09/27
    “AI、機械学習に必要なデータ整備、活用について取り上げる連載”
  • Amazon SageMaker Ground Truth が、合成データ生成のサポートを開始

    Amazon SageMaker Ground Truth がサポート提供を開始し、手動でラベル付けした実際のデータを大量に集めることなく、ラベル付き合成データを生成できるようになりました。Amazon SageMaker は、Amazon SageMaker Ground Truth Plus と Amazon SageMaker Ground Truth の 2 つのデータラベリングサービスを提供します。どちらのオプションでも、画像、テキストファイル、動画などの生データを識別し、有益なラベルを追加して、機械学習モデル用の高品質のトレーニングデータセットを作成できます。 SageMaker Ground Truth はユーザーに代わってラベル付き合成データを生成するため、実際のデータと合成データを使用して、さまざまなコンピュータービジョンのユースケースで機械学習モデルをトレーニングできま

    Amazon SageMaker Ground Truth が、合成データ生成のサポートを開始
    misshiki
    misshiki 2022/07/13
    合成画像が作れるようになった。
  • 高品質なAIの教師データを作成するアノテーション代行サービス「TASUKI Annotation」を提供開始 | 企業・IR | ソフトバンク

    ソフトバンク株式会社(以下「ソフトバンク」)は、AI人工知能)を活用したサービスを開発する企業やAIを研究・開発する学術機関向けに、教師データを作成するアノテーション※代行サービス「TASUKI Annotation (タスキアノテーション)」の提供を、2022年6月から格的に開始しましたのでお知らせします。「TASUKI Annotation」は、ソフトバンクおよびソフトバンクのグループ会社の従業員を対象とした新規事業提案制度「ソフトバンクイノベンチャー」から生まれたサービスです。 昨今、生産性の向上などを目的に企業におけるAIの導入が加速し、自社でAIの開発に取り組む事業会社や、AIの開発を受注するシステム開発会社などが増加しています。一方で、高精度のAIを開発するには、膨大な教師データが必要とされるため、AIエンジニアがその作成に多くの作業時間を費やすことになり、AIモデルの作成

    高品質なAIの教師データを作成するアノテーション代行サービス「TASUKI Annotation」を提供開始 | 企業・IR | ソフトバンク
    misshiki
    misshiki 2022/06/29
    “膨大な教師データの作成作業そのものをAIで自動化することで、より短時間で作成できる他、AIの知識を豊富に持つ熟練したスタッフが、データの品質チェックや顧客のフォローアップを行うことで、高い品質を実現”
  • ソフトバンク、AIの教師データ作成代行サービス「TASUKI Annotation」の提供開始 | IoT NEWS

    2022-06-28 ソフトバンク、AIの教師データ作成代行サービス「TASUKI Annotation」の提供開始 昨今、企業におけるAIの導入が加速しているが、高精度なAIを開発するには膨大な教師データが必要とされるため、AIモデルの作成など、AIの開発に当たって重要なプロセスに十分な時間を確保できないという課題が生じているという。 そこでソフトバンク株式会社は、AIを活用したサービスを開発する企業やAIを研究・開発する学術機関向けに、教師データを作成するアノテーション代行サービス「TASUKI Annotation(タスキアノテーション)」の提供を、2022年6月から格的に開始した。 「TASUKI Annotation」は、ソフトバンク社員のエンジニアが発案したサービスで、AIの開発に必要な教師データの作成作業そのものをAIで自動化し、AIの知識を持つ熟練スタッフが、データの品質

    ソフトバンク、AIの教師データ作成代行サービス「TASUKI Annotation」の提供開始 | IoT NEWS
    misshiki
    misshiki 2022/06/29
    “教師データを作成するアノテーション代行サービス「TASUKI Annotation(タスキアノテーション)」の提供を、2022年6月から本格的に開始”
  • 手作業によるラベル付けを不要に 東京大学の郭威助教らがアノテーションの自動化手法を開発

    手作業によるラベル付けを不要に 東京大学の郭威助教らがアノテーションの自動化手法を開発:AIモデルの汎用(はんよう)性を向上 東京大学の郭威助教らの研究グループは、ある品種に対して学習させたAIモデルを別の品種向けに検出精度を落とすことなく変換できる「モデル汎化法」を開発した。

    手作業によるラベル付けを不要に 東京大学の郭威助教らがアノテーションの自動化手法を開発
    misshiki
    misshiki 2021/06/03
    “教師データを作るための手作業によるアノテーションを不要とする手法を開発したと発表した。既存の画像検出AIモデルを別の検出対象に流用する際に、自動的にアノテーション作業を実施する”
  • APTO、AI学習データ(アノテーションデータ)作成を手伝うことでポイントが貰えるポイ活アプリ「harBest(ハーベスト)」をリリース

    APTO、AI学習データ(アノテーションデータ)作成を手伝うことでポイントが貰えるポイ活アプリ「harBest(ハーベスト)」をリリース好きな時間に、好きな作業を、好きなだけ行うことが出来る、ポイ活アプリ「harBest」をリリース クラウド上でAI開発、データ作成・登録、運用・評価ができるプラットフォーム「harBest」シリーズを提供する株式会社APTO(社:東京都渋谷区、代表取締役:高品良、藤井翔吾、以下「APTO」)は、AI学習データ(アノテーションデータ)の作成をクラウドワーカーが利用することができ、作業の内容に応じてポイントが貰えるポイ活アプリ「harBest(ハーベスト)」を提供開始しました。(URL:https://harbest.site) harBestアプリ AI学習データ(アノテーションデータ)の作成は、AI開発・運用に欠かせないもので、依然として人の手を介在する

    APTO、AI学習データ(アノテーションデータ)作成を手伝うことでポイントが貰えるポイ活アプリ「harBest(ハーベスト)」をリリース
    misshiki
    misshiki 2021/05/17
    “AI学習データ(アノテーションデータ)の作成をクラウドワーカーが利用することができ、作業の内容に応じてポイントが貰えるポイ活アプリ「harBest(ハーベスト)」”
  • AOSデータ社、AI学習データのデータアノテーション事業を強化し、本格稼働を開始

    AOSデータ社、AI学習データのデータアノテーション事業を強化し、格稼働を開始~AI情報メディアallAi.jpと連携しAIシステムを支援~ クラウドデータ、システムデータ、リーガルデータ、AIデータなどのデータアセットマネジメント事業を展開するAOSデータ株式会社(社:東京都港区、代表取締役社長 春山 洋 以下AOSデータ社)は、AIに関するあらゆる情報を網羅したAI情報メディアallAi.jpと連携し、AI学習データのセキュアなAIデータアノテーションサービス事業を強化し、お客様のAIシステム導入の成功に向け、格稼働を開始致します。 ▼AI情報メディア「allAi.jp」 https://allai.jp/ ▼AIデータアノテーションサービス https://allai.jp/aidata/ ■背景 AIを始めるにはまず必要なアノテーションサービスについてのご紹介をします。元デー

    AOSデータ社、AI学習データのデータアノテーション事業を強化し、本格稼働を開始