タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

*algorithmとlabelとNLPに関するsh19910711のブックマーク (4)

  • BERTを用いて膨大なコンテンツにメタデータを自動付与する 〜 Yahoo!ショッピングの商品属性推定

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。Yahoo! JAPAN研究所の鍜治です。 みなさんはコンテンツにメタデータを付与したいとき、どのようにしていますか? もちろん手作業で付与することもできますが、コンテンツ量が膨大なときには、自動的にメタデータを付与できる仕組みがあると便利だと思いませんか? 私がリーダーを務めている研究開発チームでは、Yahoo!ショッピングの商品に属性というメタデータを自動付与するため、BERTを用いた商品属性推定モデルを開発しています。記事では、そもそも商品の属性とはどういうものなのか、どのようにBERTを使っているのか、既存モデルと精度はどのくらい違うのか、などについてお話したいと思いますので、よろしくお願いします。 Yaho

    BERTを用いて膨大なコンテンツにメタデータを自動付与する 〜 Yahoo!ショッピングの商品属性推定
    sh19910711
    sh19910711 2025/09/16
    2022 / "BERTの元論文では、マスク言語モデルに加えて次文予測(Next Sentence Prediction)モデルを学習することも提案 ~ ここでは採用していません / 商品タイトルについては、そもそも次文を定義することが難しい"
  • [DL輪読会] Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm

    [DL輪読会] Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm

    [DL輪読会] Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm
    sh19910711
    sh19910711 2025/09/03
    2017 / "テキストに付与されている感情表現(顔文字・絵文字・ハッシュタグ)はDistant Supervisionで用いられ ~ / Distant Supervision: 間接的なラベルを用いてラベルなしデータをラベルありデータとして用いる"
  • 自然言語処理における Active Learning - ELYZA Tech Blog

    はじめまして,インターンの中村です。今回は,アノテーションコストを抑えつつも,高性能な機械学習モデルを学習するための手法である能動学習 (Active Learning) について,その自然言語処理における研究例を紹介したいと思います。特に,自然言語処理において,大量のラベルありデータを集めることが難しく,必要最低限のアノテーションで高性能なモデルを効率的に学習したいといった方にぜひ一読をお勧めしたい内容となっています。 はじめに 深層学習の課題 Active Learningとは Active Learningの概要 1. ラベルなしデータの選択方法 2. ラベルなしデータの抽出基準 自然言語処理における Active Learning テキスト分類における Active Learning 事前学習済みモデル以前の Active learning 事前学習済みモデルを使った Active

    自然言語処理における Active Learning - ELYZA Tech Blog
    sh19910711
    sh19910711 2024/04/16
    "テキスト分類で 10数% 程度,NER で 20% 程度,Image Captioning では 45%程度 のラベルありデータがあれば,訓練データ全てにラベルを付与した通常の教師あり学習に匹敵する性能を得られることが報告" 2021
  • 大規模言語モデル時代のHuman-in-the-Loop機械学習

    画像の認識・理解シンポジウム(MIRU2023)チュートリアル

    大規模言語モデル時代のHuman-in-the-Loop機械学習
    sh19910711
    sh19910711 2023/07/26
    arXiv:2306.07899 / "ChatGPTに作業を丸投げするMTurkワーカ: 医学論文のabstractの要約を依頼 + 33〜46%のワーカがChatGPTを使って作業を行ったと推定された / 「ChatGPT使用」と検出された要約は元の文章からのコピーが著しく少ない"
  • 1