はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    衆議院選挙2026

『radiology-nlp.hatenablog.com』

  • 人気
  • 新着
  • すべて
  • 自然言語処理タスクを概観する(2) トークン単位の分類問題とその変形 - radiology-nlp’s blog

    4 users

    radiology-nlp.hatenablog.com

    NLP Progress という素晴らしいリポジトリを見つけました。整理の意味を込めてまとめます。 NLPの種々のタスクとそのSOTAが掲載されています。 NLPのベンチマークとなる有名なデータセットも一緒に紹介されており,NLP論文を読むうえで大きな助けとなってくれるでしょう。 2. 質問応答 QA (Question Answering) 概要 質問に正しく応答するタスク. さまざまな問題設定が存在し, それぞれに対してアプローチも異なるため, ここで独立した項として扱う. 2-1. 択一式問題への回答 概要 問題文と選択肢が与えられ, 正解を選択肢から一つ選ぶ. データセット例 英語 ARC (AI2 Reasoning Challenge) Dataset Easy Set: 小学校〜高校レベルの知識を想定した択一式問題. Challenge Set: 単純な検索ベースや共起ベース

    • テクノロジー
    • 2021/07/05 07:15
    • あとで読む
    • SentencePieceでの日本語分かち書きをTransformersのパイプラインに組み込む - radiology-nlp’s blog

      5 users

      radiology-nlp.hatenablog.com

      背景 PyTorchでHugging Face Transformersを使って自然言語処理を行うとき,文章をモデルに入力するためにはまず単語単位に分かち書き (tokenize) しなければなりません. この前処理が思ったよりもやっかいなのです. 事前学習済みのモデルをTransformers公式から提供されているものから選んでしまえば,ここはあまり問題になりません.Transformers付属のtokenizerを使って一発で分かち書きできるからです. 実際,東北大からTransformersを通じて日本語BERT事前学習済みモデルが公開されて久しいので,日本語BERTモデルを使うのはだいぶ楽になりました. huggingface.co しかし,別の事前学習済みの日本語BERTモデルで,Transformersのプラットフォームに載っていないものはいくつか存在します. これらのモデルを

      • テクノロジー
      • 2021/06/08 08:01
      • python
      • spaCyで文字単位のNERアノテーションを単語単位に変換する - radiology-nlp’s blog

        5 users

        radiology-nlp.hatenablog.com

        はじめに 固有表現抽出 (Named Entity Recognition (NER)) は,英語データに対して行う場合,基本的に単語単位の系列ラベリングタスクとなります. このため,データセットもあらかじめ単語単位でラベル付けされていると便利です. しかし,世の中には残念ながら単語単位でラベル付けされていない場合も沢山あります. たとえば brat でアノテーションされたデータセットでは,各ラベルの位置は文書頭から「何単語目か」ではなく「何文字目」で表されています(!) そこで,spaCyを用いて文字単位のNERデータセットを単語単位に素早く変換してみました. 動作環境 python v3.6.4 beautifulsoup4 v4.9.3 spacy v2.1.9 pandas v1.1.5 対象データ ここでは i2b2 2012 shared task を例にとります. https

        • テクノロジー
        • 2021/04/28 17:46
        • python
        • 日本語BERTモデルをPyTorch用に変換してfine-tuningする with torchtext & pytorch-lightning - radiology-nlp’s blog

          48 users

          radiology-nlp.hatenablog.com

          TL;DR ①TensorFlow版訓練済みモデルをPyTorch用に変換した (→方法だけ読みたい方はこちら) ②①をスムーズに使うための torchtext.data.Dataset を設計した ③PyTorch-Lightningを使ってコードを短くした はじめに 日本語Wikipediaで事前学習されたBERTモデルとしては, 以下の2つが有名であり, 広く普及しています: SentencePieceベースのモデル (Yohei Kikuta さん提供) TensorFlow版 Juman++ベースのモデル (京大黒橋研提供) TensorFlow版 PyTorch版(Hugging Face transformers準拠) このうち, SentencePieceベースのものは現在TensorFlow版のみの提供となっており, PyTorch版は存在しません。 そのため, 私のよう

          • テクノロジー
          • 2020/01/18 02:03
          • nlp
          • PyTorch
          • 機械学習
          • BERT
          • note

          このページはまだ
          ブックマークされていません

          このページを最初にブックマークしてみませんか?

          『radiology-nlp.hatenablog.com』の新着エントリーを見る

          キーボードショートカット一覧

          j次のブックマーク

          k前のブックマーク

          lあとで読む

          eコメント一覧を開く

          oページを開く

          はてなブックマーク

          • 総合
          • 一般
          • 世の中
          • 政治と経済
          • 暮らし
          • 学び
          • テクノロジー
          • エンタメ
          • アニメとゲーム
          • おもしろ
          • アプリ・拡張機能
          • 開発ブログ
          • ヘルプ
          • お問い合わせ
          • ガイドライン
          • 利用規約
          • プライバシーポリシー
          • 利用者情報の外部送信について
          • ガイドライン
          • 利用規約
          • プライバシーポリシー
          • 利用者情報の外部送信について

          公式Twitter

          • 公式アカウント
          • ホットエントリー

          はてなのサービス

          • はてなブログ
          • はてなブログPro
          • 人力検索はてな
          • はてなブログ タグ
          • はてなニュース
          • ソレドコ
          • App Storeからダウンロード
          • Google Playで手に入れよう
          Copyright © 2005-2026 Hatena. All Rights Reserved.
          設定を変更しましたx