タグ

ブックマーク / radiology-nlp.hatenablog.com (2)

  • 論文紹介: SentencePieceの原著論文+α - radiology-nlp’s blog

    はじめに 2018年に登場したニューラル言語処理のための教師なしサブワード分割モジュール,SentencePiece。 開発意図や仕様を確認するために原著論文を読みました。 github.com 論文は2018年8月にarXivに投稿されています。 arxiv.org 著者・開発者はMeCab開発者でもある工藤拓さん。自然言語処理に関心のある方で知らない人はいないでしょう。 github.com 1冊まるごと形態素解析という驚異的なも執筆されています。 形態素解析の理論と実装 (実践・自然言語処理シリーズ) 作者: 工藤拓,言語処理学会出版社/メーカー: 近代科学社発売日: 2018/10/04メディア: 単行この商品を含むブログを見る 背景 基的事項をいくつか確認します。 SentencePieceは与えられた文章をサブワードに分割するモデルであり, コーパスからの教師なし学習が可

    論文紹介: SentencePieceの原著論文+α - radiology-nlp’s blog
    sh19910711
    sh19910711 2024/04/22
    "SentencePiece: 文法体系や言語学的観点からみて妥当な分割をするとは限りません(そのような設計を目指していません) > 単位は「形態素」ではなく単に「サブワード」と呼ばれることが多い" arXiv:1808.06226 2019
  • 奈良先端大に国内留学して2ヶ月経ちました 〜生活環境の備忘録〜 - radiology-nlp’s blog

    いま私は医学博士課程2年目で,社会人大学院生のような立場なのですが,4月から半年間仕事をストップして,NAIST荒牧研に特別研究学生として医療言語処理を学びに国内留学しています. 大まかな理由は以下のとおりです. いまの環境が相当厳しい 自然言語処理に詳しい人が周囲におらず,相談相手がいない 論文を読んでつまずいた日も,実装につまずいた日も,ひたすら独学 病院で週5日働いており時間的制約が大きい 仕事を終えて研究室に直行して深夜1時すぎに帰る生活,お正月も毎日研究室に行っていた しかし,研究成果をあげるチャンスは今しかない まだ医療言語処理が流行り始めたばかりのタイミングなので,今ならギリギリ開拓者になれる おそらく3年後にはもう red ocean になっているはず 今のゆっくりした成長速度では先行者として走りつづけることができない 半年間収入はゼロになるし,専門医取得などのキャリアも一

    奈良先端大に国内留学して2ヶ月経ちました 〜生活環境の備忘録〜 - radiology-nlp’s blog
    sh19910711
    sh19910711 2021/04/29
    "日替わり定食は11:30販売開始. 数に限りがある / 日替わり定食が売り切れていた場合は通常メニューから選ぶことになる / 日替わり定食を逃し続けると週に5回くらい親子丼を食べることになる"
  • 1