はじめに 仕事・プライベート上での様々な環境変化や私自身の変化があり、最近ではコード書かない(書けない?)おじさんになってしまいつつありますが、年末年始休暇のタイミングで LLM 周りを学んで時代にキャッチアップしたくなったので、備忘として残します。 LLM 概要をサクッと学ぶ NTT データさんの記事。概要理解のための資料としてとてもわかりやすいです。 ttya さんの連載記事。実装例も掲載されており、とてもわかりやすいです。 感情分類のお試し実装 事前学習済みモデル/トークナイザの下調べ 東北大乾研究室が公開している BERT の事前学習済みモデルを利用しているネット記事が多い。 トークナイザ: BertJapaneseTokenizer トークナイズには MeCab コーパスは Wikipedia 日本語版 github 上記載 モデルは、CC-100 データセットの日本語部分とウィ