“言語モデルに日本語の文字や単語などの語彙を1万6000件追加したうえで、トレーニングに用いる日本語データを新たに作成して継続事前学習を行って、Llama 2の高い言語処理能力を維持しつつ日本語能力を強化すること”

deejayroka のブックマーク 2023/12/23 13:15

<blockquote class="hatena-bookmark-comment"><a class="comment-info" href="https://b.hatena.ne.jp/entry/4746719996299499727/comment/deejayroka" data-user-id="deejayroka" data-entry-url="https://b.hatena.ne.jp/entry/s/gigazine.net/news/20231221-japanese-llm-swallow/" data-original-href="https://gigazine.net/news/20231221-japanese-llm-swallow/" data-entry-favicon="https://cdn-ak2.favicon.st-hatena.com/64?url=https%3A%2F%2Fgigazine.net%2Fnews%2F20231221-japanese-llm-swallow%2F" data-user-icon="/users/deejayroka/profile.png">日本語能力に優れた商用利用可能な大規模言語モデル「Swallow」が公開される</a><ul class="comment-tag" style="list-style: none; margin: 0px;"><li style="float: left">[<a href="https://b.hatena.ne.jp/q/%E4%BA%BA%E5%B7%A5%E7%9F%A5%E8%83%BD">人工知能</a>]</li><li style="float: left">[<a href="https://b.hatena.ne.jp/q/techfeed">techfeed</a>]</li></ul><br><p style="clear: left">“言語モデルに日本語の文字や単語などの語彙を1万6000件追加したうえで、トレーニングに用いる日本語データを新たに作成して継続事前学習を行って、Llama 2の高い言語処理能力を維持しつつ日本語能力を強化すること”</p><a class="datetime" href="https://b.hatena.ne.jp/deejayroka/20231223#bookmark-4746719996299499727"><span class="datetime-body">2023/12/23 13:15</span></a></blockquote><script src="https://b.st-hatena.com/js/comment-widget.js" charset="utf-8" async></script>

このブックマークにはスターがありません。
最初のスターをつけてみよう！