“言語モデルに日本語の文字や単語などの語彙を1万6000件追加したうえで、トレーニングに用いる日本語データを新たに作成して継続事前学習を行って、Llama 2の高い言語処理能力を維持しつつ日本語能力を強化すること”

deejayrokadeejayroka のブックマーク 2023/12/23 13:15

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

日本語能力に優れた商用利用可能な大規模言語モデル「Swallow」が公開される

    東京工業大学(東工大)と産業技術総合研究所(産総研)の研究チームが日語に強い大規模言語モデル「Swallow」を公開しました。LLAMA 2 Community Licenseで提供されており、月間アクティブユーザーが7億人未満の場...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう