“たとえば、「吾輩は猫である」という7文字のテキストが、人間には理解しにくい13トークン(<0xE5><0x90><0xBE><0xE8><0xBC><0xA9>は<0xE7><0x8C><0xAB>である)に区切られてしまう”

ledsunledsun のブックマーク 2024/01/14 09:32

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開

    東京工業大学(東工大)と産業技術総合研究所(産総研)の両者は12月19日、現在公開されている中で、日語に強い生成AIの基盤である「大規模言語モデル」(LLM)としては最大規模となる「Swallow」を、米・MetaのLLM「...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう