タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

機械学習と生成AIに関するyamadarのブックマーク (1)

  • 東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開

    東京工業大学(東工大)と産業技術総合研究所(産総研)の両者は12月19日、現在公開されている中で、日語に強い生成AIの基盤である「大規模言語モデル」(LLM)としては最大規模となる「Swallow」を、米・MetaのLLM「Llama 2」の日語能力を拡張することで構築し、Webサイト「TokyoTech-LLM」にて一般公開したこと、またオープンで商用利用も可能なことを共同で発表した。 同成果は、東工大 情報理工学院 情報工学系の岡崎直観教授、同・横田理央教授、産総研の共同研究チームによるもの。今回、東工大は主にデータの語彙拡張によるモデル学習・推論効率の改善に取り組み、産総研はモデル構築に必須である大規模計算資源としてAI橋渡しクラウド(ABCI)を提供すると同時に、主に継続学習によるモデルの日語能力の改善を担当したとしている。 産総研のAI橋渡しクラウド「ABCI」(出所:東工

    東工大など、日本語に強い大規模言語モデル「Swallow」を無償で公開
    yamadar
    yamadar 2024/01/14
    『日本語コーパスのみで事前学習された同規模の日本語LLMよりも高い性能を示すことから、継続事前学習の有効性が明らかになった』へー、面白い
  • 1