記事へのコメント4

    • 注目コメント
    • 新着コメント
    misshiki
    misshiki 論文 “Retentive Network: 大規模言語モデル用の Transformer の後継” 略称がRetNet。性能がすごいと話題みたい。

    2023/07/19 リンク

    その他
    razokulover
    razokulover これかTransformer越えと噂のモデルの論文は

    2023/07/19 リンク

    その他
    secondlife
    secondlife 本当にこの性能なら革新的すぎるなぁ。論文では学習SetupのGPUにCUDAやTPUではなくAMDのを使っているのも興味深かった。AMDもMLやLLM向けにGPU売りたいもんね。

    2023/07/19 リンク

    その他
    stealthinu
    stealthinu RetNetの論文。O(1)でTransformerと同等性能以上のことができるしメモリも食わないし学習速度も何倍も速いらしい。そんな夢みたいな話ある?ほんとなら2030年以内どころじゃなく人間超えるぞ。

    2023/07/18 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    Retentive Network: A Successor to Transformer for Large Language Models

    In this work, we propose Retentive Network (RetNet) as a foundation architecture for large langua...

    ブックマークしたユーザー

    • macro15972023/07/29 macro1597
    • Ooo2023/07/24 Ooo
    • daikikohara2023/07/23 daikikohara
    • ttsurumi2023/07/20 ttsurumi
    • tukitukihika2023/07/20 tukitukihika
    • Hiro_Matsuno2023/07/20 Hiro_Matsuno
    • misshiki2023/07/19 misshiki
    • y_tag2023/07/19 y_tag
    • sakito09022023/07/19 sakito0902
    • razokulover2023/07/19 razokulover
    • yyamano2023/07/19 yyamano
    • yuiseki2023/07/19 yuiseki
    • secondlife2023/07/19 secondlife
    • saitodevel012023/07/19 saitodevel01
    • Nyoho2023/07/19 Nyoho
    • ichan2023/07/18 ichan
    • stealthinu2023/07/18 stealthinu
    • seapig_dolphin2023/07/18 seapig_dolphin
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - 学び

    いま人気の記事 - 学びをもっと読む

    新着記事 - 学び

    新着記事 - 学びをもっと読む

    同時期にブックマークされた記事