記事へのコメント3

    • 注目コメント
    • 新着コメント
    secondlife
    secondlife 重複を避けてのテキスト抽出手法。fasttext, minhash でのフィルタリング、等々。

    2024/06/21 リンク

    その他
    misshiki
    misshiki “FineWebは、96個のCommonCrawlスナップショットから得られたもので、他のオープンな事前学習データセットよりも優れたLLMを生成します。”

    2024/06/03 リンク

    その他
    stealthinu
    stealthinu FineWeb-Eduという非常に「綺麗」な学習データセット。FineWebからさらに絞り込んでありこのデータセットで学習すると大きく性能が上がることが示されている。

    2024/06/03 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    FineWeb: decanting the web for the finest text data at scale - a Hugging Face Space by HuggingFaceFW

    Discover amazing ML apps made by the community

    ブックマークしたユーザー

    • secondlife2024/06/21 secondlife
    • lost_and_found2024/06/04 lost_and_found
    • triceratoppo2024/06/03 triceratoppo
    • misshiki2024/06/03 misshiki
    • stealthinu2024/06/03 stealthinu
    • ZAORIKU2024/06/03 ZAORIKU
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事