エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
1 userがブックマーク
1
Shion Honda on X: "15Tトークンからなる高品質なデータセットであるFineWebの作成方法を解説した記事。重複削除の方法や各種フィルタについて対照実験を行うことで、CommonCrawlから学習効率の良いサンプルを抽出した。 🍷 FineWeb: decanting the web for the finest text data at scale https://t.co/b0itUa30jk https://t.co/hfTixHrvHw"
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
いまの話題をアプリでチェック!
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
2024/06/03 リンク