エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
製造業特化LLMを開発するための評価ベンチマーク - CADDi Tech Blog
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
製造業特化LLMを開発するための評価ベンチマーク - CADDi Tech Blog
本記事は CADDi Tech/Product Advent Calendar 2025 22日目の記事です。 こんにちは、Data & Analysis部... 本記事は CADDi Tech/Product Advent Calendar 2025 22日目の記事です。 こんにちは、Data & Analysis部で機械学習エンジニアをしている由川です。 私は、製造業特化LLMを開発するための評価ベンチマークづくりに取り組んでいます。本記事では、この取り組みにおいて得られた知見や苦労していることを紹介したいと思います。 ドメイン特化LLMに関する評価ベンチマークを作ろうとしている方の参考になれば幸いです。 なぜ製造業特化の評価ベンチマークを作るのか ベンチマークタスクの定義 ベンチマークタスクのデータセット作成 評価対象となる図面の選定 評価対象の図面をアノテーション ベンチマークタスクの評価 評価方法 評価指標 ベンチマークタスクの評価システム まとめ なぜ製造業特化の評価ベンチマークを作るのか 以下のとおり活用するためです。 ベンチマークでの

