エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
LLMで行数の多い日本語CSVを扱うための前処理
見ると分かると思うのですが、 1つ厄介なのは、日付の書き方など、 プログラムを使った検索やフィルタリ... 見ると分かると思うのですが、 1つ厄介なのは、日付の書き方など、 プログラムを使った検索やフィルタリングのしにくい値が表に含まれている のが分かります。 そしてこれと合わせ技で厄介なのが、 行数がめちゃくちゃ多くてLLMのプロンプトにすべてのデータを入れることができない という場合です。 1万行とかあるようなExcelのデータをすべてプロンプトに含めるのは現実的ではありません。このような場合、大抵はLLMに必要となるデータにアクセスするためのコードをpandas等を用いて書いてもらって、それを実行することでデータをフィルタリングするという方法を取るかと思います。 しかし上記のような表で、例えば日付のカラムから「〇月×日以降のデータがほしい」というような日付検索を行うとなると、日本語の日付の順序を理解する必要があり、さらにカラム内で書き方が一様ではないケースも考えられ、いろんな書き方に対応で

