TL;DR DIN-SQLは、「質問を単語と表の関連付け」、「難易度に分類」、「SQL生成」、「微調整」の4つのモジュールでSQL生成精度を向上させる! 面白いのが、これら全てのモジュールがプロンプティングで実現されていること。 ベンチマークデータセットのSpiderとBIRDにおいて、DIN-SQLの実行精度は既存の手法を上回っている! モジュールを減らすと、精度は基本落ちる (私の感想)生成したいSQLの難易度によっては、一部のモジュールを省略してチューニングすることも有効かもしれない。 はじめに みなさん、DBはあるけれどそれをうまくLLMを使って活用したいと思ったことはありませんか? データベースを自然言語で操作できればめちゃくちゃ便利ですよね。 例えば、「去年の売上が100万円以上の顧客を抽出して」といった具合に、普段使っている言葉でデータベースに問い合わせができたら便利ですよね