自我對弈微調(SPIN)因為能透過自我互動提升大型語言模型(LLMs)而受到關注,但在文本轉 SQL 模型上應用時遇到挑戰。目前的框架缺乏有效的反饋機制,難以捕捉自然語言問題與資料庫架構的關聯。為了解決這些問題,我們提出了 ExSPIN,一種新穎的自我對弈微調方法,並加入明確的反饋機制。ExSPIN 利用 LLM 預測的 SQL 查詢執行結果來更新模型參數,改善微調效果,並透過上下文學習提供架構提示,幫助 LLM 理解資料庫與自然語言查詢的聯繫。評估結果顯示,ExSPIN 在兩個真實世界數據集上表現優於現有方法。
PubMed
DOI
♡