在生物學的數據分析領域,專家短缺影響了對複雜生物過程的理解及新療法的開發。為了解決這個問題,我們推出了名為 mergen 的 R 套件,利用大型語言模型(LLMs)來生成和執行數據分析代碼。研究人員只需用簡單文字描述分析目標,系統便能透過提示和反饋改善代碼生成。我們的評估顯示,雖然 LLMs在某些任務上有效,但在複雜分析中仍有挑戰。自我修正機制顯著提升了可執行代碼的生成比例,對於複雜度等級 2 和 3 的任務分別提高了 22.5% 和 52.5%。這項研究增進了對 LLM 能力的理解,並提供了實用的整合見解。
PubMed
DOI