原始文章

這篇論文探討將大型語言模型(LLMs)整合進基因改進(GI)框架的可能性,並基於先前的研究,結合Gin Java GI工具包與OpenAI LLMs,生成JCodec工具的程式碼編輯。研究評估了三種不同的LLMs和提示,涵蓋五個真實軟體專案。結果顯示,LLMs生成的編輯雖然數量較少,但成功編譯和通過測試的機率較高,OpenAI模型達77%的成功率。簡單提示的效果優於複雜提示。質性分析指出LLM編輯的常見失敗點,顯示LLMs在GI搜尋過程中有潛力,但仍需克服有效性挑戰。 PubMed DOI


站上相關主題文章列表

這項研究探討大型語言模型(LLMs)在粒子加速器自動調整的應用,傳統上需要專業的優化和機器學習知識。研究顯示,LLMs能透過簡單的自然語言提示有效調整加速器子系統,並與先進的優化技術如貝葉斯優化和強化學習進行比較。結果顯示,LLMs能處理複雜的非線性數值優化,顯示其在日常操作中簡化自動調整算法的潛力,並可能促進自動化技術在加速器系統的應用。 PubMed DOI

大型語言模型(LLMs)正在改變生物醫學科學,特別是在理解生物序列方面。基因組語言模型(gLMs)專注於DNA序列,能幫助預測基因組中重要的功能區域、設計新DNA序列,並促進轉移學習。儘管如此,開發有效的gLMs仍面臨挑戰,如數據質量、模型架構及評估指標等。解決這些問題對於gLMs在複雜生物系統中的應用至關重要。 PubMed DOI

這項研究提出了一個新框架,結合大型語言模型(LLMs)和遺傳演算法(GAs),用來優化酶的設計,解決蛋白質序列及功能的複雜挑戰。研究人員透過大量蛋白質序列數據,找出影響酶結構和功能的氨基酸關係,並利用遺傳演算法有效搜尋能提升催化性能的酶序列。測試結果顯示,生成的酶突變體在90%的案例中超越野生型酶,並維持相似的結構特徵,顯示這種方法的有效性,推進了生物催化劑設計的計算方法。 PubMed DOI

在生物學的數據分析領域,專家短缺影響了對複雜生物過程的理解及新療法的開發。為了解決這個問題,我們推出了名為 mergen 的 R 套件,利用大型語言模型(LLMs)來生成和執行數據分析代碼。研究人員只需用簡單文字描述分析目標,系統便能透過提示和反饋改善代碼生成。我們的評估顯示,雖然 LLMs在某些任務上有效,但在複雜分析中仍有挑戰。自我修正機制顯著提升了可執行代碼的生成比例,對於複雜度等級 2 和 3 的任務分別提高了 22.5% 和 52.5%。這項研究增進了對 LLM 能力的理解,並提供了實用的整合見解。 PubMed DOI

大型語言模型(LLMs),像是ChatGPT,已經徹底改變了學術界的科學寫作與研究,提供了全方位的支援。生成式人工智慧(GAI)工具在假設形成、方法設計、數據分析到手稿準備等各階段都有所改善。這篇評論專注於LLMs在血液學研究中的應用,特別提到提示工程和檢索增強生成(RAG)框架等技術。這些技術能幫助研究人員創造更準確的內容,並降低錯誤資訊的風險。儘管GAI工具提升了研究質量,但也強調了科學誠信、倫理考量及隱私保護的重要性。 PubMed DOI

這篇評論強調大型語言模型(LLMs)在合成生物學(SynBio)教育與研究中的重要性,特別是在生物製造領域。文章比較了美國和中國的LLMs在解決SynBio問題上的表現,並探討了它們如何從非結構化數據中提取資訊、建立知識圖譜,及促進檢索增強生成。預期LLMs將提升代謝建模和工程中的設計-建造-測試-學習(DBTL)循環,並推動自動化實驗室的發展。最後,呼籲建立LLMs的基準、發展生物安全措施,並促進相關領域專家的合作。 PubMed DOI

這篇論文探討了一種新方法,利用AI生成內容(AIGC)模型自動化生成和審查熱力學模擬程式碼,特別針對LAMMPS軟體。提出的分子動力學代理(MDAgent)框架,透過大型語言模型簡化模擬程式的創建、執行和優化。為了微調模型,開發了針對LAMMPS的熱力學模擬程式碼數據集,專家評估顯示MDAgent顯著提升程式碼生成和審查效率,平均減少42.22%的任務時間,顯示其在材料科學中的應用潛力。 PubMed DOI

這篇論文探討預訓練的大型語言模型(LLMs)與進化演算法(EAs)之間的相似性,指出兩者都涉及生成與精煉解決方案。作者在微觀層面上分析了關鍵的平行之處,如標記、個體表示、適應度及位置編碼的形成,以及變壓器中的繁殖機制。接著,作者檢視現有的跨學科研究,找出挑戰,特別是在進化微調和將LLMs整合進EAs的領域。這些研究結果旨在增進對LLMs進化機制的理解,並提出改善人工智慧代理能力的方法。 PubMed DOI

這項研究比較 GPT-4o、Llama 3.1 和 Qwen 2.5 在癌症基因變異臨床分類的表現,發現 GPT-4o 準確率最高。LLMs 在有明確證據時表現佳,但遇到證據較弱的變異時一致性較差,且容易過度分類。透過 prompt 設計和檢索增強生成可提升準確度。整體來說,LLMs 有潛力,但臨床應用還需再優化。 PubMed DOI

罕見疾病診斷困難,因資料少且基因多樣。本研究評估大型語言模型(LLMs)在基因排序的表現,發現GPT-4表現最佳,但對知名基因有偏好且受輸入順序影響。採用分批處理可提升準確度並減少偏誤,有助加快罕見疾病基因鑑定與診斷。程式碼可在 GitHub 下載。 PubMed DOI