原始文章

在生物學的數據分析領域,專家短缺影響了對複雜生物過程的理解及新療法的開發。為了解決這個問題,我們推出了名為 mergen 的 R 套件,利用大型語言模型(LLMs)來生成和執行數據分析代碼。研究人員只需用簡單文字描述分析目標,系統便能透過提示和反饋改善代碼生成。我們的評估顯示,雖然 LLMs在某些任務上有效,但在複雜分析中仍有挑戰。自我修正機制顯著提升了可執行代碼的生成比例,對於複雜度等級 2 和 3 的任務分別提高了 22.5% 和 52.5%。這項研究增進了對 LLM 能力的理解,並提供了實用的整合見解。 PubMed DOI


站上相關主題文章列表

這項研究探討使用一個大型語言模型(GPT-4)來自動化系統性文獻回顧和網絡荟萃分析中的數據提取、程式碼生成和結果解釋。該模型在提取數據和生成腳本方面表現出高準確性,有潛力節省時間並減少錯誤。雖然需要定期進行技術檢查,但未來大型語言模型的改進可能進一步增強自動化效果。 PubMed DOI

LLMs在臨床試驗文件生成上有潛力。輝瑞挑戰使用LLMs自動化臨床試驗文件,尤其是為CSRs創建安全表摘要。評估顯示性能差異,特別是在事實準確性和寫作風格方面。團隊多使用GPT模型,改進方向包括表格輸入、上下文添加和微調。挑戰結果顯示LLMs在自動化CSRs中表格摘要有潛力,強調需優化人類輸入和持續研究。 PubMed DOI

大型語言模型(LLMs)透過互動式學習,可改善醫學生的生物信息學教育。提供程式碼範本、解釋編碼元素、幫助解決錯誤,提升教育成果。LLMs在醫學研究中的應用已有案例。但內容可靠性需驗證。結合LLMs與傳統教學,有助醫學生應對生物信息學挑戰。 PubMed DOI

大型語言模型(LLMs)在醫學和臨床資訊學中扮演重要角色,能幫助突破和個人化治療。透過分析複雜的生物數據,揭示基因組學、蛋白質結構和健康記錄中的隱藏模式,對基因組分析、藥物開發和精準醫學有所助益。然而,必須面對數據偏見、隱私和道德等挑戰,才能負責任地應用。克服這些障礙將帶來分子生物學和製藥研究的重大進展,造福個人和社區。 PubMed DOI

預先訓練的大型語言模型(LLMs)在改善程式碼生成方面取得重大進展,尤其在生物資訊領域。BioCoder基準評估LLMs在生成生物資訊專用程式碼的表現,包括各種生物資訊任務。研究指出,長提示和領域知識對成功表現至關重要,並展示了訓練數據集對模型性能的提升。所有測試資源可在GitHub上找到。 PubMed DOI

這項研究探討生成性大型語言模型(LLMs)在分析公共健康相關社交媒體內容的可行性,特別是疫苗言論。研究發現,LLMs通常能有效識別人類專家所關注的主題,且錯誤信息出現率較低。雖然LLMs的分析深度不及人類專家,但專家認為其生成的主題仍然合理且相關。總體來看,LLMs在處理健康相關社交媒體內容方面展現出顯著潛力,未來可能有助於公共健康策略的制定與社區關注的理解。 PubMed DOI

這項研究探討了大型語言模型(LLMs),如ChatGPT-4o、ChatGPT-3.5和Google Gemini,在輔助放射學研究中的效能。進行了兩個實驗: 1. **生物統計學與數據視覺化**:測試LLMs在建議生物統計檢定和生成R程式碼的能力。ChatGPT-4o表現最佳,正確回答7個問題,且生成的程式碼錯誤較少。 2. **深度學習**:評估這些模型在生成影像分類模型的Python程式碼的能力。ChatGPT-4o和Gemini都能生成初始程式碼,並透過互動修正錯誤。 總體而言,LLMs對放射學研究有幫助,但使用者需驗證生成的程式碼以避免錯誤。 PubMed DOI

核糖體剖析(Ribo-seq)是一項能深入了解蛋白質合成的技術,但分析過程對於沒有生物資訊背景的人來說相當複雜。基於大型語言模型的聊天機器人,透過自然語言處理,提供了一個解決方案。本篇評論探討了Ribo-seq分析與聊天機器人技術的結合,強調其在數據分析和結果解釋上的潛力。雖然目前尚無實際應用範例,但未來這些技術有望克服分析障礙,推進對基因表達的理解。不過,模型偏見和數據隱私等問題仍需解決。 PubMed DOI

大型語言模型(LLMs)正在改變生物醫學科學,特別是在理解生物序列方面。基因組語言模型(gLMs)專注於DNA序列,能幫助預測基因組中重要的功能區域、設計新DNA序列,並促進轉移學習。儘管如此,開發有效的gLMs仍面臨挑戰,如數據質量、模型架構及評估指標等。解決這些問題對於gLMs在複雜生物系統中的應用至關重要。 PubMed DOI

大型語言模型有潛力改變科學數據的分析與溝通,但在準確性上仍有挑戰。洛瑞特腦研究所與塔爾薩大學開發的LITURAt系統,透過整合外部數據檢索和分析工具,旨在提供可靠的輸出,讓專家與非專家都能輕鬆使用。研究顯示,LITURAt在查詢一致性和準確性上表現優異,能改善科學數據分析的可及性。儘管有些限制,LITURAt仍顯示出促進數據驅動見解民主化的潛力。 PubMed DOI