LLM 相關三個月內文章 / 第 115 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究用 Python 的 LangChain 框架,評估 GPT-4o、Llama 等大型語言模型,從醫療報告自動擷取結構化資料。GPT-4o 準確率最高(91.4%),但各模型在姓名、年齡處理上有缺點。LLMs 有助提升醫療資料管理,但仍有表現不穩和幻覺等問題,未來應加強訓練資料和提示設計。 相關文章 PubMed DOI 推理

我們用先進語言模型分析八萬多篇代謝體學論文,找出20個主要研究主題,像是深度學習應用、生物標誌物發現等新趨勢。透過互動網頁(https://metascape.streamlit.app/),大家可以自己探索這些分析結果,幫助快速掌握代謝體學的最新發展。 相關文章 PubMed DOI 推理

spaLLM 是一套創新的空間多重體學分析工具,結合大型語言模型、圖神經網路和多視角注意力機制,即使基因表現資料很稀疏,也能精準辨識空間區域。它支援多種體學資料,表現優於現有主流方法,程式碼已開源於 GitHub。 相關文章 PubMed DOI 推理

LLM-EO 結合大型語言模型和演化式最佳化,能用自然語言輕鬆設計過渡金屬錯合物,支援少量樣本和多目標最佳化。它能整合各種資料,產生新穎分子,未來在化學和材料科學領域很有發展潛力。 相關文章 PubMed DOI 推理

這項研究比較三款 AI 解釋大腸癌篩檢指引的表現。DeepSeek 在在地化和邏輯細節上最好,但標準正確性待加強;ChatGPT-4o 用了舊標準,對高風險族群說明太簡略;Claude3.5 解釋詳盡但漏掉實務細節。整體來說,AI 有助提升醫療指引的易懂度,但內容仍需專家把關與倫理監督。 相關文章 PubMed DOI 推理

CAS 是專為生醫關係抽取等有嚴格結構限制任務設計的資料增強框架,利用大型語言模型產生多樣且合規的資料,並用自我評估過濾器(SemQ)確保品質與一致性。CAS 能維持資料完整性,提升模型表現,適用於多種有約束的 NLP 任務。程式碼連結:https://github.com/ngogiahan149/CAS 相關文章 PubMed DOI 推理

這項研究用GPT-3.5分析Reddit三大IBD社群5萬多則貼文,分類情緒、主題、人口資料及是否提到COVID-19。AI分類結果和人工高度一致,貼文多討論藥物和症狀,情緒偏中性。公開年齡多為20、30歲,性別分布和一般IBD患者不同。COVID-19討論初期多,後來減少。證明AI能有效分析醫療社群資料,對未來研究很有幫助。 相關文章 PubMed DOI 推理

這項研究比較GPT-3.5和GPT-4.0在巴西醫學進階測驗的表現,發現GPT-4.0平均得分(87.2%)明顯高於GPT-3.5(68.4%),提升了27.4%。特別是在基礎醫學和婦產科領域,GPT-4.0表現更突出。這顯示AI像GPT-4.0,已經對醫學教育和評量帶來明顯影響。 相關文章 PubMed DOI 推理

這篇論文評估 DeepSeek R1 在 100 個 MedQA 臨床案例的表現,診斷準確率高達 93%,展現接近專家的醫學推理能力。常見錯誤有定勢偏誤、處理矛盾資料困難、選項有限、過度思考、知識不全及跳步。研究發現,回答越簡潔(少於 5,000 字元)準確率越高。雖然還有改進空間,DeepSeek R1 已展現協助醫療決策的潛力。 相關文章 PubMed DOI 推理

大型語言模型(LLMs)已能協助篩檢、診斷及治療慢性致盲眼疾,表現媲美專家,並提升醫療可近性。但目前仍面臨泛用性不足、演算法透明度及倫理問題、缺乏標準驗證等挑戰。未來需加強專業訓練、多元資料整合、國際驗證及倫理規範,LLMs有望成為慢性眼疾管理的重要工具。 相關文章 PubMed DOI 推理