原始文章

這項研究探討大型語言模型(LLMs)在醫療應用中的準確性與能耗之間的平衡,特別分析了Meta的Llama 2和LMSYS Org的Vicuna 1.5。研究使用印第安納大學的胸部X光影像資料庫,發現Vicuna 1.5在效率和準確率上表現優於Llama 2。Llama 2的70B模型能耗是7B版本的七倍,但準確率卻較低,效率比僅22.30。結論指出,較小且經過微調的LLMs在醫療應用中更具可持續性,強調選擇模型的重要性,需平衡性能與環境影響。 PubMed DOI


站上相關主題文章列表

大型語言模型(LLMs)有潛力改變醫學,提升診斷和臨床決策。成功整合需要應對醫學領域的挑戰,包括遷移學習、微調、強化學習、跨學科合作、教育、評估、倫理、隱私和法規。透過全面方法和跨學科合作,LLMs能負責任地融入醫療實踐,造福患者並改善健康結果。 PubMed DOI

醫學界對於運用大型語言模型(LLMs)越來越感興趣,但關鍵在於如何主動地發展這些工具在醫學上的應用。雖然LLMs驅動的程式被應用在醫學任務上,卻缺乏在醫療紀錄上的訓練和效益驗證。為確保這些工具在醫學領域有效運用,提供相關訓練資料、明確效益需求,並在實際環境中評估其表現至關重要。 PubMed DOI

LLMs可協助自動化醫療行政工作,減輕醫師電子病歷負擔,提升病人護理。應注意安全、隱私、法規合規,並強調LLMs應輔助而非取代人類關懷。結合LLMs與專業知識可提升病人護理品質。在臨床環境中謹慎實施LLMs至關重要。 PubMed DOI

研究利用大型語言模型協助臨床醫生問心臟超聲心動圖報告,提升對複雜心臟病患見解,增進患者護理效率。研究收集西奈山醫療體系10年數據,每患者有10份報告。LLM模型LLaMA-2 70B回答問題準確率達90%,尤其在嚴重程度評估和診斷檢索表現較佳。研究顯示使用LLM解釋心臟超聲心動圖數據有效,比傳統搜索更佳,提高臨床決策和研究效率。 PubMed DOI

這篇文章討論了大型語言模型(LLMs)如何簡化醫學資訊、改善醫患溝通、自動摘要文章、分析數據,強化心血管護理和研究。探討了LLMs在醫學上的應用、限制和挑戰,提供心血管專業人員實用指南。也思考了LLMs對心血管護理和研究的未來影響。 PubMed DOI

這項研究探討小型大型語言模型(sLLM)在從病理報告中提取關鍵資訊的效果。使用三個版本的Llama 2模型,參數從70億到700億不等,並在零樣本和五樣本學習情境下進行評估。結果顯示,700億參數的模型在五樣本情境下表現優異,顯示sLLM能有效提升數據提取的效率與準確性。研究強調範例學習的重要性,並討論模型大小、準確性及處理時間的權衡,支持在臨床環境中應用先進語言模型,以改善病人護理和生物醫學研究。 PubMed DOI

這項研究探討了如何在有限計算資源下,利用非專有的大型語言模型(LLMs)協助醫療專業人員撰寫德語醫療文本。研究團隊訓練了四個擁有70億參數的模型,並與商業模型Claude-v2進行比較。結果顯示,BLOOM-CLP-German模型在自動評估中表現最佳,且在專家評估中,有93.1%的生成報告被認為可用,僅需少量修改。這顯示即使資源有限,仍能生成適合臨床的醫療文檔,強調選擇非英語模型時需考慮目標語言的重要性。 PubMed DOI

這篇文章強調在醫療和研究領域中,如何安全有效地使用大型語言模型(LLMs),特別是對於經驗較少的專業人士。文中列出六個實用案例,包括自訂翻譯、精煉文本、生成概述、編纂想法、創建個性化教育材料,以及促進智識討論。此外,還提供了一些使用AI工具的注意事項和策略。儘管面臨挑戰,將LLMs整合進醫療和研究工作中,能有效提升生產力和效率。 PubMed DOI

這項研究探討了微調開源大型語言模型(LLMs)在醫學證據總結方面的潛力,與專有模型相比,開源模型雖然表現較弱,但提供了更高的透明度和自訂性。研究人員使用MedReview基準數據集對三個流行的開源LLMs進行微調,結果顯示微調後的LongT5在零樣本設定中接近GPT-3.5的表現,且一些小型微調模型甚至超越了大型零樣本模型。這些改進在人工評估和模擬GPT-4的評估中均有明顯體現。 PubMed DOI

這項研究介紹了一個開源流程,利用本地的大型語言模型(LLM)"Llama 2" 從臨床文本中提取定量數據,專注於識別失代償性肝硬化的特徵。研究在MIMIC IV數據集中測試500名患者的病歷,成功識別五個關鍵臨床特徵,敏感度達100%,特異度96%。此外,對其他病症的檢測也相當高,顯示出本地部署的LLM在提取臨床信息方面的有效性,且硬體需求低。 PubMed DOI