搜尋結果

使用者輸入 Fine Tuning of LLM 應用於實證醫學 (時間範圍: all)
轉換句 Fine tuning large language models in evidence-based medicine, Applications of fine-tuned LLMs in clinical research, Impact of fine-tuning language models on medical evidence analysis
執行時間 4.5915 秒
花費Token 147
Benchmarking Large Language Models in Evidence-Based Medicine.
基於證據的醫學中大型語言模型的基準測試。 IEEE J Biomed Health Inform / / 2024-10-22

這項研究探討如何將大型語言模型(LLMs)整合進證據基礎醫學(EBM),以自動化任務如證據檢索和傳播,來提升臨床決策。研究比較了七個LLMs的表現,結果顯示這些模型在理解和總結方面表現優異,知識引導的提示也顯著提升了效果。不過,在命名實體識別和事實準確性上仍面臨挑戰,需要進一步研究和質量控制才能應用於臨床。研究結果和代碼已在GitHub上公開。 PubMed DOI

Closing the gap between open source and commercial large language models for medical evidence summarization.
縮小開源與商業大型語言模型在醫學證據總結之間的差距。 NPJ Digit Med / / 2024-09-09

這項研究探討了微調開源大型語言模型(LLMs)在醫學證據總結方面的潛力,與專有模型相比,開源模型雖然表現較弱,但提供了更高的透明度和自訂性。研究人員使用MedReview基準數據集對三個流行的開源LLMs進行微調,結果顯示微調後的LongT5在零樣本設定中接近GPT-3.5的表現,且一些小型微調模型甚至超越了大型零樣本模型。這些改進在人工評估和模擬GPT-4的評估中均有明顯體現。 PubMed DOI

Closing the gap between open-source and commercial large language models for medical evidence summarization.
縮小開源與商業大型語言模型在醫學證據總結之間的差距。 ArXiv / / 2024-10-07

這項研究探討如何透過微調提升開源大型語言模型(LLMs)在醫學證據摘要的表現。雖然專有模型通常更有效,但也存在透明度不足和依賴供應商的風險。研究人員使用包含8,161對系統性回顧摘要的MedReview數據集,對三個開源模型—PRIMERA、LongT5和Llama-2進行微調。結果顯示,微調後這些模型的表現顯著提升,特別是LongT5在零樣本設定中表現接近GPT-3.5,甚至有些小型模型超越了大型模型。這顯示微調開源LLMs能有效提升其在專業任務中的表現,成為專有模型的可行替代方案。 PubMed DOI

Large Language Models to Help Appeal Denied Radiotherapy Services.
大型語言模型協助上訴被拒的放射治療服務。 JCO Clin Cancer Inform / / 2024-09-09

這項研究評估了多種大型語言模型(LLMs)在協助醫生對放射治療保險拒絕上訴的表現。測試的模型包括GPT-3.5、GPT-4及其具網路搜尋能力的版本。研究使用20個模擬病歷進行評估,結果顯示GPT-3.5、GPT-4和GPT-4web能產生清晰且具臨床相關性的上訴信,對加速上訴過程有幫助。相對而言,經微調的GPT-3.5ft表現較差,且所有模型在引用文獻時均有困難。整體而言,LLMs可減輕醫生的文書負擔,但小型數據集微調可能影響性能。 PubMed DOI

Fine-Tuned Large Language Model for Extracting Patients on Pretreatment for Lung Cancer from a Picture Archiving and Communication System Based on Radiological Reports.
基於放射學報告的圖像存檔和通訊系統,用於提取肺癌預處理患者的精細調校大型語言模型。 J Imaging Inform Med / / 2024-07-02

這項研究比較了一個經過微調的大型語言模型(LLM)與放射科醫師在從放射學報告中識別肺癌預防治療患者方面的表現。LLM在分類患者方面表現出高準確度和敏感度,與放射科醫師相似,但處理時間更快。研究結果表明,LLM能夠有效地及時從醫療記錄中提取相關信息。 PubMed DOI

Off-the-shelf Large Language Models (LLM) Are Of Insufficient Quality To Provide Medical Treatment Recommendations, While Customization of LLMs Result In Quality Recommendations.
現成的大型語言模型 (LLM) 在提供醫療治療建議方面的質量不足,而定制化的 LLM 則能產生高質量的建議。 Arthroscopy / / 2024-10-05

現成的大型語言模型(LLMs)在準確性上常反映互聯網上的不準確資訊,對於常見的肌肉骨骼疾病,治療建議的錯誤率高達30%。這顯示出諮詢專家的必要性。定制的LLMs則能整合各醫學領域的專業知識,方法包括: 1. **提示工程**:設計特定提示以獲得更佳回應。 2. **檢索增強生成(RAG)**:從目標數據集中檢索相關資訊。 3. **微調**:調整模型以理解醫療術語。 4. **代理增強**:利用軟體協調多個LLMs,優化輸出並引入人類監督。 這些定制的LLMs幫助醫生在數位環境中重新掌握權威,確保醫療專業知識的準確性。 PubMed DOI

Large Language Model Influence on Management Reasoning: A Randomized Controlled Trial.
大型語言模型對管理推理的影響:一項隨機對照試驗。 medRxiv / / 2024-08-16

使用大型語言模型(LLM)能顯著提升醫生在複雜管理推理任務上的表現,超越傳統資源。在一項針對92位醫生的隨機對照試驗中,使用GPT-4的醫生在管理推理任務中得分較高。研究顯示,LLM的協助能改善管理決策、診斷決策及特定案例的表現,顯示其在複雜臨床情境中做出決策的能力,特別是在缺乏明確答案的情況下。 PubMed DOI

Fine-Tuning Large Language Models to Enhance Programmatic Assessment in Graduate Medical Education.
微調大型語言模型以增強研究生醫學教育中的程式性評估。 J Educ Perioper Med / / 2024-10-02

這項研究探討了訓練大型語言模型(LLMs)來根據美國住院醫師教育認證委員會(ACGME)的標準分類受訓者的反饋。研究發現,雖然複雜的模型未必能提高分類準確率,但較小的模型如BERT-mini在性能上與FastText相當,且在個人設備上部署時更具優勢,能提升速度和數據隱私。這項研究有助於理解如何有效整合LLMs於醫學教育中。 PubMed DOI