搜尋結果

使用者輸入	Fine Tuning of LLM 應用於實證醫學 (時間範圍: all)
轉換句	Fine tuning large language models in evidence-based medicine, Applications of fine-tuned LLMs in clinical research, Impact of fine-tuning language models on medical evidence analysis
執行時間	4.5915 秒
花費Token	147

Benchmarking Large Language Models in Evidence-Based Medicine.
基於證據的醫學中大型語言模型的基準測試。 IEEE J Biomed Health Inform / / 2024-10-22

這項研究探討如何將大型語言模型（LLMs）整合進證據基礎醫學（EBM），以自動化任務如證據檢索和傳播，來提升臨床決策。研究比較了七個LLMs的表現，結果顯示這些模型在理解和總結方面表現優異，知識引導的提示也顯著提升了效果。不過，在命名實體識別和事實準確性上仍面臨挑戰，需要進一步研究和質量控制才能應用於臨床。研究結果和代碼已在GitHub上公開。 PubMed DOI

Closing the gap between open source and commercial large language models for medical evidence summarization.
縮小開源與商業大型語言模型在醫學證據總結之間的差距。 NPJ Digit Med / / 2024-09-09

這項研究探討了微調開源大型語言模型（LLMs）在醫學證據總結方面的潛力，與專有模型相比，開源模型雖然表現較弱，但提供了更高的透明度和自訂性。研究人員使用MedReview基準數據集對三個流行的開源LLMs進行微調，結果顯示微調後的LongT5在零樣本設定中接近GPT-3.5的表現，且一些小型微調模型甚至超越了大型零樣本模型。這些改進在人工評估和模擬GPT-4的評估中均有明顯體現。 PubMed DOI

Closing the gap between open-source and commercial large language models for medical evidence summarization.
縮小開源與商業大型語言模型在醫學證據總結之間的差距。 ArXiv / / 2024-10-07

這項研究探討如何透過微調提升開源大型語言模型（LLMs）在醫學證據摘要的表現。雖然專有模型通常更有效，但也存在透明度不足和依賴供應商的風險。研究人員使用包含8,161對系統性回顧摘要的MedReview數據集，對三個開源模型—PRIMERA、LongT5和Llama-2進行微調。結果顯示，微調後這些模型的表現顯著提升，特別是LongT5在零樣本設定中表現接近GPT-3.5，甚至有些小型模型超越了大型模型。這顯示微調開源LLMs能有效提升其在專業任務中的表現，成為專有模型的可行替代方案。 PubMed DOI

Large Language Models to Help Appeal Denied Radiotherapy Services.
大型語言模型協助上訴被拒的放射治療服務。 JCO Clin Cancer Inform / / 2024-09-09

這項研究評估了多種大型語言模型（LLMs）在協助醫生對放射治療保險拒絕上訴的表現。測試的模型包括GPT-3.5、GPT-4及其具網路搜尋能力的版本。研究使用20個模擬病歷進行評估，結果顯示GPT-3.5、GPT-4和GPT-4web能產生清晰且具臨床相關性的上訴信，對加速上訴過程有幫助。相對而言，經微調的GPT-3.5ft表現較差，且所有模型在引用文獻時均有困難。整體而言，LLMs可減輕醫生的文書負擔，但小型數據集微調可能影響性能。 PubMed DOI

Fine-Tuned Large Language Model for Extracting Patients on Pretreatment for Lung Cancer from a Picture Archiving and Communication System Based on Radiological Reports.
基於放射學報告的圖像存檔和通訊系統，用於提取肺癌預處理患者的精細調校大型語言模型。 J Imaging Inform Med / / 2024-07-02

這項研究比較了一個經過微調的大型語言模型（LLM）與放射科醫師在從放射學報告中識別肺癌預防治療患者方面的表現。LLM在分類患者方面表現出高準確度和敏感度，與放射科醫師相似，但處理時間更快。研究結果表明，LLM能夠有效地及時從醫療記錄中提取相關信息。 PubMed DOI

Off-the-shelf Large Language Models (LLM) Are Of Insufficient Quality To Provide Medical Treatment Recommendations, While Customization of LLMs Result In Quality Recommendations.
現成的大型語言模型 (LLM) 在提供醫療治療建議方面的質量不足，而定制化的 LLM 則能產生高質量的建議。 Arthroscopy / / 2024-10-05

現成的大型語言模型（LLMs）在準確性上常反映互聯網上的不準確資訊，對於常見的肌肉骨骼疾病，治療建議的錯誤率高達30%。這顯示出諮詢專家的必要性。定制的LLMs則能整合各醫學領域的專業知識，方法包括： 1. **提示工程**：設計特定提示以獲得更佳回應。 2. **檢索增強生成（RAG）**：從目標數據集中檢索相關資訊。 3. **微調**：調整模型以理解醫療術語。 4. **代理增強**：利用軟體協調多個LLMs，優化輸出並引入人類監督。這些定制的LLMs幫助醫生在數位環境中重新掌握權威，確保醫療專業知識的準確性。 PubMed DOI

Large Language Model Influence on Management Reasoning: A Randomized Controlled Trial.
大型語言模型對管理推理的影響：一項隨機對照試驗。 medRxiv / / 2024-08-16

使用大型語言模型（LLM）能顯著提升醫生在複雜管理推理任務上的表現，超越傳統資源。在一項針對92位醫生的隨機對照試驗中，使用GPT-4的醫生在管理推理任務中得分較高。研究顯示，LLM的協助能改善管理決策、診斷決策及特定案例的表現，顯示其在複雜臨床情境中做出決策的能力，特別是在缺乏明確答案的情況下。 PubMed DOI

Fine-Tuning Large Language Models to Enhance Programmatic Assessment in Graduate Medical Education.
微調大型語言模型以增強研究生醫學教育中的程式性評估。 J Educ Perioper Med / / 2024-10-02

這項研究探討了訓練大型語言模型（LLMs）來根據美國住院醫師教育認證委員會（ACGME）的標準分類受訓者的反饋。研究發現，雖然複雜的模型未必能提高分類準確率，但較小的模型如BERT-mini在性能上與FastText相當，且在個人設備上部署時更具優勢，能提升速度和數據隱私。這項研究有助於理解如何有效整合LLMs於醫學教育中。 PubMed DOI