搜尋結果

使用者輸入 Fine Tuning of LLM 應用於實證醫學 (時間範圍: all)
轉換句 Fine tuning large language models in evidence-based medicine, Applications of fine-tuned LLMs in clinical research, Impact of fine-tuning language models on medical evidence analysis
執行時間 4.5915 秒
花費Token 147
Distilling large language models for matching patients to clinical trials.
提煉大型語言模型以將患者配對至臨床試驗。 J Am Med Inform Assoc / / 2024-04-19

這項研究比較了不同大型語言模型在將病患配對到醫療臨床試驗上的效果。研究發現,當開源模型在專門的數據集上進行微調時,其表現可以與專有模型媲美。這項研究展示了開源模型在醫療應用中的潛力,並提供了一個數據集和一個經過微調的模型供公眾使用,以鼓勵在這個領域進行更多研究。 PubMed DOI

Benchmarking Large Language Models in Evidence-Based Medicine.
基於證據的醫學中大型語言模型的基準測試。 IEEE J Biomed Health Inform / / 2024-10-22

這項研究探討如何將大型語言模型(LLMs)整合進證據基礎醫學(EBM),以自動化任務如證據檢索和傳播,來提升臨床決策。研究比較了七個LLMs的表現,結果顯示這些模型在理解和總結方面表現優異,知識引導的提示也顯著提升了效果。不過,在命名實體識別和事實準確性上仍面臨挑戰,需要進一步研究和質量控制才能應用於臨床。研究結果和代碼已在GitHub上公開。 PubMed DOI

Closing the gap between open source and commercial large language models for medical evidence summarization.
縮小開源與商業大型語言模型在醫學證據總結之間的差距。 NPJ Digit Med / / 2024-09-09

這項研究探討了微調開源大型語言模型(LLMs)在醫學證據總結方面的潛力,與專有模型相比,開源模型雖然表現較弱,但提供了更高的透明度和自訂性。研究人員使用MedReview基準數據集對三個流行的開源LLMs進行微調,結果顯示微調後的LongT5在零樣本設定中接近GPT-3.5的表現,且一些小型微調模型甚至超越了大型零樣本模型。這些改進在人工評估和模擬GPT-4的評估中均有明顯體現。 PubMed DOI

Closing the gap between open-source and commercial large language models for medical evidence summarization.
縮小開源與商業大型語言模型在醫學證據總結之間的差距。 ArXiv / / 2024-10-07

這項研究探討如何透過微調提升開源大型語言模型(LLMs)在醫學證據摘要的表現。雖然專有模型通常更有效,但也存在透明度不足和依賴供應商的風險。研究人員使用包含8,161對系統性回顧摘要的MedReview數據集,對三個開源模型—PRIMERA、LongT5和Llama-2進行微調。結果顯示,微調後這些模型的表現顯著提升,特別是LongT5在零樣本設定中表現接近GPT-3.5,甚至有些小型模型超越了大型模型。這顯示微調開源LLMs能有效提升其在專業任務中的表現,成為專有模型的可行替代方案。 PubMed DOI

Evaluating large language models on medical evidence summarization.
評估大型語言模型在醫學證據摘要上的表現。 NPJ Digit Med / / 2024-04-02

LLMs(如GPT-3.5和ChatGPT)在各種任務上表現逐漸提升,包括醫學證據摘要。然而,自動評量不一定準確,人類評估發現LLMs有時會產生不準確或誤導性的摘要,尤其在醫學領域。這些模型在識別關鍵信息和處理長文本時仍有改進空間。 PubMed DOI

Evaluating Large Language Models on Medical Evidence Summarization.
評估大型語言模型在醫學證據摘要上的表現。 medRxiv / / 2023-09-04

LLMs在醫學領域的應用有潛力,但研究指出它們在生成摘要時可能不夠準確,容易出現錯誤或誤導性資訊。自動評估工具並不完全可靠,人工評估顯示在長篇文章中尤其難以辨識關鍵訊息。因此,在醫療保健領域中,我們應謹慎使用LLMs,不可全然依賴其能力。 PubMed DOI

Inductive reasoning with large language models: a simulated randomized controlled trial for epilepsy.
大型語言模型的歸納推理:一項針對癲癇的模擬隨機對照試驗。 medRxiv / / 2024-04-02

這項研究探討使用大型語言模型(LLMs)來模擬和分析癲癇治療的隨機臨床試驗。LLMs被用來產生臨床數據並分析藥物效力和報告的症狀,顯示與人類評估有密切的一致性。這表明LLMs能夠有效地總結和綜合臨床數據,為未來臨床研究提供了一個有前途的工具,而不需要專門的醫學語言培訓。 PubMed DOI

Fine-tuning Large Language Models for Rare Disease Concept Normalization.
為罕見疾病概念規範調校大型語言模型。 bioRxiv / / 2024-01-18

研究目的是透過特定語料庫微調LLaMA 2,以改進罕見疾病概念的規範化。四個模型在臨床概念上表現準確,對打字錯誤有強大的辨識能力。同義詞模型在新概念上表現較佳。研究測試了模型在SNOMED-CT同義詞上的準確度,並指出ChatGPT 3.5在某些情況下能正確識別HPO ID。這些模型展現了對拼寫錯誤和同義詞的強大辨識能力,有助於臨床敘事中辨識和規範醫學概念。 PubMed DOI

Creation and Adoption of Large Language Models in Medicine.
醫學領域中大型語言模型的創建與應用。 JAMA / / 2023-09-14

醫學界對於運用大型語言模型(LLMs)越來越感興趣,但關鍵在於如何主動地發展這些工具在醫學上的應用。雖然LLMs驅動的程式被應用在醫學任務上,卻缺乏在醫療紀錄上的訓練和效益驗證。為確保這些工具在醫學領域有效運用,提供相關訓練資料、明確效益需求,並在實際環境中評估其表現至關重要。 PubMed DOI

Large Language Models to Help Appeal Denied Radiotherapy Services.
大型語言模型協助上訴被拒的放射治療服務。 JCO Clin Cancer Inform / / 2024-09-09

這項研究評估了多種大型語言模型(LLMs)在協助醫生對放射治療保險拒絕上訴的表現。測試的模型包括GPT-3.5、GPT-4及其具網路搜尋能力的版本。研究使用20個模擬病歷進行評估,結果顯示GPT-3.5、GPT-4和GPT-4web能產生清晰且具臨床相關性的上訴信,對加速上訴過程有幫助。相對而言,經微調的GPT-3.5ft表現較差,且所有模型在引用文獻時均有困難。整體而言,LLMs可減輕醫生的文書負擔,但小型數據集微調可能影響性能。 PubMed DOI

Improving large language models for clinical named entity recognition via prompt engineering.
透過提示工程改善臨床命名實體識別的大型語言模型。 J Am Med Inform Assoc / / 2024-01-28

研究指出,GPT-3.5和GPT-4處理臨床數據時,只需少量訓練數據即可提取有價值資訊。透過改進提示策略,可增進模型在臨床命名實體識別任務表現,減少大量標註數據需求。雖GPT模型在臨床應用有潛力,仍需進一步改進。研究結果凸顯了量身定制的提示框架重要性,以提高大型語言模型在臨床環境性能。 PubMed DOI

Optimizing large language models in digestive disease: strategies and challenges to improve clinical outcomes.
優化消化系疾病中的大型語言模型:改善臨床結果的策略和挑戰。 Liver Int / / 2024-05-31

大型語言模型(LLMs)透過龐大文本數據訓練,可在醫療保健領域提升準確性。研究者正致力改善LLM在消化系疾病上的表現,但準確性範圍仍有挑戰。整合檢索增強生成(RAG)、監督微調(SFT)和人類反饋的強化學習(RLHF)等方法,是克服障礙的關鍵。結合人類反饋與先進模型訓練,對於提升LLMs在醫療保健中的效能至關重要。 PubMed DOI

Large language models encode clinical knowledge.
大型語言模型編碼臨床知識。 Nature / / 2024-02-29

LLMs在臨床上有潛力,但評估臨床知識有挑戰。MultiMedQA整合了六個醫學問答數據集,並引入人工評估框架。Flan-PaLM在醫學數據集上表現優異,但人工評估發現了一些缺陷。Med-PaLM透過指令提示調整後有所改善,但仍需更多努力。LLMs在醫學領域有潛力,但需要進一步發展以建立安全有效的臨床模型。 PubMed DOI

How large language models can augment perioperative medicine: a daring discourse.
大型語言模型如何增進围手术期医学:一場大膽的論述。 Reg Anesth Pain Med / / 2023-10-05

對ChatGPT等大型語言模型在臨床上的應用感興趣。了解其優勢和限制對於探索在手術前後醫學中的潛力很重要。不用擔心取代臨床決策,而是該想辦法如何整合模型以提升病人照護。大型語言模型在手術前後醫學中可在臨床決策支援、研究數據分析和文件記錄改進等三個關鍵領域帶來好處。醫護人員需適應這項不斷演進的技術,善用其優勢。 PubMed DOI

Fine-Tuned Large Language Model for Extracting Patients on Pretreatment for Lung Cancer from a Picture Archiving and Communication System Based on Radiological Reports.
基於放射學報告的圖像存檔和通訊系統,用於提取肺癌預處理患者的精細調校大型語言模型。 J Imaging Inform Med / / 2024-07-02

這項研究比較了一個經過微調的大型語言模型(LLM)與放射科醫師在從放射學報告中識別肺癌預防治療患者方面的表現。LLM在分類患者方面表現出高準確度和敏感度,與放射科醫師相似,但處理時間更快。研究結果表明,LLM能夠有效地及時從醫療記錄中提取相關信息。 PubMed DOI

Off-the-shelf Large Language Models (LLM) Are Of Insufficient Quality To Provide Medical Treatment Recommendations, While Customization of LLMs Result In Quality Recommendations.
現成的大型語言模型 (LLM) 在提供醫療治療建議方面的質量不足,而定制化的 LLM 則能產生高質量的建議。 Arthroscopy / / 2024-10-05

現成的大型語言模型(LLMs)在準確性上常反映互聯網上的不準確資訊,對於常見的肌肉骨骼疾病,治療建議的錯誤率高達30%。這顯示出諮詢專家的必要性。定制的LLMs則能整合各醫學領域的專業知識,方法包括: 1. **提示工程**:設計特定提示以獲得更佳回應。 2. **檢索增強生成(RAG)**:從目標數據集中檢索相關資訊。 3. **微調**:調整模型以理解醫療術語。 4. **代理增強**:利用軟體協調多個LLMs,優化輸出並引入人類監督。 這些定制的LLMs幫助醫生在數位環境中重新掌握權威,確保醫療專業知識的準確性。 PubMed DOI

Large Language Model Influence on Management Reasoning: A Randomized Controlled Trial.
大型語言模型對管理推理的影響:一項隨機對照試驗。 medRxiv / / 2024-08-16

使用大型語言模型(LLM)能顯著提升醫生在複雜管理推理任務上的表現,超越傳統資源。在一項針對92位醫生的隨機對照試驗中,使用GPT-4的醫生在管理推理任務中得分較高。研究顯示,LLM的協助能改善管理決策、診斷決策及特定案例的表現,顯示其在複雜臨床情境中做出決策的能力,特別是在缺乏明確答案的情況下。 PubMed DOI

Fine-Tuning Large Language Models to Enhance Programmatic Assessment in Graduate Medical Education.
微調大型語言模型以增強研究生醫學教育中的程式性評估。 J Educ Perioper Med / / 2024-10-02

這項研究探討了訓練大型語言模型(LLMs)來根據美國住院醫師教育認證委員會(ACGME)的標準分類受訓者的反饋。研究發現,雖然複雜的模型未必能提高分類準確率,但較小的模型如BERT-mini在性能上與FastText相當,且在個人設備上部署時更具優勢,能提升速度和數據隱私。這項研究有助於理解如何有效整合LLMs於醫學教育中。 PubMed DOI

Health system-scale language models are all-purpose prediction engines.
健康系統規模的語言模型是多用途的預測引擎。 Nature / / 2024-02-29

醫師需要快速做決定,預測模型能預測臨床事件,提供幫助。傳統模型有限制,但透過臨床註記訓練語言模型,可以打造更多功能的預測引擎。開發了醫學語言模型(NYUTron),並在預測再入院和死亡方面進行微調,比傳統模型更準確。對臨床文本進行預訓練,再針對不同地點進行微調,可以增強泛化能力。成功在試驗中應用,顯示臨床語言模型有潛力協助醫師即時做決定。 PubMed DOI

[Prospects for the Application of Healthcare Big Data Combined With Large Language Models].
結合大型語言模型的醫療大數據應用前景。 Sichuan Da Xue Xue Bao Yi Xue Ban / / 2023-11-12

預計在醫學領域使用大數據技術和大型語言模型將產生重大影響。它可以協助醫生進行診斷,支持循證醫學,並協助臨床研究。通過結合醫療大數據和大型語言模型,醫學診斷和治療可以更加精確、高效和智能化,從而推動人類健康的進步。 PubMed DOI