Improving large language models for clinical named entity recognition via prompt engineering.
透過提示工程改善臨床命名實體識別的大型語言模型。 J Am Med Inform Assoc 2024-01-28

研究指出，GPT-3.5和GPT-4處理臨床數據時，只需少量訓練數據即可提取有價值資訊。透過改進提示策略，可增進模型在臨床命名實體識別任務表現，減少大量標註數據需求。雖GPT模型在臨床應用有潛力，仍需進一步改進。研究結果凸顯了量身定制的提示框架重要性，以提高大型語言模型在臨床環境性能。 PubMed DOI

Comparison of Prompt Engineering and Fine-Tuning Strategies in Large Language Models in the Classification of Clinical Notes.
大型語言模型在分類臨床記錄中，即時工程和微調策略的比較。 medRxiv 2024-02-26

研究發現，大型語言模型在醫療保健領域有潛力，尤其在識別轉移性癌症患者方面。GPT-4表現最佳，提示和推理步驟清晰簡潔效果更好。即使改變輸入標記，GPT-4仍保持高準確性。建議透過策略性提示設計，GPT-4或許可取代專門模型，提升醫療應用。 PubMed DOI

An Empirical Evaluation of Prompting Strategies for Large Language Models in Zero-Shot Clinical Natural Language Processing: Algorithm Development and Validation Study.
大型語言模型在零-shot臨床自然語言處理中提示策略的實證評估：演算法開發和驗證研究。 JMIR Med Inform 2024-04-08

LLMs在臨床應用上很強大，但缺乏標記數據。為了掌握臨床知識，需要進行上下文學習。研究評估了零-shot和少-shot臨床信息提取的提示工程技術。結果顯示，定制任務特定提示至關重要，而啟發式和集成提示也很有效。GPT-3.5表現最佳，並且集成方法有助於提升性能。這項研究為臨床自然語言處理的提示工程提供了重要的指導。 PubMed DOI

Editing Physicians' Responses Using GPT-4 for Academic Research.
使用 GPT-4 編輯醫師的回應，用於學術研究。 Stud Health Technol Inform 2024-04-29

在數位醫療領域，利用GPT模型匿名化健康資訊進行研究有潛力。已研發方法用於編輯罕見呼吸系統疾病平台上醫生回應，保留醫療建議核心。挑戰在於錯誤分類和不完全刪除，需要提高準確性。GPT-4模型潛力龐大，但準確性和一致性有困難。在醫療環境中，準確性至關重要，以減少偏見並保持相關資訊。 PubMed DOI

OpenMedLM: prompt engineering can out-perform fine-tuning in medical question-answering with open-source large language models.
OpenMedLM: 在醫學問答中，prompt engineering 可以優於對開源大型語言模型進行微調。 Sci Rep 2024-06-19

OpenMedLM是一個開源的醫學語言模型，在醫學基準測試中表現優異，且無需大量微調。透過提示策略，OpenMedLM在三個醫學語言模型基準測試中取得領先地位，超越其他模型。這顯示開源基礎模型在提升醫療任務表現方面具有潛力，同時也凸顯提示工程對於醫學應用中易用的語言模型的重要性。 PubMed DOI

Prompt engineering on leveraging large language models in generating response to InBasket messages.
利用大型語言模型生成 InBasket 訊息回應的提示工程。 J Am Med Inform Assoc 2024-07-19

這項研究探討大型語言模型（LLMs），特別是GPT-4，如何生成符合病人和醫師需求的醫療建議回應。研究團隊透過人員參與的迭代過程，優化提示，提升回應質量。經過三次迭代後，臨床醫師對草擬回應的接受度從62%提升至84%，且74%的回應被評為「有幫助」。病人也認為優化後的回應在語氣和質量上更佳，76%的病人無法分辨人類與LLM生成的回應。研究顯示，根據醫師和病人的反饋來精煉提示，能有效生成有用的醫療建議。 PubMed DOI

Prompt engineering with a large language model to assist providers in responding to patient inquiries: a real-time implementation in the electronic health record.
利用大型語言模型進行提示工程，以協助醫療提供者回應病人詢問：在電子健康紀錄中的即時實施。 JAMIA Open 2024-08-21

這項研究探討了提示工程對大型語言模型（LLM），特別是GPT-4，在醫療提供者回應病人詢問時的影響。研究持續8個月，參與者有27位醫療提供者，主要評估LLM生成訊息的使用情況及提供者的情感變化。結果顯示，7605條訊息中僅17.5%被使用，負面情感顯著減少，但整體使用量卻下降。隨著護士的加入，使用量提升至35.8%。雖然提示工程改善了內容質量，但整合LLM進工作流程仍面臨挑戰，未來需更注重人因因素以提升可用性和有效性。 PubMed DOI

Prompt engineering with ChatGPT3.5 and GPT4 to improve patient education on retinal diseases.
使用 ChatGPT3.5 和 GPT4 進行提示工程，以改善對視網膜疾病的患者教育。 Can J Ophthalmol 2024-09-08

這項研究探討不同提示工程技術對大型語言模型（如ChatGPT3.5和GPT4）在回答視網膜疾病相關問題時的影響。研究中使用了二十個常見問題，並在獨立問題、優化提示（提示A）及加上長度和閱讀水平限制的提示B下進行測試。三位視網膜專家評估回應的準確性和全面性，結果顯示兩個模型在各指標上無顯著差異，但提示B的可讀性較高，卻以準確性和全面性為代價。研究建議未來需進一步探討LLM在病人教育中的有效性及倫理問題。 PubMed DOI

Large Language Model Prompting Techniques for Advancement in Clinical Medicine.
臨床醫學進步的大型語言模型提示技術。 J Clin Med 2024-09-14

大型語言模型（LLMs）有潛力顯著改變臨床醫學，能改善醫療服務的可及性、增強診斷、協助手術規劃及促進教育。不過，這些模型的有效運用需謹慎設計提示，以應對幻覺和偏見等挑戰。理解標記化、嵌入和注意力機制等關鍵概念，以及運用策略性提示技術，對生成準確輸出至關重要。AI技術與醫療專業人員的合作、重視倫理問題如數據安全和偏見緩解，能提升醫療服務質量與可及性。持續的研究與發展對於發揮LLMs在醫療領域的潛力至關重要。 PubMed DOI

Biomedical knowledge graph-optimized prompt generation for large language models.
生物醫學知識圖譜優化的大型語言模型提示生成。 Bioinformatics 2024-09-17

基於知識圖譜的檢索增強生成（KG-RAG）框架，成功解決了大型語言模型在生物醫學等知識密集型領域的挑戰。透過SPOKE生物醫學知識圖譜，KG-RAG優化了標記使用，提升了Llama-2、GPT-3.5和GPT-4的表現。該框架有效降低標記消耗超過50%，同時保持準確性，顯著改善了對生物醫學提示的回應，並在基準數據集上提升表現，Llama-2在多選題上提高了71%。KG-RAG以具成本效益的方式結合知識圖譜與大型語言模型，讓通用模型更能應對特定領域查詢。SPOKE KG和KG-RAG的代碼已公開，並提供生物醫學基準數據集供研究使用。 PubMed DOI

原始文章

站上相關主題文章列表