Prompt engineering in consistency and reliability with the evidence-based guideline for LLMs.
以基於證據的指引，促進 LLMs 的一致性和可靠性工程。 NPJ Digit Med 2024-02-24

臨床醫學中，LLMs的應用越來越廣泛，善加利用這些知識對這個領域至關重要。即時工程是一個具潛力的方法。研究指出，在測試LLMs對骨關節炎指引的影響時，gpt-4-Web表現最好，特別是在使用ROT提示時的一致性和效能最高。不同模型之間的提示可靠度有所不同，而gpt-4-Web使用ROT提示的一致性最佳。適當的提示能提升LLMs對醫學問題的準確性。 PubMed DOI

Improving the use of LLMs in radiology through prompt engineering: from precision prompts to zero-shot learning.
從精確提示到零樣本學習：通過及時工程改進放射學中 LLMs 的應用。 Rofo 2024-02-26

大型語言模型如ChatGPT在放射學領域有潛力，但成效需靠即時工程處理。不同提示策略可客製化模型回應，無需額外訓練。少樣本學習和嵌入式技術對提升聊天機器人輸出和透明度至關重要。在放射學等專業任務中，提示工程對LLMs利用至關重要，隨模型演進，零樣本學習等方法愈見重要。 PubMed DOI

An Empirical Evaluation of Prompting Strategies for Large Language Models in Zero-Shot Clinical Natural Language Processing: Algorithm Development and Validation Study.
大型語言模型在零-shot臨床自然語言處理中提示策略的實證評估：演算法開發和驗證研究。 JMIR Med Inform 2024-04-08

LLMs在臨床應用上很強大，但缺乏標記數據。為了掌握臨床知識，需要進行上下文學習。研究評估了零-shot和少-shot臨床信息提取的提示工程技術。結果顯示，定制任務特定提示至關重要，而啟發式和集成提示也很有效。GPT-3.5表現最佳，並且集成方法有助於提升性能。這項研究為臨床自然語言處理的提示工程提供了重要的指導。 PubMed DOI

Prompt Engineering for Nurse Educators.
護理教育工作者的即時工程。 Nurse Educ 2024-07-05

在護理教育中運用人工智慧工具如ChatGPT，可提供個人化學習和互動參與。教職員需巧妙設計提示，以達教育目標並提升學習成果。有效提示對AI回應至關重要，有助於提升學生理解能力。本文探討了在學術環境中優化AI內容生成的重要性，並提供護理教育工作者運用AI的指導。精通提示設計可提升教學效果、工作效率和學生成果。 PubMed DOI

Prompt engineering on leveraging large language models in generating response to InBasket messages.
利用大型語言模型生成 InBasket 訊息回應的提示工程。 J Am Med Inform Assoc 2024-07-19

這項研究探討大型語言模型（LLMs），特別是GPT-4，如何生成符合病人和醫師需求的醫療建議回應。研究團隊透過人員參與的迭代過程，優化提示，提升回應質量。經過三次迭代後，臨床醫師對草擬回應的接受度從62%提升至84%，且74%的回應被評為「有幫助」。病人也認為優化後的回應在語氣和質量上更佳，76%的病人無法分辨人類與LLM生成的回應。研究顯示，根據醫師和病人的反饋來精煉提示，能有效生成有用的醫療建議。 PubMed DOI

A Road Map of Prompt Engineering for ChatGPT in Healthcare: A Perspective Study.
ChatGPT 在醫療領域的即時工程路線圖：一項觀點研究。 Stud Health Technol Inform 2024-08-23

生成式AI模型如ChatGPT正在改變醫療保健，透過提示工程提升AI輸出的準確性和倫理標準。這個九階段的過程包括：識別應用、了解利益相關者需求、設計量身定制的提示、迭代測試與改進、倫理考量、協作反饋、文檔記錄、培訓及持續更新。研究強調生成式AI在醫療中的應用，確保AI提示能滿足病人及醫療提供者的需求，促進病人對症狀、治療和預防策略的知情決策。 PubMed DOI

Prompt Engineering Paradigms for Medical Applications: Scoping Review.
醫療應用的提示工程範式：範疇回顧。 J Med Internet Res 2024-09-10

這項研究聚焦於醫療領域的提示工程，探討其如何提升大型語言模型（LLMs）處理複雜醫療文本的能力。研究回顧了114篇2022至2024年間的相關文獻，發現提示設計（PD）是最常用的方法，且ChatGPT是最受歡迎的LLM。思考鏈技術被廣泛應用，但有61%的研究未報告基準，影響有效性評估。研究旨在提供醫療提示工程的現狀，識別機會與挑戰，並提出未來研究的指導方針。 PubMed DOI

Large Language Model Prompting Techniques for Advancement in Clinical Medicine.
臨床醫學進步的大型語言模型提示技術。 J Clin Med 2024-09-14

大型語言模型（LLMs）有潛力顯著改變臨床醫學，能改善醫療服務的可及性、增強診斷、協助手術規劃及促進教育。不過，這些模型的有效運用需謹慎設計提示，以應對幻覺和偏見等挑戰。理解標記化、嵌入和注意力機制等關鍵概念，以及運用策略性提示技術，對生成準確輸出至關重要。AI技術與醫療專業人員的合作、重視倫理問題如數據安全和偏見緩解，能提升醫療服務質量與可及性。持續的研究與發展對於發揮LLMs在醫療領域的潛力至關重要。 PubMed DOI

Encouragement vs. liability: How prompt engineering influences ChatGPT-4's radiology exam performance.
鼓勵與責任：提示工程如何影響 ChatGPT-4 的放射科考試表現。 Clin Imaging 2024-09-17

這項研究探討如何透過提示工程提升ChatGPT-4在放射學問題上的表現，特別針對2022年美國放射學會的測試題。雖然ChatGPT-4在文字任務上表現優異，但在影像問題上則較弱。研究人員設計了四種角色，使用不同提示來評估其對準確性的影響。結果顯示，鼓勵性提示或責任免責聲明能提高準確性，而威脅法律行動的提示則降低準確性，且未回答問題的比例較高。這強調了提示背景在優化大型語言模型回應中的重要性，並呼籲在醫療環境中負責任地整合人工智慧的進一步研究。 PubMed DOI

Prompt Engineering an Informational Chatbot for Educating about Mental Health: Utilizing a Multi-Agent Approach for Enhanced Compliance with Prompt Instruction.
設計一個資訊性聊天機器人以教育心理健康：利用多代理方法增強對提示指令的遵從性。 JMIR AI 2025-02-24

這項研究探討了使用關鍵分析過濾器（CAF）系統，來提升一個針對精神分裂症教育的聊天機器人可靠性。考量到患者的認知挑戰，研究團隊整合了大型語言模型（LLMs），如GPT-4，來改善教育效果。為了解決LLMs的不穩定性，研究人員開發了一個聊天機器人，能夠訪問專為患者和照顧者設計的手冊，並透過CAF進行回應的批判性評估。結果顯示，啟用CAF後，67%的回應符合標準，顯示CAF能有效提升心理健康教育的安全性與有效性。 PubMed DOI

原始文章

站上相關主題文章列表