HiPrompt: Few-Shot Biomedical Knowledge Fusion via Hierarchy-Oriented Prompting.
少樣本生物醫學知識融合：基於層次導向提示。 Int ACM SIGIR Conf Res Dev Inf Retr 2024-02-15

整合生物醫學知識庫有助於醫學決策，提供統一索引系統和詳盡對齊。現有方法缺乏監督，需依賴基本匹配算法。神經嵌入模型有潛力，但需要標記數據。HiPrompt是一個利用大型語言模型進行少樣本推理的生物醫學知識融合框架，對KG-Hi-BKF數據集的實驗結果顯示有效性。 PubMed DOI

Prompt engineering in consistency and reliability with the evidence-based guideline for LLMs.
以基於證據的指引，促進 LLMs 的一致性和可靠性工程。 NPJ Digit Med 2024-02-24

臨床醫學中，LLMs的應用越來越廣泛，善加利用這些知識對這個領域至關重要。即時工程是一個具潛力的方法。研究指出，在測試LLMs對骨關節炎指引的影響時，gpt-4-Web表現最好，特別是在使用ROT提示時的一致性和效能最高。不同模型之間的提示可靠度有所不同，而gpt-4-Web使用ROT提示的一致性最佳。適當的提示能提升LLMs對醫學問題的準確性。 PubMed DOI

Improving the use of LLMs in radiology through prompt engineering: from precision prompts to zero-shot learning.
從精確提示到零樣本學習：通過及時工程改進放射學中 LLMs 的應用。 Rofo 2024-02-26

大型語言模型如ChatGPT在放射學領域有潛力，但成效需靠即時工程處理。不同提示策略可客製化模型回應，無需額外訓練。少樣本學習和嵌入式技術對提升聊天機器人輸出和透明度至關重要。在放射學等專業任務中，提示工程對LLMs利用至關重要，隨模型演進，零樣本學習等方法愈見重要。 PubMed DOI

An Empirical Evaluation of Prompting Strategies for Large Language Models in Zero-Shot Clinical Natural Language Processing: Algorithm Development and Validation Study.
大型語言模型在零-shot臨床自然語言處理中提示策略的實證評估：演算法開發和驗證研究。 JMIR Med Inform 2024-04-08

LLMs在臨床應用上很強大，但缺乏標記數據。為了掌握臨床知識，需要進行上下文學習。研究評估了零-shot和少-shot臨床信息提取的提示工程技術。結果顯示，定制任務特定提示至關重要，而啟發式和集成提示也很有效。GPT-3.5表現最佳，並且集成方法有助於提升性能。這項研究為臨床自然語言處理的提示工程提供了重要的指導。 PubMed DOI

OpenMedLM: prompt engineering can out-perform fine-tuning in medical question-answering with open-source large language models.
OpenMedLM: 在醫學問答中，prompt engineering 可以優於對開源大型語言模型進行微調。 Sci Rep 2024-06-19

OpenMedLM是一個開源的醫學語言模型，在醫學基準測試中表現優異，且無需大量微調。透過提示策略，OpenMedLM在三個醫學語言模型基準測試中取得領先地位，超越其他模型。這顯示開源基礎模型在提升醫療任務表現方面具有潛力，同時也凸顯提示工程對於醫學應用中易用的語言模型的重要性。 PubMed DOI

Optimizing biomedical information retrieval with a keyword frequency-driven prompt enhancement strategy.
利用關鍵字頻率驅動的提示增強策略優化生物醫學信息檢索。 BMC Bioinformatics 2024-08-27

從生物醫學文獻中提取準確資訊相當複雜，因為這個領域跨學科且術語專業。早期的自然語言處理（NLP）方法常常無法掌握語言的細微差別，導致錯誤答案。隨著變壓器模型的出現，大型語言模型（LLMs）在問答任務中表現改善，但仍面臨挑戰，經常產生「幻覺」信息。我們的研究透過增強檢索架構來提升LLMs在生物醫學問答中的表現，並開發了問答機器人WeiseEule，強調用戶查詢信號的重要性，改善了回應的準確性和相關性。 PubMed DOI

Towards Dataset-scale and Feature-oriented Evaluation of Text Summarization in Large Language Model Prompts.
大型語言模型提示中文本摘要的數據集規模和特徵導向評估。 IEEE Trans Vis Comput Graph 2024-09-09

最近大型語言模型和提示工程的進展，讓自訂聊天機器人變得更容易，不再需要程式設計技能。不過，進行大規模的提示評估仍然很具挑戰性。我們的研究確定了五個關鍵挑戰，並提出了一個以特徵為導向的提示評估工作流程，特別針對文本摘要，強調根據摘要特徵來評估提示，而非僅依賴傳統指標。為了支持這個流程，我們推出了Awesum，一個視覺分析系統，幫助用戶識別最佳提示改進。我們的測試顯示，Awesum能有效幫助非技術用戶進行系統性評估，並可應用於其他自然語言生成任務。未來建議專注於大型語言模型的特徵導向評估。 PubMed DOI

Biomedical knowledge graph-optimized prompt generation for large language models.
生物醫學知識圖譜優化的大型語言模型提示生成。 Bioinformatics 2024-09-17

基於知識圖譜的檢索增強生成（KG-RAG）框架，成功解決了大型語言模型在生物醫學等知識密集型領域的挑戰。透過SPOKE生物醫學知識圖譜，KG-RAG優化了標記使用，提升了Llama-2、GPT-3.5和GPT-4的表現。該框架有效降低標記消耗超過50%，同時保持準確性，顯著改善了對生物醫學提示的回應，並在基準數據集上提升表現，Llama-2在多選題上提高了71%。KG-RAG以具成本效益的方式結合知識圖譜與大型語言模型，讓通用模型更能應對特定領域查詢。SPOKE KG和KG-RAG的代碼已公開，並提供生物醫學基準數據集供研究使用。 PubMed DOI

Evaluation of LLMs accuracy and consistency in the registered dietitian exam through prompt engineering and knowledge retrieval.
透過提示工程和知識檢索評估大型語言模型在註冊營養師考試中的準確性和一致性。 Sci Rep 2025-01-09

這篇論文探討了大型語言模型（LLMs）在營養與飲食應用中的表現，特別是針對註冊營養師（RD）考試的1050道問題。研究比較了GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Pro的準確性與一致性，並分析了不同提示技術的效果。結果顯示，GPT-4o在使用帶自我一致性的思考鏈（CoT-SC）時表現最佳，而Gemini 1.5 Pro在零提示（ZS）下則展現最高一致性。研究強調選擇合適的LLM和提示策略對減少錯誤風險的重要性。 PubMed DOI

PromptAid: Visual Prompt Exploration, Perturbation, Testing and Iteration for Large Language Models.
PromptAid: 大型語言模型的視覺提示探索、擾動、測試與迭代。 IEEE Trans Vis Comput Graph 2025-03-03

大型語言模型（LLMs）因為能用簡單的提示處理各種自然語言任務而受到廣泛歡迎，讓非專家也能輕鬆使用。不過，撰寫有效的提示卻不容易，因為需要特定知識。為了幫助用戶改善提示，我們開發了PROMPTAID，這是一個互動式的視覺分析系統，能讓用戶創建、精煉和測試提示。PROMPTAID透過協調視覺化，促進關鍵字擾動、意義重述和選擇最佳範例，並經過專家意見和用戶研究驗證，讓用戶能輕鬆迭代提示，生成多樣選項，並有效分析提示表現。 PubMed DOI

原始文章

站上相關主題文章列表