Optimizing biomedical information retrieval with a keyword frequency-driven prompt enhancement strategy.
利用關鍵字頻率驅動的提示增強策略優化生物醫學信息檢索。 BMC Bioinformatics 2024-08-27

從生物醫學文獻中提取準確資訊相當複雜，因為這個領域跨學科且術語專業。早期的自然語言處理（NLP）方法常常無法掌握語言的細微差別，導致錯誤答案。隨著變壓器模型的出現，大型語言模型（LLMs）在問答任務中表現改善，但仍面臨挑戰，經常產生「幻覺」信息。我們的研究透過增強檢索架構來提升LLMs在生物醫學問答中的表現，並開發了問答機器人WeiseEule，強調用戶查詢信號的重要性，改善了回應的準確性和相關性。 PubMed DOI

Linguistically informed ChatGPT prompts to enhance Japanese-Chinese machine translation: A case study on attributive clauses.
語言學知識驅動的 ChatGPT 提示以增強日中機器翻譯：以定語從句為案例研究。 PLoS One 2025-01-09

這篇論文探討了將日文定語從句翻譯成中文的挑戰，特別是名詞語義角色對翻譯的影響。研究指出目前機器翻譯工具的局限性，並透過範例分析提出了一種經ChatGPT測試的三步驟提示鏈接策略，翻譯品質顯著提升，平均分數提高超過43%。結果強調語言學知識在設計提示時的重要性，對於提升複雜句子的翻譯準確性至關重要。這項研究不僅連結了語言學理論與機器翻譯，還為優化大型語言模型的提示及改善語言教育工具提供了新見解。 PubMed DOI

Knowledge Distillation-Enhanced Behavior Transformer for Decision-Making of Autonomous Driving.
知識蒸餾增強的行為轉換器在自動駕駛決策中的應用。 Sensors (Basel) 2025-01-11

所提出的知識蒸餾增強行為轉換器（KD-BeT）框架，結合模仿學習和強化學習的優勢，旨在改善自駕車的行為決策。雖然強化學習在複雜環境中的推理能力較弱，但KD-BeT利用變壓器的上下文推理能力來增強決策。首先，透過模仿學習訓練教師模型，再利用知識蒸餾指導學生模型，提升強化學習的效率和性能。模擬結果顯示，KD-BeT在CARLA NoCrash基準測試中表現優異，特別在交通效率和駕駛安全性上超越其他方法，為解決自駕車挑戰提供了新思路。 PubMed DOI

Evaluating the effectiveness of prompt engineering for knowledge graph question answering.
評估提示工程在知識圖譜問答中的有效性。 Front Artif Intell 2025-01-28

這項研究評估了六種不同的少量樣本提示方法，針對大型語言模型在Spider4SPARQL基準測試中的表現，該測試專注於複雜的SPARQL知識圖譜問答。實驗分為兩組，第一組檢視基於樣本數量或類型的提示方法，第二組則探討如何透過LLM生成的解釋來優化提示。結果顯示，商業模型在KGQA的準確率不超過51%，顯示處理複雜查詢的挑戰。最有效的方法是結合簡單提示與本體，並使用五個隨機樣本。 PubMed DOI

Empowering large language models for automated clinical assessment with generation-augmented retrieval and hierarchical chain-of-thought.
利用生成增強檢索和分層思維鏈來提升大型語言模型的自動臨床評估能力。 Artif Intell Med 2025-02-20

這項研究提出了一種名為「GAPrompt」的新方法，旨在提升大型語言模型（LLMs）在自動化臨床評估中的應用，特別是針對電子健康紀錄（EHRs）中的中風評估。GAPrompt包含五個關鍵組件，包括選擇適合的LLM、建立增強知識庫、改善檢索、增強推理精確性及結合多重生成輸出。研究結果顯示，GAPrompt能有效分析EHRs並提供定量評估，解決傳統中風評估的勞動密集問題，顯示LLMs在醫療及其他領域的潛力。 PubMed DOI

Mitigating spatial hallucination in large language models for path planning via prompt engineering.
透過提示工程減輕大型語言模型在路徑規劃中的空間幻覺。 Sci Rep 2025-03-15

S2ERS 技術旨在提升大型語言模型（LLMs）在迷宮環境中的空間推理能力，改善路徑規劃。它採用了三個關鍵策略：首先，透過圖結構提取，幫助 LLMs 理解空間關係，減少錯誤；其次，納入狀態-行動價值函數（Q），指導 LLM 的決策，避免陷入死胡同；最後，透過多步推理，動態插入局部 Q 表，讓 LLM 同時生成多個行動步驟。實驗顯示，S2ERS 顯著減少了空間幻覺問題，成功率和最佳率分別提高約 29% 和 19%。 PubMed DOI

Enhancing structured data generation with GPT-4o evaluating prompt efficiency across prompt styles.
利用 GPT-4 增強結構化數據生成，評估不同提示風格的提示效率。 Front Artif Intell 2025-04-10

這篇論文探討了不同提示風格（JSON、YAML 和混合 CSV/前綴）對大型語言模型（如 GPT-4o）生成結構化數據的影響，強調提示風格在準確性、效率和成本效益上的重要性。研究評估了這些風格在個人故事、收據和醫療記錄等應用中的表現，並根據準確性、標記成本和處理時間進行比較。主要發現包括： - **JSON**：高準確性但標記成本較高。 - **YAML**：在可讀性和效率間取得平衡。 - **混合 CSV/前綴**：在簡單數據結構中表現優異。論文提供了選擇合適提示風格的建議，幫助優化 AI 應用的數據生成。 PubMed DOI

Prompt Engineering for Large Language Models in Interventional Radiology.
介入放射學中大型語言模型的提示工程 AJR Am J Roentgenol 2025-05-07

這篇文章介紹了幾種常見的提示工程技巧，像是 zero-shot、few-shot 和 chain-of-thought，說明它們如何幫助提升 AI 在介入放射學領域的表現。內容也討論資料隱私、法規等挑戰，並展望未來像檢索增強生成、多模態模型等新方向。 PubMed DOI

Enhancing Cross-Domain Generalizability in Social Determinants of Health Extraction with Prompt-Tuning Large Language Models.
利用提示微調大型語言模型提升社會健康決定因素萃取的跨領域泛化能力 AMIA Jt Summits Transl Sci Proc 2025-06-12

這項研究發現，結合 soft prompt-based learning 和大型語言模型（像 GatorTronGPT），能大幅提升從不同醫院和疾病的臨床文本中萃取社會健康決定因素（SDoH）的效果。經過 prompt-tuning 的 GatorTronGPT，F1 分數最高比傳統 fine-tuned 模型多出 21.8%，顯示它在跨領域應用上表現更好。 PubMed

Reinforcement Learning With LLMs Interaction For Distributed Diffusion Model Services.
分散式擴散模型服務中結合 LLMs 互動的強化學習 IEEE Trans Pattern Anal Mach Intell 2025-06-30

這篇論文提出一套以使用者為核心的分散式AI影像生成服務架構，利用生成式擴散模型（GDMs），讓用戶能共享部分生成流程，提升效率。作者還結合大型語言模型與強化學習，模擬用戶回饋，優化主觀體驗品質（QoE）。新演算法G-DDPG能根據用戶偏好和網路狀況有效分配資源，模擬結果顯示QoE提升約15%。 PubMed DOI

原始文章

站上相關主題文章列表