Prompt engineering on leveraging large language models in generating response to InBasket messages.
利用大型語言模型生成 InBasket 訊息回應的提示工程。 J Am Med Inform Assoc 2024-07-19

這項研究探討大型語言模型（LLMs），特別是GPT-4，如何生成符合病人和醫師需求的醫療建議回應。研究團隊透過人員參與的迭代過程，優化提示，提升回應質量。經過三次迭代後，臨床醫師對草擬回應的接受度從62%提升至84%，且74%的回應被評為「有幫助」。病人也認為優化後的回應在語氣和質量上更佳，76%的病人無法分辨人類與LLM生成的回應。研究顯示，根據醫師和病人的反饋來精煉提示，能有效生成有用的醫療建議。 PubMed DOI

The Emerging Role of Large Language Models in Improving Prostate Cancer Literacy.
大型語言模型在提升前列腺癌知識中的新興角色。 Bioengineering (Basel) 2024-07-27

這項研究評估了大型語言模型（LLMs）驅動的聊天機器人，如ChatGPT 3.5、CoPilot和Gemini，在提供前列腺癌資訊的有效性，並與官方病人指南進行比較。研究使用25個專家驗證的問題，根據準確性、及時性、完整性和可理解性進行評估。結果顯示，ChatGPT 3.5的表現優於其他模型，證明其為可靠的資訊來源。研究強調在健康領域持續創新AI應用的重要性，並建議未來探討AI回應中的潛在偏見及其對病人結果的影響。 PubMed DOI

The In-depth Comparative Analysis of Four Large Language AI Models for Risk Assessment and Information Retrieval from Multi-Modality Prostate Cancer Work-up Reports.
四種大型語言AI模型在多模態前列腺癌檢查報告中的風險評估和信息檢索的深入比較分析。 World J Mens Health 2025-01-01

這項研究評估了四個大型語言模型（LLMs）在前列腺癌治療相關的資訊檢索和風險評估任務中的表現，特別針對第四期患者。研究使用350份模擬報告，並針對三個風險評估任務和七個資訊檢索任務進行評估。結果顯示，所有模型在資訊檢索任務中表現良好，但在風險評估上差異明顯，ChatGPT-4-turbo表現最佳。儘管結果令人鼓舞，研究仍提醒可能的誤解會影響臨床決策，並呼籲進一步研究以驗證結果的普遍性。 PubMed DOI

The Transformative Potential of Large Language Models in Mining Electronic Health Records Data: Content Analysis.
大型語言模型在挖掘電子健康紀錄數據中的變革潛力：內容分析。 JMIR Med Inform 2025-01-02

這項研究評估了大型語言模型（LLMs），特別是GPT-3.5和GPT-4，在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告，結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生，達到96.8%。雖然醫生在精確度上稍勝一籌，但GPT-4的表現更一致，且能推斷出非明確的共病情況。整體而言，這些模型在提取資訊方面顯示出潛力，可能成為數據挖掘的重要工具。 PubMed DOI

Patient- and clinician-based evaluation of large language models for patient education in prostate cancer radiotherapy.
以病人和臨床醫師為基礎的評估大型語言模型在前列腺癌放射治療中的病人教育效果。 Strahlenther Onkol 2025-01-10

這項研究評估大型語言模型（LLMs）在提供前列腺癌放射治療病人教育的有效性，並納入臨床醫生和病人的反饋。研究中針對六個常見問題，評估了ChatGPT-4、Gemini、Copilot和Claude的回答。結果顯示，雖然所有模型的回答被認為相關且正確，但可讀性較差。病人對ChatGPT-4的評價較高，認為其回答易懂且有信心。整體而言，LLMs在病人教育上有潛力，但準確性和可讀性仍需改進，未來需進一步研究以提升其效益。 PubMed DOI

The interaction of structured data using openEHR and large Language models for clinical decision support in prostate cancer.
使用 openEHR 的結構化數據與大型語言模型在前列腺癌臨床決策支持中的互動。 World J Urol 2025-01-13

多學科團隊（MDTs）在癌症護理中非常重要，但需要專家投入大量時間，導致醫療成本上升。最近大型語言模型（LLMs）的進展，可能提升臨床決策的效率，並降低MDT的相關成本。一項針對171名新診斷前列腺癌患者的研究比較了兩個LLMs（chatGPT-4和Claude-3-Opus）與MDT會議的建議。結果顯示，LLMs的遵循率高達93%。不一致的情況主要因為臨床資訊不足。研究顯示，LLMs能生成準確的治療建議，未來有潛力簡化MDT流程，讓專家專注於更複雜的案例，並降低醫療成本。 PubMed DOI

Large language models for pretreatment education in pediatric radiation oncology: A comparative evaluation study.
大型語言模型在小兒放射腫瘤學中的預處理教育：一項比較評估研究。 Clin Transl Radiat Oncol 2025-01-27

這項研究評估了GPT-3.5和GPT-4在小兒放射治療患者及其家長教育上的有效性。研究發現，GPT-4和放射腫瘤科醫生的回答質量最高，但GPT-4的回答有時過於冗長。微調過的GPT-3.5表現優於基本版本，但常常提供過於簡化的答案。整體來看，GPT-4可作為小兒放射腫瘤學患者及家庭的有用教育資源，雖然使用GPT-3.5時需謹慎，因為它可能產生不足的回答。 PubMed DOI

MedBot vs RealDoc: efficacy of large language modeling in physician-patient communication for rare diseases.
MedBot 與 RealDoc：大型語言模型在罕見疾病的醫生-病人溝通中的效能。 J Am Med Inform Assoc 2025-02-25

這項研究評估了GPT-4和BioMistral 7B兩個大型語言模型在回答罕見疾病病人詢問的表現，並與醫生的回應進行比較。結果顯示，GPT-4的表現優於醫生和BioMistral 7B，回應被認為正確且具同理心。BioMistral 7B的回應則部分正確，而醫生的表現介於兩者之間。專家指出，雖然LLMs能減輕醫生負擔，但仍需嚴格驗證其可靠性。GPT-4在溝通上表現佳，但需注意回應的變異性和準確性。 PubMed DOI

Special Topic Burnout: An AI-Powered Strategy for Managing Patient Messaging Load and Reducing Burnout.
特殊主題：利用人工智慧策略管理病患訊息負擔與減少職業倦怠。 Appl Clin Inform 2025-04-08

這項研究評估了使用大型語言模型（LLM），特別是OpenAI的ChatGPT 4.0，對電子健康紀錄（EHR）系統中患者訊息草稿回覆的影響。研究在2023年8月至2024年7月於13個門診專科進行，323名臨床醫生和支援人員參與。主要發現包括： - 草稿使用率38%，臨床醫生43%，排程人員33%。 - AI生成草稿顯著減少回覆時間，平均縮短13秒。 - 支援人員平均節省23秒，臨床醫生僅3秒。 - 不同專科間使用率和時間節省有差異。結論指出，LLM可減輕訊息負擔並縮短回覆時間，但效果因角色和專科而異，建議進一步開發個性化AI工具以提升效用。 PubMed DOI

Application of AI Chatbot in Responding to Asynchronous Text-Based Messages From Patients With Cancer: Comparative Study.
AI 聊天機器人在回應癌症病患非同步文字訊息的應用：比較性研究 J Med Internet Res 2025-05-21

這項研究比較GPT-4和中國腫瘤科醫師回答癌症病患問題的表現。結果顯示，GPT-4在病患衛教的答案較完整，正確性和安全性也不輸醫師，但在醫療決策上正確率較低，偶爾還會出現危險錯誤。醫師和病患對同理心的感受也不同。總結來說，GPT-4適合用於衛教，但在醫療決策上仍需醫師把關。 PubMed DOI

原始文章

站上相關主題文章列表