The Emerging Role of Large Language Models in Improving Prostate Cancer Literacy.
大型語言模型在提升前列腺癌知識中的新興角色。 Bioengineering (Basel) 2024-07-27

這項研究評估了大型語言模型（LLMs）驅動的聊天機器人，如ChatGPT 3.5、CoPilot和Gemini，在提供前列腺癌資訊的有效性，並與官方病人指南進行比較。研究使用25個專家驗證的問題，根據準確性、及時性、完整性和可理解性進行評估。結果顯示，ChatGPT 3.5的表現優於其他模型，證明其為可靠的資訊來源。研究強調在健康領域持續創新AI應用的重要性，並建議未來探討AI回應中的潛在偏見及其對病人結果的影響。 PubMed DOI

The In-depth Comparative Analysis of Four Large Language AI Models for Risk Assessment and Information Retrieval from Multi-Modality Prostate Cancer Work-up Reports.
四種大型語言AI模型在多模態前列腺癌檢查報告中的風險評估和信息檢索的深入比較分析。 World J Mens Health 2025-01-01

這項研究評估了四個大型語言模型（LLMs）在前列腺癌治療相關的資訊檢索和風險評估任務中的表現，特別針對第四期患者。研究使用350份模擬報告，並針對三個風險評估任務和七個資訊檢索任務進行評估。結果顯示，所有模型在資訊檢索任務中表現良好，但在風險評估上差異明顯，ChatGPT-4-turbo表現最佳。儘管結果令人鼓舞，研究仍提醒可能的誤解會影響臨床決策，並呼籲進一步研究以驗證結果的普遍性。 PubMed DOI

Assessment of decision-making with locally run and web-based large language models versus human board recommendations in otorhinolaryngology, head and neck surgery.
耳鼻喉科、頭頸外科中當地運行和基於網絡的大型語言模型與人類專家委員會建議的決策評估。 Eur Arch Otorhinolaryngol 2025-01-10

這項研究探討大型語言模型（LLMs）在耳鼻喉科手術腫瘤建議中的潛力。研究比較了多學科腫瘤委員會（MDT）與兩個LLMs（ChatGPT-4o和Llama 3）的建議。結果顯示，ChatGPT-4o與MDT的符合率為84%，Llama 3則為92%。兩者都能識別第一線治療選擇，且MDT的建議在28%的案例中被模型採納。雖然LLMs的建議受到正面評價，但研究強調應用於輔助決策，而非取代專業醫師，特別是考量數據保護問題。Llama 3的本地運行特性顯示出臨床應用潛力。 PubMed DOI

Patient- and clinician-based evaluation of large language models for patient education in prostate cancer radiotherapy.
以病人和臨床醫師為基礎的評估大型語言模型在前列腺癌放射治療中的病人教育效果。 Strahlenther Onkol 2025-01-10

這項研究評估大型語言模型（LLMs）在提供前列腺癌放射治療病人教育的有效性，並納入臨床醫生和病人的反饋。研究中針對六個常見問題，評估了ChatGPT-4、Gemini、Copilot和Claude的回答。結果顯示，雖然所有模型的回答被認為相關且正確，但可讀性較差。病人對ChatGPT-4的評價較高，認為其回答易懂且有信心。整體而言，LLMs在病人教育上有潛力，但準確性和可讀性仍需改進，未來需進一步研究以提升其效益。 PubMed DOI

Leveraging Guideline-Based Clinical Decision Support Systems with Large Language Models: A Case Study with Breast Cancer.
利用基於指導的臨床決策支持系統與大型語言模型：乳腺癌的案例研究。 Methods Inf Med 2025-01-29

多學科腫瘤委員會（MTBs）在癌症治療決策中扮演重要角色，但常面臨案例過載，影響決策品質。臨床決策支持系統（CDSSs）雖已引入協助醫師，但使用仍有限。大型語言模型（LLMs）如ChatGPT的出現，為提升CDSS的效率提供新機會。 OncoDoc2專注於乳腺癌管理，研究探討LLMs如何透過提示工程技術（PETs）改善其可用性。使用200個乳腺癌患者摘要進行評估，結果顯示最佳方法結合Mistral和OpenChat模型，達到不錯的準確率，但與金標準建議的匹配度仍低，顯示LLMs在醫療決策中仍需進一步發展。 PubMed DOI

Performance Evaluation of Large Language Models in Cervical Cancer Management Based on a Standardized Questionnaire: Comparative Study.
基於標準化問卷的子宮頸癌管理中大型語言模型的性能評估：比較研究。 J Med Internet Res 2025-02-05

子宮頸癌是全球健康的重要議題，尤其在資源有限的地區。這項研究探討大型語言模型（LLMs）在子宮頸癌管理中的潛力，評估了九個模型的準確性和可解釋性。結果顯示，ChatGPT-4.0 Turbo表現最佳，得分為2.67，顯示其在提供可靠回應方面的有效性。研究還利用LIME增強模型的可解釋性，對醫療專業人員建立信任至關重要。雖然專有模型表現良好，但醫學專用模型的表現未如預期，未來仍需進一步研究以了解LLM在醫療中的應用。 PubMed DOI

[Integration of large language models into the clinic : Revolution in analysing and processing patient data to increase efficiency and quality in radiology].
大型語言模型在臨床中的整合：革命性地分析和處理患者數據，以提高放射學的效率和質量。 Radiologie (Heidelb) 2025-03-12

大型語言模型（LLMs）如ChatGPT、Llama和Claude，正在改變醫療保健，特別是在放射科。最近，弗賴堡和巴塞爾大學醫院的研究顯示，這些系統能有效整合影像存檔與傳輸系統（PACS）和電子健康紀錄（EHR），提升醫師效率，縮短報告時間，並自動化例行任務。研究結果顯示，LLMs不僅提高了診斷質量，還促進了跨學科合作。未來應著重增強透明度和擴大應用範圍，確保遵守倫理和法律標準。 PubMed DOI

Enhanced Artificial Intelligence in Bladder Cancer Management: A Comparative Analysis and Optimization Study of Multiple Large Language Models.
膀胱癌管理中增強人工智慧的應用：多個大型語言模型的比較分析與優化研究。 J Endourol 2025-03-18

本研究探討大型語言模型（LLMs）在膀胱癌管理中的表現。研究設計了100個臨床問題，評估六種LLMs的回應準確性。結果顯示，Claude-3.5-Sonnet以89.33%準確率最佳，ChatGPT-4為85.67%。GPT-3.5-Turbo經過兩階段訓練後，準確率從74.33%提升至100%。研究顯示，針對性訓練能顯著改善模型表現，並指出策略性改進可克服專業醫學應用中的限制。 PubMed DOI

Large Language Models as Decision-Making Tools in Oncology: Comparing Artificial Intelligence Suggestions and Expert Recommendations.
大型語言模型作為腫瘤學中的決策工具：比較人工智慧建議與專家推薦。 JCO Clin Cancer Inform 2025-03-20

這項研究評估大型語言模型（LLMs）在根據病患醫療紀錄生成早期乳腺癌治療選項的準確性。使用2024年初的多學科團隊會議紀錄，測試了三個AI模型：Claude3-Opus、GPT4-Turbo和LLaMa3-70B。結果顯示，Claude3-Opus準確率86.6%，GPT4-Turbo為85.7%，LLaMa3-70B則為75.0%。兩者在輔助內分泌和靶向治療上表現良好，但在輔助放射治療上則有高估的情況。研究建議需進一步探討這些模型在臨床上的實際應用。 PubMed DOI

Retrospective Comparative Analysis of Prostate Cancer In-Basket Messages: Responses From Closed-Domain Large Language Models Versus Clinical Teams.
前瞻性比較分析前列腺癌 In-Basket 訊息：封閉領域大型語言模型與臨床團隊的回應。 Mayo Clin Proc Digit Health 2025-03-25

這項研究評估了基於GPT-4的RadOnc-GPT在前列腺癌治療相關訊息回覆的有效性，旨在減輕臨床團隊的工作負擔。該模型與梅奧診所的電子健康紀錄整合，分析了90位非轉移性前列腺癌患者的158條訊息。結果顯示，RadOnc-GPT在同理心上稍勝臨床團隊，並在其他方面得分相當。雖然模型能為護理人員節省每條訊息5.2分鐘，臨床醫生則節省2.4分鐘，但仍存在上下文不足和知識缺口等限制。整體而言，該模型有助於提升醫療效率與溝通質量。 PubMed DOI

原始文章

站上相關主題文章列表