From technical to understandable: Artificial Intelligence Large Language Models improve the readability of knee radiology reports.
從專業術語轉換為易懂的語言：人工智慧大型語言模型改善膝部放射學報告的可讀性。 Knee Surg Sports Traumatol Arthrosc 2024-03-15

研究發現，使用人工智慧大型語言模型（AI-LLM）幫助患者理解膝蓋放射學報告效果顯著。報告變得更易懂，但仍可能有錯誤。建議醫師與患者一同檢視和討論報告，AI-LLM可作為提升患者理解的有用工具。 PubMed DOI

A survey analysis of the adoption of large language models among pathologists.
病理學家對大型語言模型採用的調查分析。 Am J Clin Pathol 2024-07-30

這項研究調查了病理學家對大型語言模型（LLM）如ChatGPT的使用情況。全球215位病理學家參與，結果顯示46.5%曾用LLM處理專業任務，並感受到明顯的時間節省。學術病理學家對LLM的理解較好，雖然有時提供不正確資訊，但在病理學知識上被認為具中等專業能力。LLM主要用於創建教育材料和編程，參與者對資訊準確性和隱私問題表示擔憂。整體來看，病理學家對LLM的接受度逐漸提高，但仍對可靠性和倫理問題有顧慮。 PubMed DOI

The Potential Impact of Large Language Models on Doctor-Patient Communication: A Case Study in Prostate Cancer.
大型語言模型對醫生與病人溝通的潛在影響：前列腺癌的案例研究。 Healthcare (Basel) 2024-08-09

近年來，大型語言模型（LLMs）已被應用於醫療領域，特別是在前列腺癌的病患溝通上。我們的研究評估了三種LLM的效果，包括ChatGPT（3.5）、Gemini（Pro）和Co-Pilot（免費版），並與官方的羅馬尼亞前列腺癌病患指南進行比較。透過隨機和盲測，八位醫療專業人員根據準確性、及時性、全面性和使用友好性進行評估。結果顯示，LLM，尤其是ChatGPT，通常提供比指南更準確且友好的資訊，顯示出其在改善醫療溝通上的潛力。不過，不同模型的表現差異也顯示出需要量身定制的實施策略。 PubMed DOI

Large language model answers medical questions about standard pathology reports.
標準病理報告的醫學問題解答：大型語言模型。 Front Med (Lausanne) 2024-10-03

這項研究評估了大型語言模型（LLM），特別是ChatGPT，在回答結直腸癌相關病理問題的有效性。研究人員比較了ChatGPT的回答與腸胃科醫生的回答，並創建了一個互動系統，讓用戶上傳病理報告圖片以獲得AI生成的答案。結果顯示，對於常見問題，腸胃科醫生對AI的評價與傳統答案相似，但在特定報告問題上，AI的表現獲得更高評價。總體而言，ChatGPT能提供可信的病理問題答案，增強醫生與患者的溝通。 PubMed DOI

Validation of large language models for detecting pathologic complete response in breast cancer using population-based pathology reports.
利用基於人群的病理報告驗證大型語言模型在乳腺癌中檢測病理完全反應的效果。 BMC Med Inform Decis Mak 2024-10-04

這項研究評估大型語言模型（LLMs）在分析乳腺癌病理報告的有效性，特別是識別病理完全反應（pCR）。研究者使用兩種方法：提取不同變壓器模型的嵌入和微調GPT-2模型，分析351名接受新輔助化療的女性患者。優化後的結果顯示，敏感度達95.3%，陽性預測值90.9%，F1分數93.0%。這顯示LLMs在提取臨床數據上優於傳統機器學習模型，並強調其在改善病人護理和乳腺癌管理的潛力，但仍需進一步驗證以確保結果的可靠性。 PubMed DOI

Assessing Large Language Models for Oncology Data Inference From Radiology Reports.
評估大型語言模型在放射學報告中對腫瘤學數據推斷的能力。 JCO Clin Cancer Inform 2024-12-11

這項研究評估了專有與開放的大型語言模型（LLMs）在分析胰臟癌放射學報告的有效性，重點在於疾病的存在、位置及治療反應。研究分析了203份去識別化的報告，使用了GPT-4、GPT-3.5-turbo及開放模型如Gemma-7B和Llama3-8B。結果顯示，GPT-4在確定疾病狀態上準確率最高，達75.5%。開放模型在某些方面表現不如專有模型，但仍具潛力，特別是在專有模型無法使用時。這項研究為未來腫瘤學領域的LLM研究提供了重要資源。 PubMed DOI

Leveraging Large Language Models for Improved Understanding of Communications With Patients With Cancer in a Call Center Setting: Proof-of-Concept Study.
利用大型語言模型改善癌症患者在呼叫中心環境中的溝通理解：概念驗證研究。 J Med Internet Res 2024-12-11

這項研究探討了GPT-4在癌症護理電話諮詢中分類病人意圖的效果，並與傳統深度學習模型如LSTM和BERT進行比較。研究使用了430,355句的數據，發現GPT-4的準確率達85.2%，明顯優於LSTM（73.7%）和BERT（71.3%）。特別是在處理複雜查詢如「治療」和「症狀」時，GPT-4的表現提升超過15%。研究指出，雖然GPT-4在醫療應用中展現潛力，但仍需改進提示設計和類別定義，未來將探索與人類監督的混合系統。 PubMed DOI

The Transformative Potential of Large Language Models in Mining Electronic Health Records Data: Content Analysis.
大型語言模型在挖掘電子健康紀錄數據中的變革潛力：內容分析。 JMIR Med Inform 2025-01-02

這項研究評估了大型語言模型（LLMs），特別是GPT-3.5和GPT-4，在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告，結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生，達到96.8%。雖然醫生在精確度上稍勝一籌，但GPT-4的表現更一致，且能推斷出非明確的共病情況。整體而言，這些模型在提取資訊方面顯示出潛力，可能成為數據挖掘的重要工具。 PubMed DOI

Provision of Radiology Reports Simplified With Large Language Models to Patients With Cancer: Impact on Patient Satisfaction.
大型語言模型簡化癌症患者的放射學報告提供：對患者滿意度的影響。 JCO Clin Cancer Inform 2025-01-29

這項研究探討大型語言模型（LLMs）生成的簡化放射學報告對腫瘤科病人的影響，分為兩個階段進行。第一階段測試五種LLMs，結果顯示Claude Opus-Prompt 3表現稍佳。第二階段中，100名病人分為兩組，一組收到原始報告，另一組則收到簡化版本。調查結果顯示，簡化報告的病人對疾病理解更好，對醫療狀況感到更有信心。雖然少數報告需修正，但顯示LLMs能有效簡化醫療資訊，仍需人類監督。整體而言，研究建議LLMs可增強病人對健康資訊的理解。 PubMed DOI

MedBot vs RealDoc: efficacy of large language modeling in physician-patient communication for rare diseases.
MedBot 與 RealDoc：大型語言模型在罕見疾病的醫生-病人溝通中的效能。 J Am Med Inform Assoc 2025-02-25

這項研究評估了GPT-4和BioMistral 7B兩個大型語言模型在回答罕見疾病病人詢問的表現，並與醫生的回應進行比較。結果顯示，GPT-4的表現優於醫生和BioMistral 7B，回應被認為正確且具同理心。BioMistral 7B的回應則部分正確，而醫生的表現介於兩者之間。專家指出，雖然LLMs能減輕醫生負擔，但仍需嚴格驗證其可靠性。GPT-4在溝通上表現佳，但需注意回應的變異性和準確性。 PubMed DOI

原始文章

站上相關主題文章列表