原始文章

這項研究探討大型語言模型(如GPT-4)如何提升術後病理報告的可讀性與理解度。研究分析了698份來自四家醫院的病理報告,重點在惡性腫瘤。透過創建詮釋性病理報告(IPRs)模板,發現使用IPRs後,病人的理解分數從5.23提升至7.98,醫生與病人溝通時間也減少超過70%。雖然未直接測量病人的治療結果,但改善的理解度和溝通效率可能對病人的參與度有正面影響,顯示人工智慧在醫療溝通中的潛力。 PubMed DOI


站上相關主題文章列表

研究發現,使用人工智慧大型語言模型(AI-LLM)幫助患者理解膝蓋放射學報告效果顯著。報告變得更易懂,但仍可能有錯誤。建議醫師與患者一同檢視和討論報告,AI-LLM可作為提升患者理解的有用工具。 PubMed DOI

這項研究調查了病理學家對大型語言模型(LLM)如ChatGPT的使用情況。全球215位病理學家參與,結果顯示46.5%曾用LLM處理專業任務,並感受到明顯的時間節省。學術病理學家對LLM的理解較好,雖然有時提供不正確資訊,但在病理學知識上被認為具中等專業能力。LLM主要用於創建教育材料和編程,參與者對資訊準確性和隱私問題表示擔憂。整體來看,病理學家對LLM的接受度逐漸提高,但仍對可靠性和倫理問題有顧慮。 PubMed DOI

近年來,大型語言模型(LLMs)已被應用於醫療領域,特別是在前列腺癌的病患溝通上。我們的研究評估了三種LLM的效果,包括ChatGPT(3.5)、Gemini(Pro)和Co-Pilot(免費版),並與官方的羅馬尼亞前列腺癌病患指南進行比較。透過隨機和盲測,八位醫療專業人員根據準確性、及時性、全面性和使用友好性進行評估。結果顯示,LLM,尤其是ChatGPT,通常提供比指南更準確且友好的資訊,顯示出其在改善醫療溝通上的潛力。不過,不同模型的表現差異也顯示出需要量身定制的實施策略。 PubMed DOI

這項研究評估了大型語言模型(LLM),特別是ChatGPT,在回答結直腸癌相關病理問題的有效性。研究人員比較了ChatGPT的回答與腸胃科醫生的回答,並創建了一個互動系統,讓用戶上傳病理報告圖片以獲得AI生成的答案。結果顯示,對於常見問題,腸胃科醫生對AI的評價與傳統答案相似,但在特定報告問題上,AI的表現獲得更高評價。總體而言,ChatGPT能提供可信的病理問題答案,增強醫生與患者的溝通。 PubMed DOI

這項研究評估大型語言模型(LLMs)在分析乳腺癌病理報告的有效性,特別是識別病理完全反應(pCR)。研究者使用兩種方法:提取不同變壓器模型的嵌入和微調GPT-2模型,分析351名接受新輔助化療的女性患者。優化後的結果顯示,敏感度達95.3%,陽性預測值90.9%,F1分數93.0%。這顯示LLMs在提取臨床數據上優於傳統機器學習模型,並強調其在改善病人護理和乳腺癌管理的潛力,但仍需進一步驗證以確保結果的可靠性。 PubMed DOI

這項研究評估了專有與開放的大型語言模型(LLMs)在分析胰臟癌放射學報告的有效性,重點在於疾病的存在、位置及治療反應。研究分析了203份去識別化的報告,使用了GPT-4、GPT-3.5-turbo及開放模型如Gemma-7B和Llama3-8B。結果顯示,GPT-4在確定疾病狀態上準確率最高,達75.5%。開放模型在某些方面表現不如專有模型,但仍具潛力,特別是在專有模型無法使用時。這項研究為未來腫瘤學領域的LLM研究提供了重要資源。 PubMed DOI

這項研究探討了GPT-4在癌症護理電話諮詢中分類病人意圖的效果,並與傳統深度學習模型如LSTM和BERT進行比較。研究使用了430,355句的數據,發現GPT-4的準確率達85.2%,明顯優於LSTM(73.7%)和BERT(71.3%)。特別是在處理複雜查詢如「治療」和「症狀」時,GPT-4的表現提升超過15%。研究指出,雖然GPT-4在醫療應用中展現潛力,但仍需改進提示設計和類別定義,未來將探索與人類監督的混合系統。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告,結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生,達到96.8%。雖然醫生在精確度上稍勝一籌,但GPT-4的表現更一致,且能推斷出非明確的共病情況。整體而言,這些模型在提取資訊方面顯示出潛力,可能成為數據挖掘的重要工具。 PubMed DOI

這項研究探討大型語言模型(LLMs)生成的簡化放射學報告對腫瘤科病人的影響,分為兩個階段進行。第一階段測試五種LLMs,結果顯示Claude Opus-Prompt 3表現稍佳。第二階段中,100名病人分為兩組,一組收到原始報告,另一組則收到簡化版本。調查結果顯示,簡化報告的病人對疾病理解更好,對醫療狀況感到更有信心。雖然少數報告需修正,但顯示LLMs能有效簡化醫療資訊,仍需人類監督。整體而言,研究建議LLMs可增強病人對健康資訊的理解。 PubMed DOI

這項研究評估了GPT-4和BioMistral 7B兩個大型語言模型在回答罕見疾病病人詢問的表現,並與醫生的回應進行比較。結果顯示,GPT-4的表現優於醫生和BioMistral 7B,回應被認為正確且具同理心。BioMistral 7B的回應則部分正確,而醫生的表現介於兩者之間。專家指出,雖然LLMs能減輕醫生負擔,但仍需嚴格驗證其可靠性。GPT-4在溝通上表現佳,但需注意回應的變異性和準確性。 PubMed DOI