原始文章

這項研究介紹了AMIE(Articulate Medical Intelligence Explorer),一個專為醫學診斷對話設計的AI系統。AMIE透過自我對弈學習,提升在各種醫療情況下的表現。在一項隨機雙盲研究中,AMIE與初級保健醫生進行評估,結果顯示其診斷準確性超越醫生。不過,研究也指出使用同步文字聊天的限制,這在臨床上不常見。雖然前景看好,但AMIE在實際醫療環境中的應用仍需進一步研究。 PubMed DOI


站上相關主題文章列表

這項研究探討利用生成式人工智慧技術,開發虛擬病人程式,協助醫學生透過聊天機器人練習病史採集。五位專家使用韓國的AI平台Naver HyperCLOVA X®進行測試,針對一位有尿路問題的病人進行評估。結果顯示,聊天機器人產生的回應中,約2.6%的字詞被認為不太可信。專家對AI的回應在相關性、有效性和準確性上評分較高,但流暢性則持中立態度。整體而言,這種方法可行,但仍需改進以增強回應的連貫性和自然度。 PubMed DOI

本研究探討AI模型(如GPT-3.5和GPT-4)在急診科生成病症鑑別診斷的表現,並與急診科醫師的準確性進行比較。結果顯示,ChatGPT-4的準確率為85.5%,略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面,ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值,建議未來進一步探索AI在醫療中的應用。 PubMed DOI

大型語言模型的快速進步讓人工智慧生成內容(AIGC)在醫學考試題目創建上展現新可能。本研究指出傳統紙本考試的限制,並提出利用AIGC設計各類型題目的簡化方法,包括選擇題、案例研究和視頻題目。雖然AIGC在模擬臨床情境上表現優異,但手動審查仍是確保內容準確性和品質的關鍵。未來可能會結合檢索增強生成、多人系統和視頻生成等技術,進一步提升醫學考試準備的品質,支持醫學生的有效訓練。 PubMed DOI

這項研究探討人類與大型語言模型(LLMs)合作對腦部MRI掃描診斷準確性和效率的影響。研究中,六名放射科住院醫師評估40個挑戰性MRI案例,分別使用傳統網路搜尋和LLM輔助搜尋。結果顯示,LLM輔助的診斷準確率為61.4%,高於傳統的46.5%,且差異具統計意義。不過,解讀時間和信心水平未見變化。研究指出的挑戰包括案例描述不準確、LLM的幻覺現象及上下文不足。雖然LLM能提升診斷準確性,但仍需進一步研究以優化人類與LLM的合作。 PubMed DOI

多代理對話(MAC)框架是為了提升疾病診斷而設計的,透過臨床多學科團隊的合作。在一項針對302個罕見疾病案例的研究中,MAC的表現超越了GPT-3.5和GPT-4等單一模型,無論是在初診還是後續諮詢中,診斷準確性和建議檢測效果都更佳。最佳配置為四位醫生代理和一位監督代理,並以GPT-4為基礎模型。MAC在多次測試中表現穩定,並且在性能上優於其他方法,顯著提升了大型語言模型的診斷能力,為未來醫療研究提供了新方向。 PubMed DOI

這項研究介紹了Articulate Medical Intelligence Explorer (AMIE),一個大型語言模型,旨在提升醫療診斷推理。研究評估AMIE在生成鑑別診斷的有效性,並與傳統方法比較。二十位臨床醫師針對302個複雜案例進行評估,結果顯示AMIE的準確率達59.1%,遠超過未經協助的醫師33.6%。使用AMIE的醫師準確率為51.7%,也高於僅依賴傳統資源的醫師。這些結果顯示AMIE有潛力提升診斷準確性,並強調在真實環境中進一步評估的必要性。 PubMed DOI

這項研究比較 ChatGPT-4、Gemini 1.5 和傳統診斷系統 DXplain,在36個臨床案例中測試有無檢驗數據的表現。沒檢驗數據時,DXplain雖然正確診斷次數較多,但差異不顯著。有檢驗數據後,三者表現都提升。研究建議結合 LLMs 的語言理解和 DDSS 的推理能力,有望提升診斷支援效果。 PubMed DOI

這項研究發現,DeepSeek-R1 AI 能有效協助加護病房住院醫師診斷複雜重症,讓診斷正確率從 27% 提升到 58%,AI 自己的正確率則是 60%。有 AI 幫忙時,住院醫師不只診斷更準確,速度也更快,鑑別診斷品質也提升。整體來說,這類 AI 未來很有機會成為加護病房醫師的重要幫手。 PubMed DOI

這項研究找來70位醫師,測試專為醫師協作設計的GPT AI診斷系統。無論是AI先診斷還是醫師先診斷,協作後的正確率都比傳統工具高(85%和82%對75%),和單純AI診斷(90%)差不多。結果顯示,協作型AI能有效提升診斷準確率,也促進醫師與AI的合作。 PubMed DOI

單靠大型語言模型(LLMs)做高風險決策有風險,因為它們會出現幻覺和偏誤。這項研究提出結合醫師和LLM的混合系統,分析四萬多個診斷案例後發現,醫師和LLM合作比單獨使用任何一方都更準確,因為他們各有不同的優缺點。這種混合方式能提升醫療診斷的準確率。 PubMed DOI