LLM 相關三個月內文章 / 第 149 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了ChatGPT-4在解讀各種胃腸科影像的表現,分析了740張影像,並將預測結果與既有診斷進行比較。結果顯示,ChatGPT-4的準確性在不同程序中差異明顯,膠囊內視鏡的準確率介於50%到90%之間,設備輔助腸鏡為67%,而內視鏡超音波和高解析度肛門鏡的表現則較差。整體來看,這顯示ChatGPT-4的診斷能力尚不理想,臨床應用前仍需進一步改進。 相關文章 PubMed DOI

本研究評估了兩種AI模型(ChatGPT-4o和Claude 3.5 Sonnet)在檢測急性缺血性中風(AIS)方面的表現。分析了110例擴散加權影像(DWI),結果顯示Claude 3.5 Sonnet在靈敏度和特異性上均優於ChatGPT-4o,特別是在AIS的定位準確性上。雖然Claude 3.5 Sonnet的表現較佳,但兩者在準確性上仍有顯著限制,顯示出AI在臨床應用前需進一步發展。這強調了AI在放射診斷中的潛力與現階段的不足。 相關文章 PubMed DOI

本研究評估了人工智慧(AI),特別是OpenAI的自然語言處理技術,對胸腔多學科腫瘤委員會(MTB)決策的幫助。研究納入2023年1月至6月診斷為非小細胞肺癌的52位病患,AI模型生成的建議與MTB決策的一致性達76%,Kappa指數為0.59,手術建議的一致性更高,重複案例後達92.3%。結果顯示,AI可成為多學科腫瘤委員會決策的有力支持工具。 相關文章 PubMed DOI

本研究評估了大型語言模型(如ChatGPT)在癲癇診斷中的有效性,並比較了癲癇醫師與AI的診斷一致性。研究分析了597名急診患者,結果顯示神經科醫師診斷癲癇的比例為36.2%,而ChatGPT僅為18.2%。兩者之間的協議極低,Cohen's kappa值為-0.01,顯示AI在癲癇診斷上無法與人類醫師相提並論。雖然AI在識別非癲癇病例上表現較好,但仍需進一步研究以提升其診斷準確性。 相關文章 PubMed DOI

這項研究探討了ChatGPT-4在分析下肢缺損影像及理解複雜病例報告的能力,並與專業外科醫生及住院醫師進行比較。研究在瑞士、德國和奧地利進行,52名參與者評估影像並選擇重建技術。結果顯示,ChatGPT-4在識別最佳解決方案上有困難,而專業外科醫生則表現出高度一致性。這強調了人類專業知識在患者治療計畫中的重要性,建議AI可作為輔助工具,而非取代技術熟練的外科醫生。 相關文章 PubMed DOI

這項研究探討了人工智慧工具,特別是ChatGPT和Google的Gemini,在協助醫療專業人員評估懷疑神經遺傳疾病患者的表現。研究中提出了九十個問題,涵蓋臨床診斷和遺傳風險等主題。結果顯示,ChatGPT的準確性優於Gemini,但兩者都存在診斷不準確和虛假信息的問題。雖然這些AI工具在支持臨床醫生方面有潛力,但使用時需謹慎,並應與專業醫生合作,以確保評估的可靠性。 相關文章 PubMed DOI

抗微生物抗藥性是全球健康的重要議題,亟需創新策略來改善抗生素管理。AI 聊天機器人,特別是大型語言模型,能協助臨床醫師優化抗生素治療。本研究回顧了過去五年相關文獻,發現AI 聊天機器人能提供抗生素建議、增強醫學教育及改善臨床決策,但仍面臨臨床細節管理不一致、算法偏見及數據隱私等挑戰。未來需進行嚴格的臨床試驗及跨學科合作,以確保其安全有效地應用於臨床。 相關文章 PubMed DOI

改善重症監護病房(ICU)中文化少數群體病患及其家屬的溝通非常重要,因為語言障礙可能影響病患安全和家庭參與。目前的翻譯工具如Google Translate和ChatGPT在醫學術語上仍有不足。因此,開發專門針對醫療情境的翻譯工具是必要的,能增強語言少數群體獲得醫療服務的機會。 目前尚無專為ICU設計的AI翻譯應用程式,解決病患隱私和數據保密問題也很重要。針對ICU的人工智慧翻譯工具(AITIC)能提供快速準確的即時翻譯,改善溝通並提升護理品質。 相關文章 PubMed DOI

本研究探討AI模型ChatGPT-4 Omni在非對比電腦斷層掃描影像中檢測顱內出血的有效性。分析240個案例後,發現該模型在識別影像模式上達到100%準確率,但在ICH檢測的準確率為68.3%。敏感性為79.2%,特異性57.5%。在第二次評估中,準確率提升至73.3%。雖然模型在識別影像模式和檢測ICH方面有潛力,但在出血定位和分類上仍有不足,建議進一步訓練以提升其醫療應用表現。 相關文章 PubMed DOI

放射治療雖然有效,但手動劃定目標常常耗時且不穩定。這項研究介紹了Radformer,一種新型視覺語言模型,結合臨床文本和醫學影像,提升自動化的目標劃定。Radformer使用分層視覺變壓器和大型語言模型,並透過視覺語言注意模組整合信息。在2,985名頭頸癌患者的數據中,Radformer在目標劃定上表現優於現有模型,顯示出顯著的準確性進步,為AI輔助的放射治療計劃自動化鋪平道路。 相關文章 PubMed DOI