LLM 相關三個月內文章 / 第 60 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,DeepSeek-R1 在回答小兒眼科問題時,正確率高於 ChatGPT-4.0,特別是在非斜視相關題目上表現更好。不過,兩者若要實際應用於臨床,還需要再加強改進。 相關文章 PubMed DOI 推理

這項研究比較了ChatGPT-4.0和Gemini 2.5 Pro在協助病理醫師診斷不同膠質瘤的表現。ChatGPT-4.0在25個病例中有88%正確率,對膠質母細胞瘤診斷最準,但對寡樹突膠質細胞瘤和星狀細胞瘤有誤判。男女診斷準確率差不多。整體來說,ChatGPT-4.0表現中等,未來有潛力,但還需改進才能臨床應用。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4.5針對不同國家的大腸直腸癌篩檢與追蹤建議,正確率落在40.7%到63.0%之間,表現會因國家和語言不同而有落差。尤其在瘜肉處理和追蹤建議上,羅馬尼亞和義大利的指引差異最大。研究也指出,ChatGPT的建議有時和標題不符,臨床可靠性令人擔憂,提醒大家用AI做地區醫療建議時要特別小心。 相關文章 PubMed DOI 推理

這項研究比較四種大型語言模型在回答原發性脊椎骨髓炎臨床問題的表現。結果顯示,ChatGPT-4o 和 Gemini 的答案最準確、最完整,明顯優於 Consensus。這代表先進的 LLMs 有潛力協助醫師做出更好的循證臨床決策。 相關文章 PubMed DOI 推理

AI在泌尿道感染和腎結石的診斷、治療及術後追蹤上越來越重要,不僅能快速偵測細菌和抗藥性,也能分析結石特性。ChatGPT-4在腎結石應用上評價最好。未來AI將在泌尿科照護扮演關鍵角色。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4 和 DeepSeek 兩個AI模型在診斷兒童罕見骨骼發育不良時,前三名診斷的準確率約63%,雖然比不上專家小組的82%,但在常見疾病上表現不錯。AI對極罕見或複雜案例較弱,不過DeepSeek還診斷出一個連專家都沒發現的案例。整體來說,AI有潛力成為醫師的輔助工具,尤其在醫療資源有限時,有助於縮短罕見疾病的診斷時間。 相關文章 PubMed DOI 推理

這篇研究提出FR-BINN神經網路模型,結合Fenton反應生物知識,能準確區分哪些慢性發炎疾病會提高癌症風險,還能找出關鍵基因和生物路徑(如能量代謝、氧化壓力)。模型結果穩定,也發現像NCOA1、SDHB等潛在癌症生物標記,為慢性發炎導致癌症提供新見解。 相關文章 PubMed DOI 推理

這項研究比較了三款熱門AI聊天機器人在回答哺乳問題時的表現,發現 ChatGPT-4o Pro 整體表現最佳,但三款AI都偶有錯誤或不一致。這些工具不能取代專業醫療建議,且仍有提供錯誤資訊的風險,未來在孕產婦健康領域應用前,準確性和可靠性還需加強。 相關文章 PubMed DOI 推理

這項研究發現,OpenAI o3在臨床藥學選擇題的表現比ChatGPT-3.5和約旦藥師都好,尤其在簡單題目和心血管領域。不過,兩款AI在難題上都不理想,且OpenAI o3答題穩定度較差。整體來說,OpenAI o3有潛力輔助臨床決策,但遇到複雜情況還是要專業人員把關。 相關文章 PubMed DOI 推理

這項研究提出 MedScrubCrew 系統,結合穩定匹配演算法、知識圖譜和大型語言模型代理人,自動化醫療預約和分診流程。這個框架有效提升醫療流程效率和準確性,為醫療自動化帶來實用解決方案。 相關文章 PubMed DOI 推理