LLM 相關三個月內文章 / 第 60 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

HoloDx 是一套全新阿茲海默症診斷系統,結合多種臨床資料、專家知識和大型語言模型,讓診斷更準確、易解釋。經五組資料集測試,表現都比現有方法好,也適用於不同病人族群。程式碼已開源,有興趣可到 GitHub 查看。 相關文章 PubMed DOI 推理

OpenAI 最新 o1 語言模型在近 7,000 題眼科題目中,正確率和 F1 分數都勝過其他主流模型。雖然在部分文字生成評分上,GPT-4o 和 GPT-4 表現更好,但專家認為 o1 的回答更有臨床實用性、組織也較清楚。不過,o1 在某些專業眼科任務上還是有侷限,未來可能需要針對特定領域再訓練模型。 相關文章 PubMed DOI 推理

這項研究比較GPT-4o、GPT CodeMedic、外科醫師和醫院編碼人員在腦膜瘤手術報告分配德國OPS代碼的表現。結果發現,專業人員在正確分配基本代碼上還是比較厲害,但GPT CodeMedic在找出能增加收益的代碼時,表現已經快追上醫師。雖然LLMs目前還會犯錯,但未來有機會超越專家。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o能準確從門診神經血管病歷中產生結構化摘要,正確率高(≥0.96),特別適合擷取穩定資訊如動脈瘤位置。不過,對於會隨時間變動的資料(如動脈瘤大小、用藥)及多次影像檢查,表現較不穩定。整體來說,GPT-4o適合輔助臨床工作,但追蹤變化和資料隱私仍需加強。 相關文章 PubMed DOI 推理

這項研究比較了最新AI語言模型在精神科案例上的表現,發現雖然診斷和建議比舊版進步,但在風險評估、藥物建議和文化敏感度上仍有明顯缺陷。遇到複雜案例時,模型的臨床推理會變差,建議也可能不一致。這些AI無法取代專業醫師,但在特定情境下可作為輔助。未來需提升透明度和提示設計,才能更安全應用於精神醫學。 相關文章 PubMed DOI 推理

我們測試了五款主流聊天機器人,發現 ChatGPT-4o、DeepSeek-R1 和 Grok-2 的正確率最高(80%),其中 ChatGPT-4o 校準最準確。DeepSeek-R1 內容最易讀,住院醫師則覺得 Claude 3.5 最好懂。整體來看,各家 AI 各有優缺點,若要在泌尿科實際應用,還需要再優化。 相關文章 PubMed DOI 推理

這項研究開發了一套半自動化AI系統(VITAMedSec),能用大型語言模型分析醫療器材安全資料,並自動比對公開漏洞資訊,協助威脅建模,減少人工參與。雖然測試結果不錯,但還需要實際應用驗證,同時也提醒要注意倫理議題。 相關文章 PubMed DOI 推理

AI正快速改變公共衛生,但現有課程多半沒教AI技能。隨著AI工具在疾病預測、健康溝通等應用越來越多,公共衛生學生和專業人員學習AI已經很重要。本文指出訓練上的缺口,並建議把AI倫理、技術和批判思考等核心能力納入課程,幫助培養未來公共衛生人才。 相關文章 PubMed DOI 推理

這是一則針對 DOI: 10.3389/fdgth.2025.1624786 這篇文章的更正通知。 相關文章 PubMed DOI 推理

AI技能對大學生找工作越來越重要,懂AI、會用像ChatGPT這類工具的畢業生,更容易找到相關工作,也覺得自己工作表現更好、職涯發展更順。不過,還是有不少人覺得自己準備不夠。研究建議大學要趕快把AI訓練納入課程,推動多元且持續的教育,才能跟上數位時代的需求。 相關文章 PubMed DOI 推理