LLM 相關三個月內文章 / 第 22 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,AI在急性疾病順勢療法建議上,雖能提供多個選項,但和真人執業者的選擇一致性不高,只有17%是AI的首選,而且AI無法給出後續處理建議。結論是,目前AI還不能取代真人執業者,臨床應用時要特別小心驗證。 相關文章 PubMed DOI 推理

HomeDOCtor 是斯洛維尼亞開發的醫療 AI 平台,結合檢索增強生成技術和專業指引資料庫。臨床測試下,診斷準確率超過 95%,表現比 ChatGPT-4o 更好。六個月全國推廣期間,獲得使用者高度好評。它能快速給出在地化醫療建議,協助分流簡單個案,辨識需專業介入的情況,減輕醫療負擔,並符合歐盟個資規範。 相關文章 PubMed DOI 推理

這篇研究發現,利用大型語言模型(LLM)生成的合成資料,可以大幅提升機器學習模型預測水泥與外加劑相容性的準確度。特別是NCART模型表現最好,顯示LLM資料增強對水泥流變性質分析很有幫助。 相關文章 PubMed DOI 推理

這項研究比較了三款多模態AI(ChatGPT-4o、Claude 4 Opus、Gemini 2.5 Pro)在腦部MRI分類的表現。ChatGPT-4o和Gemini 2.5 Pro在判斷影像切面和有無對比劑上很準確,ChatGPT-4o在MRI序列分類上表現最好。Claude 4 Opus則較弱,且部分模型會出現錯誤內容。總結來說,這些AI有潛力,但臨床應用前還是要專家把關。 相關文章 PubMed DOI 推理

這項研究比較五款主流大型語言模型,發現雖然大家都建議看醫生,但在文化敏感度、內容深度和關鍵字完整性上差異很大。Grok對少數族群最貼心,Meta AI則幾乎沒做調整。沒有任何一款模型能全面涵蓋所有族群的乾眼症成因,顯示醫師監督和資訊標準化很重要,才能確保AI醫療資訊公平又正確。 相關文章 PubMed DOI 推理

這項研究發現,Whisper自動語音辨識系統在評估英語唐氏症患者的語音清晰度時,表現接近一般人類聽眾,特別是在單字辨識上。不過,對於希伯來語患者,ASR的準確度明顯較低,顯示未來臨床應用英語可行性高,但希伯來語還需進一步優化。 相關文章 PubMed DOI 推理

這項研究比較不同版本的 ChatGPT 在牙科全口 X 光片上計算牙齒數量和測量剩餘骨高度的表現。結果顯示,ChatGPT 4.5、o3 和 o4-mini-high 在牙齒計數上跟臨床醫師很接近,但 o1 準確度較差。不過,所有模型在骨高度測量都偏高估,目前還不適合臨床診斷牙周病。 相關文章 PubMed DOI 推理

這項研究發現,像ChatGPT這類AI生成的頭頸部超音波選擇題,品質跟醫師寫的差不多,但還是比專家審核過的題目略差。AI能幫忙快速出題,節省時間,但正式用前還是要專家把關,無法完全取代人類專業。 相關文章 PubMed DOI 推理

這項研究調查沙烏地阿拉伯79位放射科醫師,發現他們普遍支持用ChatGPT-4產生、適合病人閱讀的放射科報告,尤其是乳房攝影報告最受肯定。不過,MRI報告容易讓病人焦慮,醫師建議語言要更清楚、安心。整體來說,報告若有摘要、術語解釋和說明,醫師接受度更高。 相關文章 PubMed DOI 推理

BASIL DB 是一個線上知識圖譜資料庫,整理超過 43,000 篇論文,結合食物、生物活性化合物和健康效益的資訊。它用自然語言處理技術,讓使用者能互動式查詢食物與健康的關聯,對營養學和疾病預防研究很有幫助。 相關文章 PubMed DOI 推理