LLM 相關三個月內文章 / 第 32 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,分光光度計在牙齒色彩比對的準確度明顯優於ChatGPT-4和Gemini 1.5 Pro兩款AI工具。雖然AI的表現還未達到臨床標準,但已展現出一定潛力,未來有機會在牙科應用上發揮更大作用。 相關文章 PubMed DOI 推理

這項研究發現,通用型大型語言模型(如 ChatGPT-4、ChatGPT o3、Gemini 2.5 Pro)在子宮頸抹片診斷上,雖然能有效區分正常與異常樣本,但在細分類型判斷和感染偵測上表現不佳,準確度不穩定。目前這些模型還不適合用來做子宮頸細胞學診斷輔助。 相關文章 PubMed DOI 推理

這項研究用大型語言模型自動擷取科學論文的重點,分兩步驟找出暴露-結果配對及其關係,比傳統一步驟法更準確,特別是在判斷效果方向和顯著性上。以鹽分攝取和血壓為例,證明這方法能快速整合大量證據,補足統合分析,幫助解決科學爭議。 相關文章 PubMed DOI 推理

這項研究比較了ChatGPT-4o和DeepSeek-R1兩款AI,從117份MRI報告中自動擷取克隆氏症活動度指標(sMARIA分數)。結果顯示,兩者準確度都接近人類,ChatGPT表現稍好。只要有適當監督,這類AI未來有望協助大規模研究和臨床決策。 相關文章 PubMed DOI 推理

這篇研究發現,大型語言模型(LLM)計算的「surprisal」值,跟大腦語言理解時的神經反應(N400、P600)只有部分相關,尤其容易被單字聯想影響。特別是在小型模型中更明顯,且無法解釋P600效應。總結來說,現有LLM的surprisal還不能穩定反映大腦語言處理的神經機制。 相關文章 PubMed DOI 推理

研究發現,ChatGPT-4在與整形外科相關的疾病管理中,幾乎都會主動提到整形外科,且多半列為首選;而在不相關疾病則完全不提。這表示AI在健康資訊裡,對整形外科的辨識度和能見度都很高。 相關文章 PubMed DOI 推理

這篇論文整理了大型語言模型(LLMs)低位元量化的技術,說明如何用更少的位元數來減少記憶體和運算需求。內容包括基本原理、新資料格式、系統實作、演算法策略,以及相關工具和未來發展,為後續研究提供方向。 相關文章 PubMed DOI 推理

生成式AI和大型語言模型正帶動智慧醫療進步,像是資料分析、虛擬助理和個人化照護都更有效率。不過,這些技術還有偏見、透明度不足、倫理和整合等問題要克服,才能真正安全應用在臨床上。 相關文章 PubMed DOI 推理

這項研究發現,經過特別設計、用簡單語言的GPT聊天機器人,能用更容易懂的方式回答耳鼻喉科病人問題,正確性也沒打折。這種客製化AI有助提升醫病溝通品質,讓病人更容易理解醫療資訊。 相關文章 PubMed DOI 推理

一項研究發現,ChatGPT針對介入放射科常見疾病的回答,資訊品質明顯低於參考文獻(平均分數1.3 vs 3.8)。主要問題在於缺乏資訊來源透明度,對治療風險、效益和機制說明不夠詳細。雖然內容沒偏見,但醫師在用AI健康資訊與病人溝通時,還是要特別小心。 相關文章 PubMed DOI 推理