LLM 相關三個月內文章 / 第 18 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇論文提出 LLM-TKIE 方法,能從非結構化表格中擷取關鍵資訊,不需微調就能直接用大型語言模型做語意推理並產生結構化輸出。實驗結果顯示,在多個資料集上表現都比現有方法好,且針對不同 LLM 與量化策略也有實用建議,對開發相關系統很有參考價值。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-3.5在回答乳糜瀉相關常見問題時,整體表現相當準確,特別是在疾病管理建議上表現突出。不過,在解釋乳糜瀉成因時,準確度稍弱。專家評分一致性中等,且有一位專家評分較穩定。整體來說,ChatGPT-3.5有潛力成為乳糜瀉患者可靠的資訊來源。 相關文章 PubMed DOI 推理

這項研究比較了ChatGPT 3.5、4.0和Google Gemini在回答乳糜瀉和第一型糖尿病常見問題時的表現。三款AI都能給出正確完整的答案,其中ChatGPT 4.0最容易閱讀,但整體來說,易讀性還有進步空間。這些AI有潛力協助病患認識慢性兒童疾病,但內容還需更淺顯易懂。 相關文章 PubMed DOI 推理

這項研究用AI和自然語言處理分析2014到2024年神經介入手術期刊近5,000篇論文,發現女性第一作者比例雖有小幅提升,但女性資深作者仍偏少,且美國等多數國家女性代表性很低。整體來說,性別不平等問題依然明顯,全球還需要更積極推動性別平等。 相關文章 PubMed DOI 推理

這項研究開發了一套用大型語言模型自動化網絡統合分析流程,只要輸入資料就能完成模型選擇、分析和結果解讀。結果顯示,這方法的準確度和完整性跟現有標準差不多,有助於提升健康研究的效率和一致性,特別適合法規越來越嚴格的情況。 相關文章 PubMed DOI 推理

GAMER 計畫正在制定一套專為醫學研究中使用生成式 AI 的報告指引,重點回應倫理、隱私和透明度問題。透過文獻回顧和專家共識,將建立檢查清單,協助研究人員、審稿人和編輯確保報告嚴謹透明,促進 AI 醫療研究的合作與知識分享。 相關文章 PubMed DOI 推理

這項研究發現,大型語言模型(不論是商業版還是開源、重視隱私的版本),在用METRICS系統評估放射影像組學研究品質時,表現跟人類放射科醫師一樣可靠。開源模型的表現也不輸商業版,代表LLMs不但能協助標準化評估,還能兼顧資料隱私。 相關文章 PubMed DOI 推理

這項研究發現,開發中國家的護理師生在學術上使用大型語言模型時,常因不熟悉、偏好傳統方式、擔心隱私及內容真實性而卻步。使用者多用於寫作和學習,但也有人不當用於考試。主要困難包括操作不易、內容不準、太艱深及功能有限。研究建議加強認知推廣、訓練、政策制定及提升模型可靠性,這些建議也適用於其他領域。 相關文章 PubMed DOI 推理

這項研究發現,生成式AI聊天機器人在回應自殺相關問題時,近一年來表現明顯進步,內容更正確、詳盡,也更常提供自殺防治專線等資源。不過,研究提醒AI不能取代專業心理健康協助,建議要定期檢查AI回應內容,確保符合自殺防治標準。 相關文章 PubMed DOI 推理

最新研究用160題精神科考題測試27款聊天機器人,發現OpenAI的ChatGPT-o1-preview表現最好,特別擅長診斷和治療推理。不過,所有機器人在記憶細節和處理罕見議題時還是有缺點,有時也會推理錯誤。專家認為,這些AI未來有機會協助精神科臨床,但實際應用前還需要嚴格監督和持續改進。 相關文章 PubMed DOI 推理