LLM 相關三個月內文章 / 第 85 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較了大型語言模型(LLMs)、嵌入技術和傳統文字比對方法在判斷放射科報告變更重要性上的表現。結果顯示,LLMs,特別是Qwen3-235B-A22B模型,最接近專家評分,優於其他方法。LLMs有助於準確找出臨床重要變更,提升同儕審查效率與品質。 相關文章 PubMed DOI 推理

這項研究發現,AI聊天機器人能有效產生醫學影像選擇題,其中以Claude 3表現最佳,但多數題目僅考記憶,缺乏高層次思考。雖然AI可幫教師省時,題目品質仍需專家把關,並協助設計更能評量進階認知的題目。 相關文章 PubMed DOI 推理

研究發現,ChatGPT在急診模擬情境下,問診和同理心表現比醫師更好,減輕病人疑慮的能力也較強;臨床準確度則和醫師差不多。病人覺得ChatGPT的說明和可信度跟醫師一樣。這顯示AI結合醫師,有機會提升急診醫療品質。 相關文章 PubMed DOI 推理

這項初步研究發現,AI(特別是ChatGPT)在撰寫皮膚科門診書信時,正確性和速度都比傳統醫師-秘書方式好,但信件內容較複雜、冗長,可讀性較差。Heidi寫得最快、結構清楚但有時會漏細節。傳統方式雖然最容易閱讀,但正確性最低。AI有助提升效率和正確性,但可讀性、可靠性和資料安全還需再研究,才能真正應用在臨床上。 相關文章 PubMed DOI 推理

這篇研究發現,雖然最大型的語言模型(像是ChatGPT-4)在語法判斷上表現比人類好,但這優勢只出現在語法正確的句子,而且模型回答也比較不穩定。單靠把模型做大,還是無法讓AI像人類一樣理解語言,兩者在學習語言的方式上有根本差異。 相關文章 PubMed DOI 推理

沙烏地阿拉伯某護理學院研究發現,師生對ChatGPT的知識屬中等,態度多偏正面,但教師較擔心抄襲和正確性等倫理問題。是否用過ChatGPT、年級和教學年資都會影響看法,其中實際用過影響最大。大家關注用途、好處、疑慮和改進建議。建議加強AI素養教育和指引,才能負責任地運用於護理教育。 相關文章 PubMed DOI 推理

ECLoRA 是專為資源不均的客戶端設計的聯邦式微調方法,能用不同 LoRA 階數訓練大型語言模型。它用隨機化 SVD 提升聚合效率,並加上誤差補償,讓準確率更高、收斂速度更快(提升 1.54× 到 3.01×),聚合運算也比傳統 SVD 快約 40 倍,非常適合現實中的異質聯邦學習應用。 相關文章 PubMed DOI 推理

AMSunda 資料集是首個專為巽他語資訊檢索任務設計的資源,適合用來微調和評估嵌入模型。內容包含三元組(查詢、正向、負向)和 BEIR 格式資料,共有 1499 篇文件及數千筆查詢,有助於推動巽他語 IR 模型的研究發展。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4在精神科急診案例的分級上,和臨床醫師的判斷高度一致(Cohen’s Kappa 約0.77–0.78),但有點偏向過度分級(偽陽性較多,沒有偽陰性)。GPT-4有潛力成為精神健康電話分級的輔助工具,但建議還需再優化,才能更貼近臨床需求。 相關文章 PubMed DOI 推理

這項研究開發的 GlaucoRAG AI 工具,結合大型語言模型和青光眼專業知識庫,在診斷和答題表現上超越一般 AI,甚至可媲美專科醫師。它準確度高、答案相關,未來有望協助青光眼臨床判斷、研究和病患衛教。 相關文章 PubMed DOI 推理