LLM 相關三個月內文章 / 第 20 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇論文提出一套專為小型建築設計的代理人式數位分身架構,每個組件由代理人管理,系統會持續自我更新並用知識圖譜編碼。數位分身能執行工作流程、與人協作,並結合知識圖譜與大型語言模型,用檢索增強生成技術回答自然語言問題。論文定義四種操作模式,展示五個代理人的離線應用,使用者可透過網頁介面互動與視覺化模型。 相關文章 PubMed DOI 推理

現有像ChatGPT-4o這類AI模型,在診斷老年性黃斑部病變時,表現還是比不上眼科醫師。不過,研究團隊透過專門設計的訓練課程,開發出RetinaVLM-Specialist,讓它在分期和轉診上表現已經追上資淺醫師,甚至比其他AI更準確。專家也認同這種課程式訓練,能讓AI更貼近臨床需求。 相關文章 PubMed DOI 推理

這篇論文分析300萬則AI應用程式用戶評論,發現約1.75%提到LLM幻覺,最常見是事實性錯誤。作者建立七種幻覺分類,並指出用戶回報這些錯誤時有特定語言和情緒特徵。研究建議,行動App應加強LLM錯誤監控和修正,提升用戶信任與軟體品質。 相關文章 PubMed DOI 推理

在學術寫作用 ChatGPT 這類 AI 時,常會遇到「參考文獻幻覺」問題,也就是 AI 會捏造或給錯引用,這對學術誠信很傷,特別是在重視實證的口腔顎面外科領域。建議加強編輯把關、提升 AI 素養,並用即時引用工具,確保文獻正確,維護學術公信力。 相關文章 PubMed DOI 推理

這項研究發現,微調過的BERT模型在分類病人安全事件報告時,比傳統CNN模型更能準確辨識罕見事件和嚴重程度,且在新資料上也有不錯表現。即使資料量少或分布不均,BERT只用預設參數就能有很好的效果,顯示其在醫療文本分類上相當有潛力。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o 回答子宮內膜異位症相關問題的表現,和人類專家差不多,品質、正確性和安全性都不輸專家。雖然專家多能分辨 AI 回答,但 AI 仍有潛力協助病人獲取健康資訊。未來還需進一步研究 AI 在臨床應用的風險與接受度。 相關文章 PubMed DOI 推理

這項研究發現,利用AI(像是ChatGPT和Metrica PlayBase)輔助足球戰術教學,能讓大學生男生在戰術知識、決策力和學習滿意度上,都比傳統教練教學有更明顯的進步。結果顯示AI在運動教育上很有效,也展現出智慧戰術教學的發展潛力。 相關文章 PubMed DOI 推理

這項研究比較了三種多模態大型語言模型在甲狀腺超音波影像分類的表現,發現商業版 o3 準確度和一致性最好,但還是沒達到臨床標準。雖然加上影像標註和調整提示語有幫助,但提升有限。總結來說,這些 AI 工具還不夠成熟,還需要再改進才能安全用在臨床診斷上。 相關文章 PubMed DOI 推理

ChatGPT4 和 Perplexity AI 回答乾眼症常見問題的表現差不多,整體品質中等,各方面分數也有落差。ChatGPT4 在提出研究點子上稍微優秀。這兩款 AI 也許能在門診協助病患衛教,但還是需要專家把關,且在研究點子或文獻搜尋方面都不太可靠。 相關文章 PubMed DOI 推理

老師批改簡答題很花時間,常用選擇題反而限制學生思考。這項研究用大型語言模型(LLMs)協助老師批改大班簡答題,並和傳統人工批改做比較。結果發現,AI輔助批改能有效提供像小班教學一樣的個人化回饋和評分。 相關文章 PubMed DOI 推理