LLM 相關三個月內文章 / 第 96 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較了三款AI(ChatGPT Plus、Copilot、Perplexity)在回答神經內分泌腫瘤管理問題的表現。ChatGPT Plus在清楚度上表現最好,但所有AI在複雜臨床問題上仍有困難。雖然AI有潛力成為資訊工具,但正確性不一,仍需醫師把關,確保病患溝通安全。 相關文章 PubMed DOI 推理

這項研究比較多種大型語言模型在判讀西班牙文MRI報告、找出上肢肌肉去神經支配相關神經的表現。研究用300份標註報告,並用多數決方式結合各模型預測,結果比單一模型更準確。這方法能協助放射科醫師判斷最可能受影響的神經。 相關文章 PubMed DOI 推理

這項研究發現,國高中老師雖能分辨AI生成的作業,但常誤把學生親寫的作業當成AI產出,尤其是資深老師。老師的個性也會影響他們對判斷作業原創性的信心。結果提醒我們,推動AI輔助學習時,需兼顧學生和老師的需求與特質,才能有效落實。 相關文章 PubMed DOI 推理

這項研究比較ChatGPT-Omni和Gemini兩款AI語言模型在500題神經外科案例題的表現。結果顯示,ChatGPT-Omni在準確性、相關性和清晰度上都比Gemini優秀,不論初次或後續測試都拿到較高分。雖然兩者都有進步,但ChatGPT-Omni始終領先,顯示它在神經外科決策和教學上很有潛力。 相關文章 PubMed DOI 推理

這篇論文提出新方法,測試大型語言模型(LLMs)能否監控和調整自己的神經激活狀態,也就是「後設認知」能力。結果發現,LLMs能學會回報並影響部分內部活動,但只侷限在較低維度的範圍。這對理解AI運作和提升AI安全性有重要意義。 相關文章 PubMed 推理

這篇研究用標註過的出院摘要,建立大規模資料集,並用多種大型語言模型來偵測八種物質使用情形。經過微調的 Llama-DrugDetector-70B 模型,對大多數物質的偵測準確率很高(F1 分數 ≥ 0.95),但像鴉片類藥物和多重物質使用的偵測還有進步空間。整體來說,LLM 有助提升臨床紀錄中物質使用的辨識,但還需要更多研究才能廣泛應用。 相關文章 PubMed DOI 推理

這項研究分析了加州大學聖地牙哥分校三個DIS能力建構計畫的108場諮詢會議,發現多數諮詢聚焦於計畫申請和專案執行,主要在中階能力層級。設計、分析和實務技能是重點,但基礎和進階能力仍待加強。作者建議發展可擴展的諮詢架構、強化追蹤及分級訓練,以提升DIS能力。 相關文章 PubMed DOI 推理

這項研究提出一套結合大型語言模型、內視鏡影像和病患資料的AI系統,能即時輔助醫師判讀、偵測病灶並自動產生報告。透過自我監督和領域自適應學習,系統提升了診斷準確率和一致性,強化醫師與AI的合作,展現多模態AI在內視鏡檢查上的應用潛力。 相關文章 PubMed DOI 推理

最新研究比較四種AI模型在腎臟科問題上的表現,發現GPT-4o最準確且穩定,GPT-4同理心最佳,PaLM 2和Gemini 1.0 Ultra則在部分任務表現突出。結果顯示,生成式AI有助於提升腎臟科病患的溝通與衛教,不同模型可依臨床需求選用。 相關文章 PubMed DOI 推理

田納西大學健康科學中心用ChatGPT設計「健康社會決定因素」課堂活動,九成以上藥學系新生覺得這種AI設計的活動很有幫助,效果跟老師自製的差不多甚至更好。不過,研究也提醒老師,AI有時會出錯,教材還是要先檢查過才行。 相關文章 PubMed DOI 推理