LLM 相關三個月內文章 / 第 55 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,用AI(ChatGPT)寫的個人陳述,無論在寫作表現、個人特質展現,還是對面試決策的影響,都和真人寫的幾乎分不出來。這讓人開始懷疑個人陳述在住院醫師申請流程中的價值,也顯示未來可能要用更有效的方法來評估申請者的適合度。 相關文章 PubMed DOI 推理

這項研究比較中國DeepSeek-R1、美國ChatGPT-4和Google Gemini 1.5 Pro在醫學選擇題上的表現,三者正確率都超過八成,表現相近。DeepSeek-R1不僅有潛力,價格也較親民,還是開放型,適合當作美國主流AI在醫學教育上的替代選擇。 相關文章 PubMed DOI 推理

這篇論文回顧大型語言模型的發展,重點在新興能力、人類價值一致性、檢索增強生成及特定領域應用,並特別提到 DeepSeek 等最新進展,同時分析現階段挑戰與未來發展方向。 相關文章 PubMed DOI 推理

這是一則針對 DOI: 10.1016/j.csbj.2025.03.038 這篇文章的更正通知。 相關文章 PubMed DOI 推理

研究比較了ChatGPT、Google Gemini和Microsoft Copilot在回答家長常見脊柱側彎問題的表現。四位骨科醫師評分後,ChatGPT表現最好(4.0/5),明顯優於Gemini和Copilot(皆為3.1)。整體來說,這些AI都能提供不錯的資訊,目前以ChatGPT最可靠。 相關文章 PubMed DOI 推理

LEADS 是專為醫學文獻訓練的 AI 模型,能協助系統性回顧的搜尋、篩選和資料擷取,表現比一般大型語言模型更好。臨床醫師和研究人員用 LEADS 不只更準確、召回率高,還能省下很多時間,證明專業 AI 模型能大幅提升循證醫學的效率和品質。 相關文章 PubMed 推理

這篇研究提出用大型語言模型(LLM)從臨床病例報告中擷取有時間標記的資訊來預測臨床事件。結果顯示,編碼器模型在事件預測較好,解碼器模型則適合早期存活預測。特別是把資料按時間順序整理,能大幅提升預測效果,強調時間結構化在臨床應用的重要性。 相關文章 PubMed 推理

作者開發了一套用對話式AI自動打電話做調查的系統,能自己訪談、記錄並分析受訪者回答。實測40次,AI擷取答案的正確率高達98%,即使語音轉錄有小錯也不影響。參與者覺得AI客服講話清楚又有趣。這方法有望讓醫療電話調查更省人力、規模化。 相關文章 PubMed 推理

作者開發了 LEAVS 工具,能用大型語言模型從腹部 CT 報告中自動萃取異常類型、確定性和緊急程度等結構化標籤,涵蓋九個器官七種異常。LEAVS 準確率高(F1 分數 0.89),比現有方法更好,緊急程度標註也接近人工。這些標籤可用來訓練影像模型偵測腹部異常,程式碼和標註資料也已公開。 相關文章 PubMed 推理

作者開發了一套系統,能把病例報告的文字轉成有結構的時間序列資料,方便分析。他們比較人工和大型語言模型(LLM)的標註結果,發現LLM在事件辨識上表現普通,但在標註事件時間點上跟人工很接近。這研究為未來用病例報告做病程時間序列分析打下基礎。 相關文章 PubMed 推理