LLM 相關三個月內文章 / 第 31 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項初步研究比較GPT-4和真人考官對眼科FRCOphth第二部分口試的回饋。AI和考官都會針對同理心、溝通和臨床推理等主題給建議,但AI的回饋較有結構、偏向標準流程,真人考官則提供更實用、貼近經驗的建議。研究認為,AI能成為考試準備的輔助工具,特別適合剛接觸這類考試的考生。 相關文章 PubMed DOI 推理

這項研究比較八款大型語言模型在中醫臨床指引的表現,發現 DeepSeek-v3 和 DeepSeek-r1 在中英文都最優,且模型用中文答題的正確率普遍高於英文。藥物和處方題目比理論題更難,英文回答也較難懂。Moonshot-v1 最常給安全提醒。整體來說,DeepSeek 系列表現最好,未來應加強 LLMs 的中醫知識能力。 相關文章 PubMed DOI 推理

AI和機器學習正大幅改變重建顯微手術,不只提升精準度,也讓流程更標準化,還能預測風險、協助定位和術後監測。AI比傳統判斷更準確、有一致性,也有助醫病溝通。不過,目前還有資料品質和偏誤等問題,未來需靠可解釋AI、跨領域合作和法規完善,AI會成為外科醫師的重要輔助工具。 相關文章 PubMed DOI 推理

這項研究用AI分析超過1,100則肝斑患者的社群貼文,發現大家最在意的是治療效果、長期維持、費用負擔,以及日常保養和心理健康。成因、症狀和診斷討論較少。結果顯示,肝斑照護需要加強數位病患教育、自我管理和心理支持。未來建議運用AI工具提升病患參與和自我照護能力。 相關文章 PubMed DOI 推理

CardioCanon 結合檢索增強技術(RAG),在日本心臟科專科醫師考題測試中,單題表現跟一般大型語言模型差不多,但在整個病例分析上明顯更優秀。這代表 RAG 技術能有效提升 AI 在醫學考試的推理和決策能力。 相關文章 PubMed DOI 推理

SpeLL 是一套 AI 系統,能自動化近紅外光譜(NIR)數據建模,結合大型語言模型和 RAG 技術。它有兩條 RAG 路徑,分別用來優化分析腳本和選擇合適演算法。SpeLL 支援自然語言互動、自動產生程式碼和自我除錯,大幅簡化光譜數據分析流程。 相關文章 PubMed DOI 推理

研究發現,ChatGPT-4和牙醫老師出的口腔診斷與放射學選擇題,在難易度和區分學生能力上沒明顯差異。不過,ChatGPT原本出的題目有近一半因選項設計不良或內容錯誤被淘汰。結論是,ChatGPT經專家審查後,確實能協助產生高品質考題,但還是需要專業老師把關,確保正確性與清楚度。 相關文章 PubMed DOI 推理

**重點整理:** 這項研究提出了一種新的機器學習分類器,結合大型語言模型和結構數據,來預測SARS-CoV-2抗體的結合能力和中和能力。這個方法在預測相似病毒變異株時,準確率特別高,表現也優於現有的方法,是首次利用這類技術來預測SARS-CoV-2抗體中和效果的嘗試。 相關文章 PubMed DOI 推理

這項研究用大型語言模型結合RAG技術,能自動從醫病對話中抓出健康問題,並對應到Omaha System標準術語。分析22次居家護理訪視、共5,118句對話,最佳模型(GPT-4o-mini)在辨識健康問題和症狀上,F1-score高達0.90。這方法可減輕人工紀錄負擔、提升準確度,讓居家護理更有效率、品質更好,進一步提升照護成效。 相關文章 PubMed DOI 推理

這項研究發現,Llama 3 在長照個案紀錄摘要上沒有性別偏見,但 Gemma 會對男性需求描述得更直接、詳細,女性則較被淡化,可能造成照護不平等。研究也提供了檢測 LLM 性別偏見的方法,提醒在敏感領域應先評估模型公平性。程式碼已公開在 GitHub。 相關文章 PubMed DOI 推理