LLM 相關三個月內文章 / 第 84 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

大型語言模型(像GPT-4、Gemini、Copilot)能把生殖遺傳學的衛教資料簡化到國中一年級左右的閱讀程度。雖然這些模型都能提升可讀性,但GPT-4在保留正確性和完整性上表現最好。不過,專家審查和病患回饋還是很重要,才能確保資訊正確且實用。研究團隊也開發了免費的PEM簡化和可讀性分析工具,方便臨床使用。 相關文章 PubMed DOI 推理

最新研究發現,通用型大型語言模型(LLMs)在整理電子病歷資料上,比專門醫療LLMs更精準。把這些LLM整理出的資料用在放射治療病人的存活預測模型後,預測準確度和風險分層都明顯提升,也讓模型更好理解,幫助醫師避免對壽命有限的病人做不必要的治療。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT在手外科論文審稿品質上表現比真人審稿者更好,但它的發表決策常和期刊不同。若有嚴格監督,ChatGPT能提升審稿流程,但還是需要人工把關,避免出錯。 相關文章 PubMed DOI 推理

這項研究比較 ChatGPT、Gemini、Copilot 和 Claude 四款大型語言模型在回答上眼瞼整形手術問題的表現。結果顯示,ChatGPT 在醫學正確性和臨床相關性上表現最好,尤其在術後照護方面最突出。不過,所有模型的回答都偏向學術性,對一般民眾來說可能太難懂。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4 在回答口腔病變臨床選擇題時,整體正確率達 87.4%,簡單題最高、困難題最低。雖然表現不錯,但建議只能當作輔助工具,不能單獨用來做診斷,還是要有臨床醫師把關比較安全。 相關文章 PubMed DOI 推理

研究人員用大型語言模型分析電子健康紀錄,開發出一套早期偵測胰臟癌的預測工具。這個模型的準確度(AUROC最高0.89)比傳統方法好,還能找出沒有家族史或基因風險的高危險群。顯示這種AI工具有機會幫助更早發現胰臟癌患者。 相關文章 PubMed DOI 推理

這項研究在新加坡中央醫院測試AI聊天機器人PEACH,發現雖然沒明顯縮短整體紀錄時間,但對中等複雜度病例和資深醫師有省時效果。評估者多半偏好PEACH產生的紀錄,尤其因為有問題清單。經濟分析估算,PEACH每年可為醫院省下約新幣20萬元。這類AI工具有助提升術前照護紀錄品質與效率,並具成本效益。 相關文章 PubMed DOI 推理

這項研究比較七款大型語言模型和專業針灸師在真實針灸案例的診斷與治療建議表現。結果發現,LLMs在西醫診斷上表現和針灸師差不多,在中醫領域則有潛力但表現不一。GPT-4o、Qwen 2.5 Max 和 Doubao 1.5 Pro在中醫診斷和穴位選擇上最接近專家。LLMs有望提升中醫等文化醫療的可近性,幫助縮小全球醫療資源差距。 相關文章 PubMed DOI 推理

這項研究發現,像ChatGPT這類大型語言模型,能夠提供正確且易讀的兒童鈕扣電池傷害預防與處理建議,尤其是ChatGPT-o1-preview表現最佳。結果顯示,LLMs有潛力成為公共衛生建議的輔助工具。 相關文章 PubMed DOI 推理

這篇論文提出一套新方法CPUQ,運用大型語言模型(LLMs)協助政策制定者把公共預算和健康結果做連結。CPUQ能產生可解釋的不確定性估計,準確又安全,效果比現有方法好,和專家評估高度一致,還能發現更細緻的關聯,有助於更完善的公共衛生預算規劃,推動全民健康。 相關文章 PubMed DOI 推理