LLM 相關三個月內文章 / 第 40 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇論文提出MLLM-SRec序列式推薦系統,結合多模態大型語言模型,能同時理解商品圖片和文字,並動態掌握用戶偏好。透過多模態對齊和提示技術,MLLM-SRec在多個資料集上推薦效果都比現有方法更好,展現高準確度和穩定性。程式碼和資料可在GitHub下載。 相關文章 PubMed DOI 推理

這篇綜述說明AI如何革新定量系統藥理學(QSP),像是用代理模型、虛擬病人和數位分身來提升藥物預測和精準醫療。文中也點出運算資源、資料整合、模型可解釋性和法規等挑戰,並提出解決策略,幫助藥物開發更有效率。 相關文章 PubMed DOI 推理

目前LLM在肌肉骨骼醫學的研究越來越多,但多數方法類似且缺乏嚴謹。這領域需要統一且公開的評比標準,例如固定提問和明確評分,才能公平比較模型在臨床任務的表現。這不僅提升研究可重現性,也能避免選擇性報告,推動更有意義的進步,像骨科手術登錄系統一樣。 相關文章 PubMed DOI 推理

**重點整理:** ChatGPT-4 在文字型的醫學考題中,答對率達到 77.5%,在需要記憶事實的題目表現最好,但在需要更複雜思考的題目上表現較差。它在影像診斷方面的能力還有待加強,目前還不適合用於需要判讀醫學影像的臨床決策。 相關文章 PubMed DOI 推理

這篇回顧整理了生成式大型語言模型在中風照護的應用現況,發現多數還在初步階段,主要用於決策支援、行政、病患互動等。挑戰包括正確性、穩定性、可解釋性及臨床落地。作者也提出發展可信賴gLLM的建議,強調需更多真實世界證據與安全驗證。 相關文章 PubMed DOI 推理

這篇回顧整理了60篇LLM在腫瘤醫學的應用研究,發現多用GPT模型,主要用於癌症診斷和治療,資料來源多元,常用提示工程。使用者包含醫師、病患和研究人員,領域適應有助提升表現。現有研究常見泛用性不足、樣本太少、偏誤和評估不一致等問題,未來需加強模型泛用性、減少偏誤並標準化評估。 相關文章 PubMed DOI 推理

這篇論文提出uMedGround架構,能自動從醫療報告中找出診斷用語及其在影像中的位置,省去手動標註。它結合多模態大型語言模型和視覺編碼-解碼器,並加入不確定性評估,提升結果可靠性。實驗證明,uMedGround表現優於現有方法,還支援視覺問答和類別定位,協助醫師解讀報告。 相關文章 PubMed DOI 推理

現在用 MTurk、Prolific 這類群眾外包平台做線上研究,雖然有資料品質問題,但靠品質控管還算可靠。不過,隨著像大型語言模型(LLMs)和 OpenAI “Operator” 這類 AI 工具出現,未來資料可能會遇到更難察覺的新風險。這份報告提醒大家要重視這些新挑戰,並呼籲持續討論和研究。 相關文章 PubMed DOI 推理

這項研究發現,目前AI檢測工具(如GPTZero等)雖然能中高準確度分辨神經外科期刊的人類與AI文章,但仍不夠可靠,容易誤判。ChatGPT寫的文章原創性高。研究呼籲需更完善的檢測方法及明確AI使用政策,以避免倫理爭議和誤用。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4和ChatGPT o1在醫療模擬教學回饋相關文章中,產生正確且相關的參考文獻表現不佳,只有約六成正確,且高度相關的僅兩成多。即使調整提示,效果也沒明顯提升,顯示這兩款模型在這方面還不夠可靠。 相關文章 PubMed DOI 推理